Spaces:

gaeunseo
/

Interface_1

Build error

App Files Files Community

gaeunseo commited on Feb 10

Commit

09af6b3

verified ·

1 Parent(s): 4c05efc

Update app.py

Browse files

Files changed (1) hide show

app.py +76 -74

app.py CHANGED Viewed

@@ -1,84 +1,83 @@
 import time
 import gradio as gr
 import random
-import json
 import os
 import threading
 from datasets import load_dataset
-# --- 파일 기반 데이터 관리 설정 ---
-DATA_FILE = "global_data.json"
 data_lock = threading.Lock()
 def initialize_global_data():
     """
-    DATA_FILE이 없으면 Dataset을 불러와서 저장하고, 있으면 파일의 데이터를 반환합니다.
     """
     if not os.path.exists(DATA_FILE):
         ds = load_dataset("gaeunseo/Taskmaster_sample_data", split="train")
-        data = list(ds)
-        with data_lock:
-            with open(DATA_FILE, "w", encoding="utf-8") as f:
-                json.dump(data, f, ensure_ascii=False, indent=2)
         return data
     else:
         with data_lock:
-            with open(DATA_FILE, "r", encoding="utf-8") as f:
-                data = json.load(f)
-        return data
 def load_global_data():
-    """파일에서 global_data를 읽어옵니다."""
     with data_lock:
-        with open(DATA_FILE, "r", encoding="utf-8") as f:
-            data = json.load(f)
-    return data
-def save_global_data(data):
-    """데이터를 파일에 저장합니다."""
     with data_lock:
-        with open(DATA_FILE, "w", encoding="utf-8") as f:
-            json.dump(data, f, ensure_ascii=False, indent=2)
-# 초기 global_data 파일 생성 또는 로드
 global_data = initialize_global_data()
 def get_random_row_from_dataset():
     """
-    DATA_FILE에 저장된 global_data에서,
-      - conversation_id별로 그룹화하고,
-      - 각 그룹의 모든 행의 used가 False이며,
-      - 그룹 내에 overlapping 컬럼이 "TT"인 행이 있는 그룹만 valid로 간주합니다.
     valid한 그룹들 중 랜덤하게 하나의 그룹을 선택한 후,
-      - 해당 그룹의 모든 행의 used 값을 True로 업데이트(즉, 전체 그룹을 할당)하고 파일에 저장한 뒤,
-      - 선택된 그룹 내에서 overlapping 컬럼이 "TT"인 행을 반환합니다.
-    이 방식으로 여러 사용자가 동시에 호출하더라도 잠금을 통해 atomic하게 업데이트하므로,
-    서로 다른 사용자에게 서로 다른 conversation_id 그룹이 할당됩니다.
     """
-    with data_lock:
-        data = load_global_data()
-        conversation_groups = {}
-        for row in data:
-            cid = row["conversation_id"]
-            conversation_groups.setdefault(cid, []).append(row)
-        valid_groups = [
-            group for group in conversation_groups.values()
-            if all(not r["used"] for r in group) and any(r["overlapping"] == "TT" for r in group)
-        ]
-        if not valid_groups:
-            return None
-        chosen_group = random.choice(valid_groups)
-        # 그룹 내의 모든 행의 used를 True로 업데이트하여 전체 그룹이 할당되도록 함
-        for row in chosen_group:
-            row["used"] = True
-        save_global_data(data)
-        # 선택된 그룹 내에서 overlapping 컬럼이 "TT"인 행을 반환 (여러 개라면 첫 번째)
-        for row in chosen_group:
-            if row["overlapping"] == "TT":
-                return row
-# --- 초기 대화 설정 ---
-# Dataset의 text 컬럼은 "[turn]"을 기준으로 대화가 구분되어 있다고 가정합니다.
 row = get_random_row_from_dataset()
 if row is None:
     human_message = "No valid conversation available."
@@ -88,10 +87,13 @@ else:
     human_message = raw_text.split("[turn]")[0].strip()
     ai_message = raw_text.split("[turn]")[1].strip()
-# --- 채팅 인터페이스 관련 함수 ---
 def get_initial_human_html():
     """
-    페이지 로드 시, 빈 Human 말풍선과 오른쪽 🧑 이모티콘이 보이도록 초기 HTML 반환
     """
     wrapper_start = (
         """<div class="human-wrapper" style="display: flex; align-items: flex-end; justify-content: flex-end; gap: 5px; width: 100%;">"""
@@ -104,7 +106,7 @@ def get_initial_human_html():
 def stream_human_message():
     """
-    Start Typing 버튼 클릭 시, 전역 변수 human_message의 내용을 한 글자씩 타이핑 효과로 출력.
     이전 상태(✂️ 아이콘, 회색 처리 등)는 리셋됩니다.
     """
     bubble_content = ""
@@ -116,26 +118,25 @@ def stream_human_message():
     emoji_html = "<div class='emoji'>🧑</div>"
     wrapper_end = "</div>"
-    # 초기 상태 (빈 말풍선과 이모티콘)
     yield wrapper_start + bubble_start + bubble_end + emoji_html + wrapper_end
     # human_message를 한 글자씩 추가 (타이핑 효과)
     for i, ch in enumerate(human_message):
-        bubble_content += f"<span data-index='{i}'>{ch}</span>"
-        current_html = wrapper_start + bubble_start + bubble_content + bubble_end + emoji_html + wrapper_end
-        yield current_html
-        time.sleep(0.05)
 def submit_edit(edited_text):
     """
     Submit 버튼 클릭 시 호출되는 함수.
     1. 편집된 human 메시지(✂️ 앞부분)를 새 행으로 global_data에 추가합니다.
-    2. get_random_row_from_dataset()을 통해 새로운 대화를 가져오고,
-       전역 변수 human_message와 ai_message를 업데이트합니다.
-    3. 초기 상태의 human 말풍선와 ai 말풍선 HTML을 반환하여 인터페이스를 리셋합니다.
     """
     global human_message, ai_message
-    # 새 행 생성 (새 conversation_id는 임의 생성)
     new_row = {
          "conversation_id": "edited_" + str(random.randint(1000, 9999)),
          "used": False,
@@ -144,9 +145,8 @@ def submit_edit(edited_text):
          "human_message": edited_text,
          "ai_message": ""
     }
-    # 파일에서 global_data 불러와서 새 행 추가 및 저장
-    data = load_global_data()
-    data.append(new_row)
     save_global_data(data)
     new_row_data = get_random_row_from_dataset()
@@ -167,7 +167,10 @@ def submit_edit(edited_text):
     """
     return new_human_html, new_ai_html
-# --- Gradio 인터페이스 구성 ---
 with gr.Blocks() as demo:
     # (A) 페이지 상단 스크립트: Human 말풍선 내의 각 <span data-index="...">를 클릭하면,
     #     해당 위치에 ✂️ 아이콘이 삽입되고, 그 이후 텍스트가 회색으로 변경됩니다.
@@ -199,8 +202,7 @@ with gr.Blocks() as demo:
         """
     )
-    # (B) 추가 스크립트: Submit 버튼 클릭 시, human_message div의 innerText에서 "✂️"를 기준으로
-    #     편집된 텍스트(앞부분)를 숨김 텍스트박스에 업데이트합니다.
     gr.HTML(
         """
         <script>
@@ -276,9 +278,9 @@ with gr.Blocks() as demo:
     gr.Markdown("## Chat Interface")
     with gr.Column(elem_classes="chat-container"):
-        # Human 말풍선 (초기: 빈 메시지와 🧑 이모티콘)
         human_bubble = gr.HTML(get_initial_human_html())
-        # AI 말풍선 (왼쪽: 🤖 이모티콘과 함께 메시지)
         ai_html = f"""
         <div class="ai-wrapper" style="display: flex; align-items: flex-end; justify-content: flex-start; gap: 5px; width: 100%;">
           <div class="emoji">🤖</div>
@@ -287,10 +289,10 @@ with gr.Blocks() as demo:
         """
         ai_bubble = gr.HTML(ai_html)
-    # 숨김 텍스트박스: 편집된 텍스트(✂️ 앞부분)를 저장 (visible=False)
     edited_text_input = gr.Textbox(visible=False, elem_id="edited_text_input")
-    # 버튼 영역: Start Typing과 Submit 버튼을 같은 행에 배치 (Download 버튼 제거)
     with gr.Row():
         start_button = gr.Button("Start Typing")
         submit_button = gr.Button("Submit", elem_id="submit_btn")
@@ -299,4 +301,4 @@ with gr.Blocks() as demo:
     start_button.click(fn=stream_human_message, outputs=human_bubble)
     submit_button.click(fn=submit_edit, inputs=edited_text_input, outputs=[human_bubble, ai_bubble])
-demo.launch()

 import time
 import gradio as gr
 import random
 import os
 import threading
+import pandas as pd
 from datasets import load_dataset
+# CSV 파일 경로와 동시 접근을 위한 Lock 선언
+DATA_FILE = "global_data.csv"
 data_lock = threading.Lock()
 def initialize_global_data():
     """
+    DATA_FILE이 존재하지 않으면, gaeunseo/Taskmaster_sample_data 데이터셋을 로드하여 DataFrame으로 변환한 후 CSV 파일로 저장합니다.
+    이미 파일이 있으면 파일에서 데이터를 읽어 DataFrame을 반환합니다.
     """
     if not os.path.exists(DATA_FILE):
         ds = load_dataset("gaeunseo/Taskmaster_sample_data", split="train")
+        data = ds.to_pandas()
+        # 필요한 컬럼이 없으면 추가합니다.
+        if "used" not in data.columns:
+            data["used"] = False
+        if "overlapping" not in data.columns:
+            data["overlapping"] = ""
+        if "text" not in data.columns:
+            data["text"] = ""
+        data.to_csv(DATA_FILE, index=False)
         return data
     else:
         with data_lock:
+            df = pd.read_csv(DATA_FILE)
+        return df
 def load_global_data():
+    """CSV 파일에서 global_data DataFrame을 읽어옵니다."""
     with data_lock:
+        df = pd.read_csv(DATA_FILE)
+    return df
+def save_global_data(df):
+    """DataFrame을 CSV 파일에 저장합니다."""
     with data_lock:
+        df.to_csv(DATA_FILE, index=False)
+# CSV 파일에 저장된 global_data 초기화
 global_data = initialize_global_data()
 def get_random_row_from_dataset():
     """
+    CSV 파일에 저장된 global_data에서,
+      1. conversation_id별로 그룹화하고,
+      2. 각 그룹에서 모든 행의 used 컬럼이 False이며, 그룹 내에 overlapping 컬럼이 "TT"인 행이 존재하는 그룹만 valid로 간주합니다.
     valid한 그룹들 중 랜덤하게 하나의 그룹을 선택한 후,
+      - 해당 그룹의 모든 행의 used 값을 True로 업데이트(즉, 전체 그룹을 할당)하고 CSV 파일에 저장합니다.
+      - 선택된 그룹 내에서 overlapping 컬럼이 "TT"인 행(여러 개라면 첫 번째)을 반환합니다.
     """
+    global global_data
+    global_data = load_global_data()  # 최신 데이터 로드
+    groups = global_data.groupby('conversation_id')
+    valid_groups = []
+    for cid, group in groups:
+        # 모든 행의 used 값이 False이고, 그룹 내에 overlapping 값이 "TT"인 행이 ��는 그룹 필터링
+        if group['used'].apply(lambda x: bool(x) == False).all() and (group['overlapping'] == "TT").any():
+            valid_groups.append((cid, group))
+    if not valid_groups:
+        return None
+    chosen_cid, chosen_group = random.choice(valid_groups)
+    # 전체 그룹의 used 값을 True로 업데이트
+    global_data.loc[global_data['conversation_id'] == chosen_cid, 'used'] = True
+    save_global_data(global_data)
+    # 선택된 그룹 내에서 overlapping 컬럼이 "TT"인 행을 반환 (여러 개라면 첫 번째)
+    chosen_rows = chosen_group[chosen_group['overlapping'] == "TT"]
+    if chosen_rows.empty:
+        return None
+    chosen_row = chosen_rows.iloc[0]
+    return chosen_row.to_dict()
+# --- 초기 대화 불러오기 ---
+# 데이터셋의 text 컬럼은 "[turn]"을 기준으로 대화가 구분되어 있다고 가정합니다.
 row = get_random_row_from_dataset()
 if row is None:
     human_message = "No valid conversation available."
     human_message = raw_text.split("[turn]")[0].strip()
     ai_message = raw_text.split("[turn]")[1].strip()
+#############################################
+# 채팅 인터페이스 관련 함수 (말풍선, 타이핑 효과, 편집 기능)
+#############################################
 def get_initial_human_html():
     """
+    페이지 로드 시, 빈 Human 말풍선과 오른쪽 🧑 이모티콘을 포함한 초기 HTML 반환
     """
     wrapper_start = (
         """<div class="human-wrapper" style="display: flex; align-items: flex-end; justify-content: flex-end; gap: 5px; width: 100%;">"""
 def stream_human_message():
     """
+    Start Typing 버튼 클릭 시, 전역 변수 human_message의 내용을 한 글자씩 타이핑 효과로 출력합니다.
     이전 상태(✂️ 아이콘, 회색 처리 등)는 리셋됩니다.
     """
     bubble_content = ""
     emoji_html = "<div class='emoji'>🧑</div>"
     wrapper_end = "</div>"
+    # 초기 상태: 빈 말풍선과 이모티콘
     yield wrapper_start + bubble_start + bubble_end + emoji_html + wrapper_end
     # human_message를 한 글자씩 추가 (타이핑 효과)
     for i, ch in enumerate(human_message):
+         bubble_content += f"<span data-index='{i}'>{ch}</span>"
+         current_html = wrapper_start + bubble_start + bubble_content + bubble_end + emoji_html + wrapper_end
+         yield current_html
+         time.sleep(0.05)
 def submit_edit(edited_text):
     """
     Submit 버튼 클릭 시 호출되는 함수.
     1. 편집된 human 메시지(✂️ 앞부분)를 새 행으로 global_data에 추가합니다.
+    2. get_random_row_from_dataset()을 통해 새로운 대화를 가져오고, 전역 변수 human_message와 ai_message를 업데이트합니다.
+    3. 초기 상태의 human 말풍선과 ai 말풍선 HTML을 반환하여 인터페이스를 리셋합니다.
     """
     global human_message, ai_message
+    data = load_global_data()
     new_row = {
          "conversation_id": "edited_" + str(random.randint(1000, 9999)),
          "used": False,
          "human_message": edited_text,
          "ai_message": ""
     }
+    new_df = pd.DataFrame([new_row])
+    data = pd.concat([data, new_df], ignore_index=True)
     save_global_data(data)
     new_row_data = get_random_row_from_dataset()
     """
     return new_human_html, new_ai_html
+#############################################
+# Gradio 인터페이스 구성
+#############################################
 with gr.Blocks() as demo:
     # (A) 페이지 상단 스크립트: Human 말풍선 내의 각 <span data-index="...">를 클릭하면,
     #     해당 위치에 ✂️ 아이콘이 삽입되고, 그 이후 텍스트가 회색으로 변경됩니다.
         """
     )
+    # (B) 추가 스크립트: Submit 버튼 클릭 시, human_message div의 innerText에서 "✂️"를 기준으로 편집된 텍스트(앞부분)를 숨김 텍스트박스에 업데이트
     gr.HTML(
         """
         <script>
     gr.Markdown("## Chat Interface")
     with gr.Column(elem_classes="chat-container"):
+        # Human 말풍선 (초기: 빈 메시지 + 🧑 이모티콘)
         human_bubble = gr.HTML(get_initial_human_html())
+        # AI 말풍선 (왼쪽: 🤖 이모티콘 + 메시지)
         ai_html = f"""
         <div class="ai-wrapper" style="display: flex; align-items: flex-end; justify-content: flex-start; gap: 5px; width: 100%;">
           <div class="emoji">🤖</div>
         """
         ai_bubble = gr.HTML(ai_html)
+    # 숨김 텍스트박스 (편집된 텍스트 저장용)
     edited_text_input = gr.Textbox(visible=False, elem_id="edited_text_input")
+    # 버튼 영역: Start Typing과 Submit 버튼을 같은 행에 배치
     with gr.Row():
         start_button = gr.Button("Start Typing")
         submit_button = gr.Button("Submit", elem_id="submit_btn")
     start_button.click(fn=stream_human_message, outputs=human_bubble)
     submit_button.click(fn=submit_edit, inputs=edited_text_input, outputs=[human_bubble, ai_bubble])
+demo.launch()