Spaces:

chatbotMOAI
/

MOAI

Sleeping

wenbemi commited on Aug 21

Commit

a225344

verified ·

1 Parent(s): 552e483

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,10 +1,9 @@
 # streamlit 라이브러리가 import 되기 전에,
 # 설정 파일 경로를 앱 내부의 쓰기 가능한 경로로 강제 지정합니다.
-import os, pathlib
 from huggingface_hub import hf_hub_download
 import pandas as pd
 import json
-import os
 import random
 APP_DIR = pathlib.Path(__file__).parent.resolve()
@@ -35,17 +34,21 @@ def _read_csv_bytes(b: bytes) -> pd.DataFrame:
     except UnicodeDecodeError:
         return pd.read_csv(io.BytesIO(b), encoding="cp949")
-def load_csv_smart(local_path: str, hub_filename: str,
-                   repo_id: str = HF_DATASET_REPO, repo_type: str = "dataset",
-                   revision: str = HF_DATASET_REV) -> pd.DataFrame:
-    # 1) 로컬 우선
     if os.path.exists(local_path):
         with open(local_path, "rb") as f:
             data = f.read()
         if not _is_pointer_bytes(data):
-            return _read_csv_bytes(data)
-        # 포인터면 허브로 폴백
-    # 2) 허브 다운로드
     cached = hf_hub_download(repo_id=repo_id, filename=hub_filename,
                              repo_type=repo_type, revision=revision)
     try:

 # streamlit 라이브러리가 import 되기 전에,
 # 설정 파일 경로를 앱 내부의 쓰기 가능한 경로로 강제 지정합니다.
+import os, pathlib, io
 from huggingface_hub import hf_hub_download
 import pandas as pd
 import json
 import random
 APP_DIR = pathlib.Path(__file__).parent.resolve()
     except UnicodeDecodeError:
         return pd.read_csv(io.BytesIO(b), encoding="cp949")
+def load_csv_smart(local_path: str,
+                   hub_filename: str | None = None,
+                   repo_id: str = HF_DATASET_REPO,
+                   repo_type: str = "dataset",
+                   revision: str = HF_DATASET_REV):
+    if hub_filename is None:
+        hub_filename = os.path.basename(local_path)
     if os.path.exists(local_path):
         with open(local_path, "rb") as f:
             data = f.read()
         if not _is_pointer_bytes(data):
+            try:
+                return pd.read_csv(io.BytesIO(data), encoding="utf-8")
+            except UnicodeDecodeError:
+                return pd.read_csv(io.BytesIO(data), encoding="cp949")
     cached = hf_hub_download(repo_id=repo_id, filename=hub_filename,
                              repo_type=repo_type, revision=revision)
     try: