Spaces:

orgoflu
/

moro_test_llm

Sleeping

App Files Files Community

orgoflu commited on Sep 13

Commit

e904b23

verified ·

1 Parent(s): 68b1f62

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -23

app.py CHANGED Viewed

@@ -1,13 +1,16 @@
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM, TextGenerationPipeline
 import torch
-from functools import lru_cache
 MODEL_NAME = "openbmb/MiniCPM-V-4"
 @lru_cache(maxsize=1)
 def load_pipeline():
-    tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, trust_remote_code=True)
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_NAME,
         torch_dtype=torch.float16,
@@ -20,32 +23,47 @@ def load_pipeline():
         device=model.device.index if torch.cuda.is_available() else -1
     )
-def generate(prompt: str, max_length: int, top_k: int, top_p: float):
-    pipe = load_pipeline()
-    output = pipe(
         prompt,
-        max_length=max_length,
         do_sample=True,
-        top_k=top_k,
-        top_p=top_p,
         num_return_sequences=1
-    )
-    return output[0]["generated_text"]
 with gr.Blocks() as demo:
-    gr.Markdown("# MiniCPM-V-4 Text Generation Demo")
-    prompt_input = gr.Textbox(label="Prompt", lines=2, placeholder="여기에 입력하세요...")
-    max_len = gr.Slider(10, 512, value=100, step=10, label="Max Length")
-    topk = gr.Slider(1, 100, value=50, step=1, label="Top-k")
-    topp = gr.Slider(0.1, 1.0, value=0.95, step=0.05, label="Top-p")
-    generate_btn = gr.Button("Generate")
-    output_box = gr.Textbox(label="Generated Text", lines=5)
-    generate_btn.click(
-        fn=generate,
-        inputs=[prompt_input, max_len, topk, topp],
-        outputs=output_box
     )
 demo.launch()

+import os
 import gradio as gr
+from functools import lru_cache
 from transformers import AutoTokenizer, AutoModelForCausalLM, TextGenerationPipeline
 import torch
 MODEL_NAME = "openbmb/MiniCPM-V-4"
 @lru_cache(maxsize=1)
 def load_pipeline():
+    tokenizer = AutoTokenizer.from_pretrained(
+        MODEL_NAME, trust_remote_code=True
+    )
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_NAME,
         torch_dtype=torch.float16,
         device=model.device.index if torch.cuda.is_available() else -1
     )
+def respond(user_message, chat_history):
+    # 이전 대화와 새 메시지를 하나의 prompt로 합침
+    history_text = ""
+    for u, a in chat_history:
+        history_text += f"用户：{u}\n助理：{a}\n"
+    prompt = history_text + f"用户：{user_message}\n助理："
+    pipeline = load_pipeline()
+    output = pipeline(
         prompt,
+        max_length=history_text.count("\n") + len(user_message.split()) + 50,
         do_sample=True,
+        top_k=50,
+        top_p=0.95,
         num_return_sequences=1
+    )[0]["generated_text"]
+    # 모델이 반환한 전체 텍스트에서 어시스턴트 응답 부분만 추출
+    assistant_reply = output.split("助理：", 1)[-1].strip()
+    chat_history.append((user_message, assistant_reply))
+    return chat_history
 with gr.Blocks() as demo:
+    gr.Markdown("## MiniCPM-V-4 Chatbot Demo")
+    chatbot = gr.Chatbot(label="대화")
+    user_input = gr.Textbox(
+        placeholder="메시지를 입력하세요...",
+        lines=1
+    )
+    clear_btn = gr.Button("초기화")
+    user_input.submit(
+        fn=respond,
+        inputs=[user_input, chatbot],
+        outputs=chatbot
+    )
+    clear_btn.click(
+        lambda: [],
+        None,
+        chatbot
     )
 demo.launch()