Spaces:

fastrtc
/

talk-to-claude

Running on CPU Upgrade

App Files Files Community

freddyaboulton HF Staff commited on Feb 25

Commit

87af32a

verified ·

1 Parent(s): aacc262

Upload folder using huggingface_hub

Browse files

Files changed (1) hide show

app.py +29 -35

app.py CHANGED Viewed

@@ -14,7 +14,6 @@ from fastrtc import (
     AdditionalOutputs,
     ReplyOnPause,
     Stream,
-    WebRTCError,
     get_tts_model,
     get_twilio_turn_credentials,
 )
@@ -38,41 +37,36 @@ def response(
     audio: tuple[int, np.ndarray],
     chatbot: list[dict] | None = None,
 ):
-    try:
-        chatbot = chatbot or []
-        messages = [{"role": d["role"], "content": d["content"]} for d in chatbot]
-        prompt = groq_client.audio.transcriptions.create(
-            file=("audio-file.mp3", audio_to_bytes(audio)),
-            model="whisper-large-v3-turbo",
-            response_format="verbose_json",
-        ).text
-        print("prompt", prompt)
-        chatbot.append({"role": "user", "content": prompt})
         yield AdditionalOutputs(chatbot)
-        messages.append({"role": "user", "content": prompt})
-        response = claude_client.messages.create(
-            model="claude-3-5-haiku-20241022",
-            max_tokens=512,
-            messages=messages,  # type: ignore
-        )
-        response_text = " ".join(
-            block.text  # type: ignore
-            for block in response.content
-            if getattr(block, "type", None) == "text"
-        )
-        chatbot.append({"role": "assistant", "content": response_text})
-        start = time.time()
-        print("starting tts", start)
-        for i, chunk in enumerate(tts_model.stream_tts_sync(response_text)):
-            print("chunk", i, time.time() - start)
-            yield chunk
-            print("finished tts", time.time() - start)
-            yield AdditionalOutputs(chatbot)
-    except Exception as e:
-        raise WebRTCError(str(e))
 chatbot = gr.Chatbot(type="messages")

     AdditionalOutputs,
     ReplyOnPause,
     Stream,
     get_tts_model,
     get_twilio_turn_credentials,
 )
     audio: tuple[int, np.ndarray],
     chatbot: list[dict] | None = None,
 ):
+    chatbot = chatbot or []
+    messages = [{"role": d["role"], "content": d["content"]} for d in chatbot]
+    prompt = groq_client.audio.transcriptions.create(
+        file=("audio-file.mp3", audio_to_bytes(audio)),
+        model="whisper-large-v3-turbo",
+        response_format="verbose_json",
+    ).text
+    chatbot.append({"role": "user", "content": prompt})
+    yield AdditionalOutputs(chatbot)
+    messages.append({"role": "user", "content": prompt})
+    response = claude_client.messages.create(
+        model="claude-3-5-haiku-20241022",
+        max_tokens=512,
+        messages=messages,  # type: ignore
+    )
+    response_text = " ".join(
+        block.text  # type: ignore
+        for block in response.content
+        if getattr(block, "type", None) == "text"
+    )
+    chatbot.append({"role": "assistant", "content": response_text})
+    start = time.time()
+    print("starting tts", start)
+    for i, chunk in enumerate(tts_model.stream_tts_sync(response_text)):
+        print("chunk", i, time.time() - start)
+        yield chunk
+        print("finished tts", time.time() - start)
         yield AdditionalOutputs(chatbot)
 chatbot = gr.Chatbot(type="messages")