Spaces:

Rogerjs
/

Voicecloner

Runtime error

App Files Files Community

Rogerjs commited on Dec 5, 2024

Commit

4479222

verified ·

1 Parent(s): 27e6d88

Update app.py

Browse files

Files changed (1) hide show

app.py +111 -1

app.py CHANGED Viewed

@@ -223,4 +223,114 @@ class VoiceSynthesizer:
         return filepath, None
-# Rest of the code remains the same...

         return filepath, None
+def create_interface():
+    synthesizer = VoiceSynthesizer()
+    with gr.Blocks() as interface:
+        gr.Markdown("# 🎙️ Advanced Voice Synthesis")
+        with gr.Row():
+            with gr.Column():
+                gr.Markdown("## 1. Capture Reference Voice")
+                reference_audio = gr.Audio(sources=["microphone", "upload"], type="numpy")
+                process_ref_btn = gr.Button("Process Reference Voice")
+                process_ref_output = gr.Textbox(label="Reference Voice Processing")
+            with gr.Column():
+                gr.Markdown("## 2. Generate Speech")
+                text_input = gr.Textbox(label="Enter Text to Speak")
+                # Model Selection
+                model_dropdown = gr.Dropdown(
+                    choices=[
+                        "bark (Suno AI)",
+                        "speecht5 (Microsoft)"
+                    ],
+                    label="Select TTS Model",
+                    value="bark (Suno AI)"
+                )
+                # Voice Preset Dropdowns
+                with gr.Row():
+                    bark_preset = gr.Dropdown(
+                        choices=[
+                            "v2/en_speaker_6 (Female)",
+                            "v2/en_speaker_3 (Male)",
+                            "v2/en_speaker_9 (Neutral)"
+                        ],
+                        label="Bark Voice Preset",
+                        visible=True
+                    )
+                    speecht5_preset = gr.Dropdown(
+                        choices=[
+                            "Default Speaker"
+                        ],
+                        label="SpeechT5 Speaker",
+                        visible=False
+                    )
+                generate_btn = gr.Button("Generate Speech")
+                audio_output = gr.Audio(label="Generated Speech")
+                error_output = gr.Textbox(label="Errors", visible=True)
+        # Process reference audio
+        process_ref_btn.click(
+            fn=synthesizer.process_reference_audio,
+            inputs=reference_audio,
+            outputs=process_ref_output
+        )
+        # Dynamic model and preset visibility
+        def update_model_visibility(model):
+            if "bark" in model.lower():
+                return {
+                    bark_preset: gr.update(visible=True),
+                    speecht5_preset: gr.update(visible=False)
+                }
+            else:
+                return {
+                    bark_preset: gr.update(visible=False),
+                    speecht5_preset: gr.update(visible=True)
+                }
+        model_dropdown.change(
+            fn=update_model_visibility,
+            inputs=model_dropdown,
+            outputs=[bark_preset, speecht5_preset]
+        )
+        # Speech generation logic
+        def generate_speech_wrapper(text, model, bark_preset, speecht5_preset):
+            # Map model name
+            model_map = {
+                "bark (Suno AI)": "bark",
+                "speecht5 (Microsoft)": "speecht5"
+            }
+            # Select appropriate preset
+            preset = bark_preset if "bark" in model else speecht5_preset
+            return synthesizer.generate_speech(
+                text,
+                model_name=model_map[model],
+                voice_preset=preset
+            )
+        generate_btn.click(
+            fn=generate_speech_wrapper,
+            inputs=[text_input, model_dropdown, bark_preset, speecht5_preset],
+            outputs=[audio_output, error_output]
+        )
+    return interface
+if __name__ == "__main__":
+    interface = create_interface()
+    interface.launch(
+        share=False,
+        debug=True,
+        show_error=True,
+        server_name='0.0.0.0',
+        server_port=7860
+    )