Spaces:

ayousanz
/

piper-plus-demo

Running

App Files Files Community

ayousanz commited on Aug 21

Commit

3275e74

verified ·

1 Parent(s): c25402c

Update from GitHub Actions - 2025-08-21 08:28:42

Browse files

Files changed (3) hide show

README.md +5 -2
app.py +79 -27
requirements.txt +2 -1

README.md CHANGED Viewed

@@ -4,7 +4,7 @@ emoji: 🎙️
 colorFrom: blue
 colorTo: purple
 sdk: gradio
-sdk_version: 4.44.1
 app_file: app.py
 pinned: false
 license: mit
@@ -64,4 +64,7 @@ python app.py
 ## License
-This project is licensed under the MIT License. See the original [Piper repository](https://github.com/rhasspy/piper) for more details.

 colorFrom: blue
 colorTo: purple
 sdk: gradio
+sdk_version: 3.50.2
 app_file: app.py
 pinned: false
 license: mit
 ## License
+This project is licensed under the MIT License. See the original [Piper repository](https://github.com/rhasspy/piper) for more details.
+---
+_Last updated: 2025-01-21 - Cache rebuild for Gradio 3.50.2_

app.py CHANGED Viewed

@@ -185,47 +185,45 @@ def synthesize_speech(
 def create_interface():
     """Create Gradio interface"""
-    with gr.Blocks(title="Piper TTS Demo") as interface:
-        gr.Markdown("""
-        # 🎙️ Piper TTS Demo
-        High-quality text-to-speech synthesis supporting Japanese and English.
-        This demo uses ONNX models for fast CPU inference.
-        """)
-        with gr.Row():
-            with gr.Column(scale=2):
-                model_dropdown = gr.Dropdown(
-                    choices=list(MODELS.keys()),
-                    label="Select Model",
-                    value=list(MODELS.keys())[0],
-                )
-                text_input = gr.Textbox(
-                    label="Text to synthesize",
-                    placeholder="Enter text here...",
-                    lines=3,
-                )
-                with gr.Accordion("Advanced Settings", open=False):
                     speaker_id = gr.Number(
-                        label="Speaker ID",
                         value=0,
                         precision=0,
-                        minimum=0,
-                        maximum=10,
-                        info="For multi-speaker models only",
                     )
                     length_scale = gr.Slider(
-                        label="Speed",
                         minimum=0.5,
                         maximum=2.0,
                         value=1.0,
                         step=0.1,
-                        info="Lower = faster speech",
                     )
                     noise_scale = gr.Slider(
@@ -292,6 +290,43 @@ def create_interface():
             outputs=audio_output,
         )
     return interface
@@ -299,4 +334,21 @@ def create_interface():
 interface = create_interface()
 if __name__ == "__main__":
-    interface.launch(server_name="0.0.0.0", server_port=7860)

 def create_interface():
     """Create Gradio interface"""
+    try:
+        with gr.Blocks(title="Piper TTS Demo") as interface:
+            gr.Markdown("""
+            # 🎙️ Piper TTS Demo
+            High-quality text-to-speech synthesis supporting Japanese and English.
+            This demo uses ONNX models for fast CPU inference.
+            """)
+            with gr.Row():
+                with gr.Column(scale=2):
+                    model_dropdown = gr.Dropdown(
+                        choices=list(MODELS.keys()),
+                        label="Select Model",
+                        value=list(MODELS.keys())[0],
+                    )
+                    text_input = gr.Textbox(
+                        label="Text to synthesize",
+                        placeholder="Enter text here...",
+                        lines=3,
+                    )
+                    # Advanced Settings without Accordion (flattened)
+                    gr.Markdown("### Advanced Settings")
                     speaker_id = gr.Number(
+                        label="Speaker ID (for multi-speaker models)",
                         value=0,
                         precision=0,
                     )
                     length_scale = gr.Slider(
+                        label="Speed (Lower = faster speech)",
                         minimum=0.5,
                         maximum=2.0,
                         value=1.0,
                         step=0.1,
                     )
                     noise_scale = gr.Slider(
             outputs=audio_output,
         )
+        return interface
+    except Exception as e:
+        logger.error(f"Failed to create main interface: {e}")
+        # Fallback to minimal interface
+        return create_minimal_interface()
+def create_minimal_interface():
+    """Create a minimal fallback interface if main interface fails"""
+    with gr.Blocks(title="Piper TTS Demo - Minimal") as interface:
+        gr.Markdown("# Piper TTS Demo (Minimal Mode)")
+        text_input = gr.Textbox(
+            label="Text to synthesize",
+            placeholder="Enter text here...",
+            lines=3,
+        )
+        model_dropdown = gr.Dropdown(
+            choices=list(MODELS.keys()),
+            label="Select Model",
+            value=list(MODELS.keys())[0],
+        )
+        synthesize_btn = gr.Button("Generate Speech", variant="primary")
+        audio_output = gr.Audio(
+            label="Generated Speech",
+            type="numpy",
+        )
+        synthesize_btn.click(
+            fn=lambda text, model: synthesize_speech(text, model, 0, 1.0, 0.667, 0.8),
+            inputs=[text_input, model_dropdown],
+            outputs=audio_output,
+        )
     return interface
 interface = create_interface()
 if __name__ == "__main__":
+    try:
+        # Launch with minimal settings for Gradio 3.x
+        interface.launch(
+            server_name="0.0.0.0",
+            server_port=7860,
+            show_api=False,  # Disable API documentation
+            show_error=True,
+            quiet=False,
+        )
+    except Exception as e:
+        logger.error(f"Failed to launch interface: {e}")
+        # Try minimal launch
+        minimal_interface = create_minimal_interface()
+        minimal_interface.launch(
+            server_name="0.0.0.0",
+            server_port=7860,
+            show_api=False,
+        )

requirements.txt CHANGED Viewed

@@ -1,5 +1,6 @@
 # Piper TTS Demo Requirements
-gradio==4.42.0  # Downgraded from 4.44.1 to avoid json_schema_to_python_type bug
 numpy>=1.24.0,<3.0
 onnxruntime>=1.16.0
 pyopenjtalk>=0.3.0

 # Piper TTS Demo Requirements
+gradio==3.50.2  # Stable Gradio 3.x version to avoid TypeError
+pydantic==1.10.18  # Compatible with Gradio 3.x
 numpy>=1.24.0,<3.0
 onnxruntime>=1.16.0
 pyopenjtalk>=0.3.0