Spaces:

tsi-org
/

tango

Paused

deepanway commited on Apr 30, 2023

Commit

2301775

1 Parent(s): bcbc444

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -72,8 +72,8 @@ if torch.cuda.is_available():
 else:
     tango = Tango(device="cpu")
-def gradio_generate(prompt):
-    output_wave = tango.generate(prompt)
     output_filename = "temp_output.wav"
     wavio.write(output_filename, output_wave, rate=16000, sampwidth=2)
@@ -86,12 +86,13 @@ TANGO is a latent diffusion model (LDM) for text-to-audio (TTA) generation. TANG
 # Gradio input and output components
 input_text = gr.inputs.Textbox(lines=2, label="Prompt")
 output_audio = gr.outputs.Audio(label="Generated Audio", type="filepath")
-# denoising_steps = gr.Number(value=100, label="Steps", interactive=True, precision=0)
 # Gradio interface
 gr_interface = gr.Interface(
     fn=gradio_generate,
-    inputs=[input_text],
     outputs=[output_audio],
     title="TANGO: Text to Audio using Instruction-Guided Diffusion",
     description="Generate audio using TANGO by providing a text prompt.",

 else:
     tango = Tango(device="cpu")
+def gradio_generate(prompt, steps, guidance):
+    output_wave = tango.generate(prompt, steps, guidance)
     output_filename = "temp_output.wav"
     wavio.write(output_filename, output_wave, rate=16000, sampwidth=2)
 # Gradio input and output components
 input_text = gr.inputs.Textbox(lines=2, label="Prompt")
 output_audio = gr.outputs.Audio(label="Generated Audio", type="filepath")
+denoising_steps = gr.Slider(minimum=100, maximum=200, value=100, step=1, label="Steps", interactive=True)
+guidance_scale = gr.Slider(minimum=1, maximum=10, value=3, step=0.1, label="Guidance Scale", interactive=True)
 # Gradio interface
 gr_interface = gr.Interface(
     fn=gradio_generate,
+    inputs=[input_text, denoising_steps, guidance_scale],
     outputs=[output_audio],
     title="TANGO: Text to Audio using Instruction-Guided Diffusion",
     description="Generate audio using TANGO by providing a text prompt.",