Spaces:
Runtime error
Runtime error
rvian
commited on
Commit
·
4e3e82b
1
Parent(s):
7e7ef19
ajustes fluxo
Browse files
app.py
CHANGED
|
@@ -28,33 +28,27 @@ def traduzir_en_pt(text):
|
|
| 28 |
output = model.generate(input_ids, attention_mask=attention_mask, forced_bos_token_id=tokenizer.lang_code_to_id['pt_XX'])
|
| 29 |
return tokenizer.decode(output[0], skip_special_tokens=True)
|
| 30 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 31 |
|
| 32 |
-
|
| 33 |
-
#### interface ####
|
| 34 |
-
###################
|
| 35 |
-
|
| 36 |
-
# Cabeçalho
|
| 37 |
-
st.title('Tradutor de datasets (inglês para português)')
|
| 38 |
-
# Carrega dataset
|
| 39 |
-
|
| 40 |
-
with st.beta_container():
|
| 41 |
-
dataset = st.file_uploader("Carrege o dataset (coluna a ser traduzida deve ser nomeada como 'texto')", type=["csv"])
|
| 42 |
-
st.write('Carregando dataset...')
|
| 43 |
-
|
| 44 |
-
with st.beta_expander():
|
| 45 |
if dataset is not None:
|
| 46 |
st.write('🎲 Dataset carregado com sucesso!')
|
| 47 |
-
|
| 48 |
-
|
| 49 |
-
|
| 50 |
|
| 51 |
-
|
| 52 |
modelo_selecionado = st.selectbox('Escolha um modelo', modelos_opcao)
|
| 53 |
if st.button("Carregar modelo escolhido"):
|
| 54 |
model, tokenizer = carregar_modelo_e_tokenizador_mbart(modelo_selecionado)
|
| 55 |
st.write(f"🎰 Modelo {modelo_selecionado} carregado com sucesso! 🔥")
|
|
|
|
| 56 |
|
| 57 |
-
|
| 58 |
qtde_linhas_traduzir = st.slider('Quantidade de linhas a serem traduzidas', 1, len(dataset), 50)
|
| 59 |
if st.button(f"Traduzir {qtde_linhas_traduzir} linhas"):
|
| 60 |
for i in range(qtde_linhas_traduzir):
|
|
@@ -64,11 +58,28 @@ with st.beta_container():
|
|
| 64 |
st.write(f'Tradução: {texto_traduzido}')
|
| 65 |
|
| 66 |
# adiciona traducao em nova coluna dataset
|
| 67 |
-
dataset["traduzido"]= texto_traduzido
|
| 68 |
st.write("Traduzido 👍")
|
| 69 |
-
|
| 70 |
-
st.
|
| 71 |
-
|
| 72 |
-
with st.beta_expander():
|
| 73 |
st.download_button(label='Baixar dataset', data=dataset.to_csv(index=False))
|
| 74 |
-
st.write("Fim 👍")
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 28 |
output = model.generate(input_ids, attention_mask=attention_mask, forced_bos_token_id=tokenizer.lang_code_to_id['pt_XX'])
|
| 29 |
return tokenizer.decode(output[0], skip_special_tokens=True)
|
| 30 |
|
| 31 |
+
## streamlit ##
|
| 32 |
+
def carregar_dataset():
|
| 33 |
+
dataset = st.file_uploader("(coluna a ser traduzida deve ser nomeada como 'texto')",type="csv")
|
| 34 |
+
if dataset is not None:
|
| 35 |
+
st.write('Carregando dataset...')
|
| 36 |
+
return pd.read_csv(dataset)
|
| 37 |
|
| 38 |
+
def mostrar_dataset():
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 39 |
if dataset is not None:
|
| 40 |
st.write('🎲 Dataset carregado com sucesso!')
|
| 41 |
+
with st.expander("Dataset:"):
|
| 42 |
+
st.table(dataset)
|
|
|
|
| 43 |
|
| 44 |
+
def carregar_modelo():
|
| 45 |
modelo_selecionado = st.selectbox('Escolha um modelo', modelos_opcao)
|
| 46 |
if st.button("Carregar modelo escolhido"):
|
| 47 |
model, tokenizer = carregar_modelo_e_tokenizador_mbart(modelo_selecionado)
|
| 48 |
st.write(f"🎰 Modelo {modelo_selecionado} carregado com sucesso! 🔥")
|
| 49 |
+
return model, tokenizer
|
| 50 |
|
| 51 |
+
def traduzir_dataset(dataset):
|
| 52 |
qtde_linhas_traduzir = st.slider('Quantidade de linhas a serem traduzidas', 1, len(dataset), 50)
|
| 53 |
if st.button(f"Traduzir {qtde_linhas_traduzir} linhas"):
|
| 54 |
for i in range(qtde_linhas_traduzir):
|
|
|
|
| 58 |
st.write(f'Tradução: {texto_traduzido}')
|
| 59 |
|
| 60 |
# adiciona traducao em nova coluna dataset
|
| 61 |
+
dataset["traduzido"][i]= texto_traduzido
|
| 62 |
st.write("Traduzido 👍")
|
| 63 |
+
def resultado():
|
| 64 |
+
with st.expander():
|
| 65 |
+
st.write(dataset)
|
|
|
|
| 66 |
st.download_button(label='Baixar dataset', data=dataset.to_csv(index=False))
|
| 67 |
+
st.write("Fim 👍")
|
| 68 |
+
|
| 69 |
+
###################
|
| 70 |
+
#### interface ####
|
| 71 |
+
###################
|
| 72 |
+
|
| 73 |
+
# Cabeçalho
|
| 74 |
+
st.title('Tradutor de datasets (inglês para português)')
|
| 75 |
+
# Carrega dataset
|
| 76 |
+
dataset = carregar_dataset()
|
| 77 |
+
if dataset is not None:
|
| 78 |
+
mostrar_dataset()
|
| 79 |
+
if st.button("Carregar modelo"):
|
| 80 |
+
model, tokenizer = carregar_modelo()
|
| 81 |
+
|
| 82 |
+
|
| 83 |
+
if st.button("Traduzir dataset") and model is not None:
|
| 84 |
+
traduzir_dataset(dataset)
|
| 85 |
+
resultado()
|