Spaces:
Running
Running
Laurine Sottani
commited on
Commit
·
dad3e66
1
Parent(s):
5a7c348
ui changes
Browse files- file_cleaning_ui.py +8 -9
file_cleaning_ui.py
CHANGED
|
@@ -81,10 +81,10 @@ def process_file(input_file: gr.File, output_name: str) -> str:
|
|
| 81 |
return out_path
|
| 82 |
|
| 83 |
with gr.Blocks(title="Nettoyage de texte pour RAG") as demo:
|
| 84 |
-
gr.Markdown("# 📄
|
| 85 |
gr.Markdown(
|
| 86 |
"Déposez simplement votre fichier : nous nous chargeons d’extraire son contenu textuel, de le nettoyer "
|
| 87 |
-
"
|
| 88 |
)
|
| 89 |
|
| 90 |
with gr.Row():
|
|
@@ -115,13 +115,12 @@ with gr.Blocks(title="Nettoyage de texte pour RAG") as demo:
|
|
| 115 |
gr.Markdown(
|
| 116 |
"""
|
| 117 |
---
|
| 118 |
-
|
| 119 |
-
-
|
| 120 |
-
-
|
| 121 |
-
-
|
| 122 |
-
-
|
| 123 |
-
|
| 124 |
-
En un clic, votre texte ressort frais, propre et parfaitement zen — prêt pour une intégration fluide dans vos pipelines RAG 🪷
|
| 125 |
"""
|
| 126 |
)
|
| 127 |
|
|
|
|
| 81 |
return out_path
|
| 82 |
|
| 83 |
with gr.Blocks(title="Nettoyage de texte pour RAG") as demo:
|
| 84 |
+
gr.Markdown("# 📄 Nettoyage d'un fichier pour utilisation RAG")
|
| 85 |
gr.Markdown(
|
| 86 |
"Déposez simplement votre fichier : nous nous chargeons d’extraire son contenu textuel, de le nettoyer "
|
| 87 |
+
"puis de vous le restituer en format markdown **sous le nom que vous choisissez.**"
|
| 88 |
)
|
| 89 |
|
| 90 |
with gr.Row():
|
|
|
|
| 115 |
gr.Markdown(
|
| 116 |
"""
|
| 117 |
---
|
| 118 |
+
**Prétraitements effectués :**
|
| 119 |
+
- Suppression des symboles non imprimables et des caractères parasites
|
| 120 |
+
- Conservation des lettres (y compris accentuées), chiffres, espaces et ponctuation simple
|
| 121 |
+
- Normalisation des espaces pour un texte harmonieux
|
| 122 |
+
- Export automatique au format **`.md`**
|
| 123 |
+
|
|
|
|
| 124 |
"""
|
| 125 |
)
|
| 126 |
|