Spaces:

mohamedlabed
/

student02

Sleeping

App Files Files Community

mohamedlabed commited on Jun 19

Commit

4003faa

verified ·

1 Parent(s): 4c59756

Delete app.py

Browse files

Files changed (1) hide show

app.py +0 -340

app.py DELETED Viewed

@@ -1,340 +0,0 @@
-# -*- coding: utf-8 -*-
-"""
-Educational AI Assistant for Arabic Lessons - Hugging Face Spaces Version
-Spécialement optimisée pour la reconnaissance vocale arabe
-Version avec gestion d'erreurs renforcée
-"""
-import gradio as gr
-import torch
-import os
-import tempfile
-import warnings
-import gc
-import time
-warnings.filterwarnings("ignore")
-# Fonction pour libérer la mémoire GPU
-def clear_gpu_memory():
-    """Libère la mémoire GPU."""
-    if torch.cuda.is_available():
-        torch.cuda.empty_cache()
-        gc.collect()
-        print("Mémoire GPU libérée")
-# Fonction pour extraire l'audio d'une vidéo
-def extract_audio(video_path):
-    """Extrait l'audio d'un fichier vidéo."""
-    try:
-        import ffmpeg
-        audio_path = tempfile.mktemp(suffix=".wav")
-        print(f"Extraction de l'audio depuis {video_path} vers {audio_path}")
-        # Commande ffmpeg simplifiée
-        (ffmpeg
-         .input(video_path)
-         .output(audio_path,
-                acodec='pcm_s16le',  # Format PCM non compressé
-                ac=1,               # Mono
-                ar='16k')           # 16kHz (optimal pour Whisper)
-         .run(capture_stdout=True, capture_stderr=True, overwrite_output=True))
-        print("Extraction audio réussie")
-        return audio_path
-    except Exception as e:
-        print(f"Erreur lors de l'extraction audio: {e}")
-        return None
-# Fonction pour transcrire l'audio
-def transcribe_audio(audio_path, progress=None):
-    """Transcrit l'audio arabe."""
-    if not audio_path:
-        return "Veuillez télécharger un fichier audio ou vidéo."
-    if progress:
-        progress(0.3, "Chargement du modèle ASR spécialisé pour l'arabe...")
-    try:
-        from transformers import pipeline
-        # Utiliser un modèle spécialisé pour l'arabe
-        model_name = "Salama1429/KalemaTech-Arabic-STT-ASR-based-on-Whisper-Small"
-        # Déterminer l'appareil à utiliser
-        device = "cuda:0" if torch.cuda.is_available() else "cpu"
-        print(f"Utilisation de l'appareil: {device}")
-        # Paramètres ultra-légers pour éviter les problèmes de mémoire
-        asr = pipeline(
-            "automatic-speech-recognition",
-            model=model_name,
-            chunk_length_s=10,  # Chunks courts
-            batch_size=4,       # Petit batch
-            device=device,
-        )
-        if progress:
-            progress(0.5, "Transcription en cours...")
-        print(f"Transcription du fichier audio: {audio_path}")
-        result = asr(audio_path, generate_kwargs={"language": "arabic"})
-        # Vérification robuste du résultat
-        if result and isinstance(result, dict) and "text" in result:
-            transcription = result["text"]
-            print("Transcription réussie")
-        else:
-            print("Format de résultat inattendu")
-            transcription = ""
-        # Nettoyage des fichiers temporaires
-        if "temp" in audio_path and os.path.exists(audio_path):
-            try:
-                os.remove(audio_path)
-                print(f"Fichier audio temporaire supprimé: {audio_path}")
-            except Exception as e:
-                print(f"Erreur lors de la suppression du fichier temporaire: {e}")
-        return transcription if transcription else "La transcription a échoué ou l'audio était silencieux."
-    except Exception as e:
-        print(f"Erreur pendant la transcription: {e}")
-        # Nettoyage des fichiers temporaires en cas d'erreur
-        if "temp" in audio_path and os.path.exists(audio_path):
-            try:
-                os.remove(audio_path)
-            except:
-                pass
-        return f"La transcription a échoué: {str(e)}"
-# Fonction pour résumer le texte
-def summarize_text(text, progress=None):
-    """Résume le texte arabe en entrée."""
-    if not text or not isinstance(text, str) or "transcription a échoué" in text.lower():
-        return "Veuillez fournir un texte à résumer (transcription nécessaire d'abord)."
-    if progress:
-        progress(0.6, "Chargement du modèle de résumé...")
-    try:
-        from transformers import pipeline
-        # Libérer la mémoire avant de charger un nouveau modèle
-        clear_gpu_memory()
-        # Utiliser un modèle de résumé pour l'arabe
-        model_name = "malmarjeh/t5-arabic-text-summarization"
-        device = "cuda:0" if torch.cuda.is_available() else "cpu"
-        summarizer = pipeline("summarization", model=model_name, device=device)
-        if progress:
-            progress(0.7, "Génération du résumé...")
-        print("Résumé du texte en cours...")
-        # Vérifier que le texte n'est pas vide
-        if not text.strip():
-            return "Le texte à résumer est vide."
-        # Limiter la longueur du texte pour éviter les problèmes de mémoire
-        max_input_length = 1024
-        if len(text) > max_input_length:
-            text = text[:max_input_length]
-            print(f"Texte tronqué à {max_input_length} caractères pour éviter les problèmes de mémoire")
-        # Vérification robuste du résultat
-        summary_result = summarizer(text, max_length=150, min_length=30, do_sample=False)
-        if summary_result and isinstance(summary_result, list) and len(summary_result) > 0 and 'summary_text' in summary_result[0]:
-            summary = summary_result[0]['summary_text']
-            print("Résumé réussi")
-            return summary
-        else:
-            print("Format de résultat de résumé inattendu")
-            return "Le résumé a échoué en raison d'un format de résultat inattendu."
-    except Exception as e:
-        print(f"Erreur pendant le résumé: {e}")
-        return f"Le résumé a échoué: {str(e)}"
-# Fonction pour générer des questions
-def generate_questions(text, progress=None):
-    """Génère des questions basées sur le texte arabe."""
-    if not text or not isinstance(text, str) or "transcription a échoué" in text.lower():
-        return "Veuillez fournir un texte pour générer des questions."
-    if progress:
-        progress(0.8, "Génération des questions...")
-    try:
-        # Version simplifiée avec des questions génériques
-        questions = """1. ما هي الفكرة الرئيسية للدرس؟
-2. ما هي أهم المفاهيم التي تم شرحها في هذا الدرس؟
-3. كيف يمكن تطبيق المعلومات الواردة في هذا الدرس في الحياة العملية؟
-4. ما هي العلاقة بين المفاهيم المختلفة التي تم تقديمها؟
-5. لو طلب منك تلخيص هذا الدرس في ثلاث نقاط، ماذا ستكتب؟"""
-        return questions
-    except Exception as e:
-        print(f"Erreur dans generate_questions: {e}")
-        return f"Erreur lors de la génération des questions: {str(e)}"
-# Fonction pour générer une carte mentale
-def generate_mind_map(text, progress=None):
-    """Génère une représentation de carte mentale simple."""
-    if not text or not isinstance(text, str) or "transcription a échoué" in text.lower():
-        return "Veuillez fournir un texte pour générer une carte mentale."
-    if progress:
-        progress(0.9, "Création de la carte mentale...")
-    try:
-        # Version ultra-simplifiée avec vérification des indices
-        lines = text.split('.')
-        # Création d'une structure Markdown basique
-        markdown_map = "# خريطة ذهنية للدرس\n\n"
-        # Titre principal - avec vérification que lines n'est pas vide
-        if lines and len(lines) > 0 and lines[0].strip():
-            main_idea = lines[0].strip()[:100] + ("..." if len(lines[0]) > 100 else "")
-            markdown_map += f"## الموضوع الرئيسي\n- {main_idea}\n\n"
-        else:
-            markdown_map += f"## الموضوع الرئيسي\n- (لم يتم العثور على موضوع رئيسي)\n\n"
-        # Points principaux (limités à 3 pour simplicité)
-        markdown_map += "## النقاط الرئيسية\n\n"
-        # Vérifier s'il y a des lignes supplémentaires
-        if len(lines) > 1:
-            count = 0
-            for line in lines[1:]:
-                if line and line.strip() and len(line.strip()) > 15:
-                    point_text = line.strip()[:80] + ("..." if len(line) > 80 else "")
-                    markdown_map += f"### نقطة {count+1}\n- {point_text}\n\n"
-                    count += 1
-                    if count >= 3:
-                        break
-        # Si aucun point n'a été trouvé, ajouter un message
-        if "### نقطة" not in markdown_map:
-            markdown_map += "### ملاحظة\n- لم يتم العثور على نقاط رئيسية كافية في النص\n\n"
-        return markdown_map
-    except Exception as e:
-        print(f"Erreur dans generate_mind_map: {e}")
-        return f"Erreur lors de la création de la carte mentale: {str(e)}"
-# Fonction principale de traitement
-def process_lesson(file_obj, progress=gr.Progress()):
-    """Traite le fichier audio/vidéo avec une approche ultra-légère."""
-    if file_obj is None:
-        return "Veuillez télécharger un fichier.", "", "", ""
-    try:
-        progress(0.1, "Préparation du traitement...")
-        file_path = file_obj.name
-        file_name, file_extension = os.path.splitext(file_path)
-        file_extension = file_extension.lower()
-        audio_path = None
-        progress(0.2, "Préparation du fichier...")
-        # Traitement du fichier selon son type
-        try:
-            if file_extension in ['.mp4', '.mov', '.avi', '.mkv']:
-                audio_path = extract_audio(file_path)
-                if not audio_path:
-                    return "Échec de l'extraction audio.", "", "", ""
-            elif file_extension in ['.mp3', '.wav', '.ogg', '.flac', '.m4a']:
-                audio_path = file_path
-            else:
-                return f"Type de fichier non pris en charge: {file_extension}. Veuillez télécharger un fichier audio ou vidéo.", "", "", ""
-        except Exception as e:
-            print(f"Erreur lors de la préparation du fichier: {e}")
-            return f"Erreur lors de la préparation du fichier: {str(e)}", "", "", ""
-        # 1. Transcription
-        try:
-            transcription = transcribe_audio(audio_path, progress)
-        except Exception as e:
-            print(f"Erreur lors de la transcription: {e}")
-            transcription = f"La transcription a échoué: {str(e)}"
-        # Libérer la mémoire après transcription
-        clear_gpu_memory()
-        # 2. Résumé (seulement si la transcription a réussi)
-        try:
-            if isinstance(transcription, str) and "échoué" not in transcription.lower():
-                summary = summarize_text(transcription, progress)
-            else:
-                summary = "Impossible de générer un résumé car la transcription a échoué."
-        except Exception as e:
-            print(f"Erreur lors du résumé: {e}")
-            summary = f"Le résumé a échoué: {str(e)}"
-        # Libérer la mémoire après résumé
-        clear_gpu_memory()
-        # 3. Génération de questions (simplifiée)
-        try:
-            questions = generate_questions(transcription, progress)
-        except Exception as e:
-            print(f"Erreur lors de la génération des questions: {e}")
-            questions = f"La génération des questions a échoué: {str(e)}"
-        # 4. Génération de la carte mentale (simplifiée)
-        try:
-            mind_map = generate_mind_map(summary, progress)
-        except Exception as e:
-            print(f"Erreur lors de la génération de la carte mentale: {e}")
-            mind_map = f"La génération de la carte mentale a échoué: {str(e)}"
-        progress(1.0, "Terminé!")
-        return transcription, summary, questions, mind_map
-    except Exception as e:
-        print(f"Erreur générale: {e}")
-        return f"Une erreur s'est produite: {str(e)}", "", "", ""
-# Interface Gradio simplifiée
-def create_interface():
-    with gr.Blocks(theme=gr.themes.Soft(), title="مساعد الدروس بالذكاء الاصطناعي") as demo:
-        gr.Markdown("## مساعد الدروس بالذكاء الاصطناعي")
-        gr.Markdown("قم برفع ملف صوتي أو فيديو لدرس باللغة العربية، وسيقوم التطبيق بتحويله إلى نص، تلخيصه، توليد أسئلة، وإنشاء خريطة ذهنية.")
-        with gr.Row():
-            input_file = gr.File(label="رفع ملف الدرس (صوت أو فيديو)", file_types=["audio", "video"])
-        process_button = gr.Button("معالجة الدرس")
-        with gr.Tabs():
-            with gr.TabItem("النص الكامل"):
-                output_transcription = gr.Textbox(label="النص المكتوب للدرس", lines=15, interactive=False)
-            with gr.TabItem("الملخص"):
-                output_summary = gr.Textbox(label="ملخص الدرس", lines=10, interactive=False)
-            with gr.TabItem("أسئلة الفهم"):
-                output_questions = gr.Textbox(label="أسئلة مقترحة", lines=10, interactive=False)
-            with gr.TabItem("الخريطة الذهنية"):
-                output_mindmap = gr.Markdown(label="خريطة ذهنية (بصيغة ماركداون)")
-        process_button.click(
-            fn=process_lesson,
-            inputs=input_file,
-            outputs=[output_transcription, output_summary, output_questions, output_mindmap]
-        )
-        gr.Markdown("--- Developed with AI ---")
-    return demo
-# Point d'entrée principal pour Hugging Face Spaces
-demo = create_interface()
-# Cette ligne est nécessaire pour Hugging Face Spaces
-if __name__ == "__main__":
-    demo.launch()