Spaces:

mohamedlabed
/

student02

Running

App Files Files Community

mohamedlabed commited on Jun 17

Commit

d1984e5

verified ·

1 Parent(s): 661e282

Upload 4 files

Browse files

Files changed (4) hide show

README.md - مساعد الدروس بالذكاء الاصطناعي +41 -0
app.py +311 -0
packages.txt +1 -0
requirements.txt +7 -0

README.md - مساعد الدروس بالذكاء الاصطناعي ADDED Viewed

	@@ -0,0 +1,41 @@

+# README.md - مساعد الدروس بالذكاء الاصطناعي
+[![Open In Spaces](https://huggingface.co/datasets/huggingface/badges/raw/main/open-in-hf-spaces-sm.svg)](https://huggingface.co/spaces)
+## نظرة عامة
+هذا التطبيق هو مساعد تعليمي يستخدم الذكاء الاصطناعي لمساعدة الطلاب على تحويل الدروس المسجلة (صوت أو فيديو) باللغة العربية إلى:
+- نص مكتوب
+- ملخص للدرس
+- أسئلة للفهم والمراجعة
+- خريطة ذهنية للمفاهيم الرئيسية
+## النماذج المستخدمة
+- **التعرف على الكلام:** `Salama1429/KalemaTech-Arabic-STT-ASR-based-on-Whisper-Small` (نموذج متخصص للغة العربية)
+- **تلخيص النصوص:** `malmarjeh/t5-arabic-text-summarization`
+## كيفية الاستخدام
+1. ارفع ملف صوتي أو فيديو يحتوي على درس باللغة العربية
+2. انقر على زر "معالجة الدرس"
+3. انتظر حتى تكتمل المعالجة
+4. استعرض النتائج في علامات التبويب المختلفة
+## ملاحظات
+- يعمل التطبيق بشكل أفضل مع ملفات صوتية/فيديو ذات جودة جيدة
+- قد تستغرق معالجة الملفات الكبيرة وقتاً أطول
+- يتم تحميل النماذج عند أول تشغيل، مما قد يستغرق بعض الوقت
+## التطوير
+تم تطوير هذا التطبيق باستخدام:
+- Python
+- Hugging Face Transformers
+- Gradio
+- FFmpeg
+## الترخيص
+هذا المشروع متاح تحت ترخيص MIT.

app.py ADDED Viewed

	@@ -0,0 +1,311 @@

+# -*- coding: utf-8 -*-
+"""
+Educational AI Assistant for Arabic Lessons - Hugging Face Spaces Version
+Spécialement optimisée pour la reconnaissance vocale arabe
+"""
+import gradio as gr
+import torch
+import os
+import tempfile
+import warnings
+import gc
+import time
+warnings.filterwarnings("ignore")
+# Fonction pour libérer la mémoire GPU
+def clear_gpu_memory():
+    """Libère la mémoire GPU."""
+    if torch.cuda.is_available():
+        torch.cuda.empty_cache()
+        gc.collect()
+        print("Mémoire GPU libérée")
+# Fonction pour extraire l'audio d'une vidéo
+def extract_audio(video_path):
+    """Extrait l'audio d'un fichier vidéo."""
+    try:
+        import ffmpeg
+        audio_path = tempfile.mktemp(suffix=".wav")
+        print(f"Extraction de l'audio depuis {video_path} vers {audio_path}")
+        # Commande ffmpeg simplifiée
+        (ffmpeg
+         .input(video_path)
+         .output(audio_path,
+                acodec='pcm_s16le',  # Format PCM non compressé
+                ac=1,               # Mono
+                ar='16k')           # 16kHz (optimal pour Whisper)
+         .run(capture_stdout=True, capture_stderr=True, overwrite_output=True))
+        print("Extraction audio réussie")
+        return audio_path
+    except Exception as e:
+        print(f"Erreur lors de l'extraction audio: {e}")
+        return None
+# Fonction pour transcrire l'audio
+def transcribe_audio(audio_path, progress=None):
+    """Transcrit l'audio arabe."""
+    if not audio_path:
+        return "Veuillez télécharger un fichier audio ou vidéo."
+    if progress:
+        progress(0.3, "Chargement du modèle ASR spécialisé pour l'arabe...")
+    try:
+        from transformers import pipeline
+        # Utiliser un modèle spécialisé pour l'arabe
+        model_name = "Salama1429/KalemaTech-Arabic-STT-ASR-based-on-Whisper-Small"
+        # Déterminer l'appareil à utiliser
+        device = "cuda:0" if torch.cuda.is_available() else "cpu"
+        print(f"Utilisation de l'appareil: {device}")
+        # Paramètres ultra-légers pour éviter les problèmes de mémoire
+        asr = pipeline(
+            "automatic-speech-recognition",
+            model=model_name,
+            chunk_length_s=10,  # Chunks courts
+            batch_size=4,       # Petit batch
+            device=device,
+        )
+        if progress:
+            progress(0.5, "Transcription en cours...")
+        print(f"Transcription du fichier audio: {audio_path}")
+        result = asr(audio_path, generate_kwargs={"language": "arabic"})
+        # Vérification robuste du résultat
+        if result and isinstance(result, dict) and "text" in result:
+            transcription = result["text"]
+            print("Transcription réussie")
+        else:
+            print("Format de résultat inattendu")
+            transcription = ""
+        # Nettoyage des fichiers temporaires
+        if "temp" in audio_path and os.path.exists(audio_path):
+            try:
+                os.remove(audio_path)
+                print(f"Fichier audio temporaire supprimé: {audio_path}")
+            except Exception as e:
+                print(f"Erreur lors de la suppression du fichier temporaire: {e}")
+        return transcription if transcription else "La transcription a échoué ou l'audio était silencieux."
+    except Exception as e:
+        print(f"Erreur pendant la transcription: {e}")
+        # Nettoyage des fichiers temporaires en cas d'erreur
+        if "temp" in audio_path and os.path.exists(audio_path):
+            try:
+                os.remove(audio_path)
+            except:
+                pass
+        return f"La transcription a échoué: {str(e)}"
+# Fonction pour résumer le texte
+def summarize_text(text, progress=None):
+    """Résume le texte arabe en entrée."""
+    if not text or not isinstance(text, str) or "transcription a échoué" in text.lower():
+        return "Veuillez fournir un texte à résumer (transcription nécessaire d'abord)."
+    if progress:
+        progress(0.6, "Chargement du modèle de résumé...")
+    try:
+        from transformers import pipeline
+        # Libérer la mémoire avant de charger un nouveau modèle
+        clear_gpu_memory()
+        # Utiliser un modèle de résumé pour l'arabe
+        model_name = "malmarjeh/t5-arabic-text-summarization"
+        device = "cuda:0" if torch.cuda.is_available() else "cpu"
+        summarizer = pipeline("summarization", model=model_name, device=device)
+        if progress:
+            progress(0.7, "Génération du résumé...")
+        print("Résumé du texte en cours...")
+        # Vérifier que le texte n'est pas vide
+        if not text.strip():
+            return "Le texte à résumer est vide."
+        # Limiter la longueur du texte pour éviter les problèmes de mémoire
+        max_input_length = 1024
+        if len(text) > max_input_length:
+            text = text[:max_input_length]
+            print(f"Texte tronqué à {max_input_length} caractères pour éviter les problèmes de mémoire")
+        # Vérification robuste du résultat
+        summary_result = summarizer(text, max_length=150, min_length=30, do_sample=False)
+        if summary_result and isinstance(summary_result, list) and len(summary_result) > 0 and 'summary_text' in summary_result[0]:
+            summary = summary_result[0]['summary_text']
+            print("Résumé réussi")
+            return summary
+        else:
+            print("Format de résultat de résumé inattendu")
+            return "Le résumé a échoué en raison d'un format de résultat inattendu."
+    except Exception as e:
+        print(f"Erreur pendant le résumé: {e}")
+        return f"Le résumé a échoué: {str(e)}"
+# Fonction pour générer des questions
+def generate_questions(text, progress=None):
+    """Génère des questions basées sur le texte arabe."""
+    if not text or not isinstance(text, str) or "transcription a échoué" in text.lower():
+        return "Veuillez fournir un texte pour générer des questions."
+    if progress:
+        progress(0.8, "Génération des questions...")
+    # Version simplifiée avec des questions génériques
+    questions = """1. ما هي الفكرة الرئيسية للدرس؟
+2. ما هي أهم المفاهيم التي تم شرحها في هذا الدرس؟
+3. كيف يمكن تطبيق المعلومات الواردة في هذا الدرس في الحياة العملية؟
+4. ما هي العلاقة بين المفاهيم المختلفة التي تم تقديمها؟
+5. لو طلب منك تلخيص هذا الدرس في ثلاث نقاط، ماذا ستكتب؟"""
+    return questions
+# Fonction pour générer une carte mentale
+def generate_mind_map(text, progress=None):
+    """Génère une représentation de carte mentale simple."""
+    if not text or not isinstance(text, str) or "transcription a échoué" in text.lower():
+        return "Veuillez fournir un texte pour générer une carte mentale."
+    if progress:
+        progress(0.9, "Création de la carte mentale...")
+    # Version ultra-simplifiée avec vérification des indices
+    lines = text.split('.')
+    # Création d'une structure Markdown basique
+    markdown_map = "# خريطة ذهنية للدرس\n\n"
+    # Titre principal - avec vérification que lines n'est pas vide
+    if lines and len(lines) > 0 and lines[0].strip():
+        main_idea = lines[0].strip()[:100] + ("..." if len(lines[0]) > 100 else "")
+        markdown_map += f"## الموضوع الرئيسي\n- {main_idea}\n\n"
+    else:
+        markdown_map += f"## الموضوع الرئيسي\n- (لم يتم العثور على موضوع رئيسي)\n\n"
+    # Points principaux (limités à 3 pour simplicité)
+    markdown_map += "## النقاط الرئيسية\n\n"
+    # Vérifier s'il y a des lignes supplémentaires
+    if len(lines) > 1:
+        count = 0
+        for line in lines[1:]:
+            if line and line.strip() and len(line.strip()) > 15:
+                point_text = line.strip()[:80] + ("..." if len(line) > 80 else "")
+                markdown_map += f"### نقطة {count+1}\n- {point_text}\n\n"
+                count += 1
+                if count >= 3:
+                    break
+    # Si aucun point n'a été trouvé, ajouter un message
+    if "### نقطة" not in markdown_map:
+        markdown_map += "### ملاحظة\n- لم يتم العثور على نقاط رئيسية كافية في النص\n\n"
+    return markdown_map
+# Fonction principale de traitement
+def process_lesson(file_obj, progress=gr.Progress()):
+    """Traite le fichier audio/vidéo avec une approche ultra-légère."""
+    if file_obj is None:
+        return "Veuillez télécharger un fichier.", "", "", ""
+    try:
+        progress(0.1, "Préparation du traitement...")
+        file_path = file_obj.name
+        file_name, file_extension = os.path.splitext(file_path)
+        file_extension = file_extension.lower()
+        audio_path = None
+        progress(0.2, "Préparation du fichier...")
+        # Traitement du fichier selon son type
+        if file_extension in ['.mp4', '.mov', '.avi', '.mkv']:
+            audio_path = extract_audio(file_path)
+            if not audio_path:
+                return "Échec de l'extraction audio.", "", "", ""
+        elif file_extension in ['.mp3', '.wav', '.ogg', '.flac', '.m4a']:
+            audio_path = file_path
+        else:
+            return f"Type de fichier non pris en charge: {file_extension}. Veuillez télécharger un fichier audio ou vidéo.", "", "", ""
+        # 1. Transcription
+        transcription = transcribe_audio(audio_path, progress)
+        # Libérer la mémoire après transcription
+        clear_gpu_memory()
+        # 2. Résumé (seulement si la transcription a réussi)
+        if isinstance(transcription, str) and "échoué" not in transcription.lower():
+            summary = summarize_text(transcription, progress)
+        else:
+            summary = "Impossible de générer un résumé car la transcription a échoué."
+        # Libérer la mémoire après résumé
+        clear_gpu_memory()
+        # 3. Génération de questions (simplifiée)
+        questions = generate_questions(transcription, progress)
+        # 4. Génération de la carte mentale (simplifiée)
+        mind_map = generate_mind_map(summary, progress)
+        progress(1.0, "Terminé!")
+        return transcription, summary, questions, mind_map
+    except Exception as e:
+        print(f"Erreur générale: {e}")
+        return f"Une erreur s'est produite: {str(e)}", "", "", ""
+# Interface Gradio simplifiée
+def create_interface():
+    with gr.Blocks(theme=gr.themes.Soft(), title="مساعد الدروس بالذكاء الاصطناعي") as demo:
+        gr.Markdown("## مساعد الدروس بالذكاء الاصطناعي")
+        gr.Markdown("قم برفع ملف صوتي أو فيديو لدرس باللغة العربية، وسيقوم التطبيق بتحويله إلى نص، تلخيصه، توليد أسئلة، وإنشاء خريطة ذهنية.")
+        with gr.Row():
+            input_file = gr.File(label="رفع ملف الدرس (صوت أو فيديو)", file_types=["audio", "video"])
+        process_button = gr.Button("معالجة الدرس")
+        with gr.Tabs():
+            with gr.TabItem("النص الكامل"):
+                output_transcription = gr.Textbox(label="النص المكتوب للدرس", lines=15, interactive=False)
+            with gr.TabItem("الملخص"):
+                output_summary = gr.Textbox(label="ملخص الدرس", lines=10, interactive=False)
+            with gr.TabItem("أسئلة الفهم"):
+                output_questions = gr.Textbox(label="أسئلة مقترحة", lines=10, interactive=False)
+            with gr.TabItem("الخريطة الذهنية"):
+                output_mindmap = gr.Markdown(label="خريطة ذهنية (بصيغة ماركداون)")
+        process_button.click(
+            fn=process_lesson,
+            inputs=input_file,
+            outputs=[output_transcription, output_summary, output_questions, output_mindmap]
+        )
+        gr.Markdown("--- Developed with AI ---")
+    return demo
+# Point d'entrée principal pour Hugging Face Spaces
+demo = create_interface()
+# Cette ligne est nécessaire pour Hugging Face Spaces
+if __name__ == "__main__":
+    demo.launch()

packages.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ ffmpeg

requirements.txt ADDED Viewed

	@@ -0,0 +1,7 @@

+gradio>=3.50.2
+transformers>=4.30.0
+torch>=2.0.0
+ffmpeg-python>=0.2.0
+datasets>=2.14.0
+sentencepiece>=0.1.99
+protobuf>=4.25.0