hf-gaia-agents-course-MN / test_answers.py
Mahynlo
Soporte para archivos Excel y audio + mejoras en procesamiento de archivos
0abe794
"""
Script para testear respuestas específicas y mejorar la precisión
"""
# Respuestas del último run (15%)
respuestas_obtenidas = {
1: "4", # Mercedes Sosa albums
2: "4", # Bird species video
3: "right", # Reversed text ✅ (probablemente correcta)
4: "Ra1#", # Chess move
5: "funkmonk", # Wikipedia dinosaur
6: "b,e", # Math table ✅ (probablemente correcta)
7: "indeed", # Teal'c quote ✅ (probablemente correcta)
8: "silver", # Equine veterinarian
9: "bell pepper,broccoli,celery,corn,green beans,lettuce,sweet potatoes,zucchini", # Botany list
10: "cornstarch,lemon juice,salt,strawberries,sugar", # Pie ingredients
11: "wojciech", # Polish actor
12: "55", # Python code output
13: "553", # Baseball at bats
14: "21,22,23,24,25,26,27,28,29,30,31,32,33,34,35", # Homework pages
15: "80GSFC21N0002", # NASA article
16: "None", # Vietnamese specimens
17: "HAI", # 1928 Olympics
18: "Fujiwara,Ogasawara", # Baseball pitchers
19: "$210.00", # Excel sales
20: "dmitrij", # Malko Competition
}
# Patrones observados de posibles problemas:
problemas_potenciales = {
"Mayúsculas/minúsculas": [5, 7, 11, 17, 18, 20], # funkmonk vs FunkMonk, indeed vs Indeed
"Formato numérico": [1, 12, 13], # Números que podrían estar incorrectos
"Listas de items": [9, 10, 14, 18], # Listas que podrían tener orden o items incorrectos
"Formato especial": [15, 19], # Códigos NASA, moneda
"Análisis de archivos": [8, 12, 14, 19, 20], # Requieren leer archivos
}
print("=" * 60)
print("🔍 ANÁLISIS DE RESPUESTAS DEL ÚLTIMO RUN")
print("=" * 60)
print(f"\n✅ Correctas confirmadas: 3/20 (15%)")
print(f"🎯 Objetivo: 6/20 (30%)")
print(f"❌ Necesitamos mejorar: +3 respuestas correctas\n")
print("📋 CATEGORÍAS DE PROBLEMAS POTENCIALES:\n")
for categoria, preguntas in problemas_potenciales.items():
print(f" • {categoria}:")
print(f" Preguntas: {', '.join(map(str, preguntas))}")
respuestas = [respuestas_obtenidas[p] for p in preguntas]
print(f" Respuestas: {respuestas[:3]}..." if len(respuestas) > 3 else f" Respuestas: {respuestas}")
print()
print("\n💡 RECOMENDACIONES:")
print(" 1. Verificar case-sensitivity (mayúsculas/minúsculas)")
print(" 2. Mejorar procesamiento de archivos (especialmente audio/Excel)")
print(" 3. Validar formato de listas (orden alfabético vs orden original)")
print(" 4. Revisar precisión numérica en cálculos")