Spaces:

MalcomNavarro
/

hf-gaia-agents-course-MN

Sleeping

hf-gaia-agents-course-MN / test_answers.py

Mahynlo

Soporte para archivos Excel y audio + mejoras en procesamiento de archivos

0abe794 12 days ago

2.58 kB

	"""
	Script para testear respuestas específicas y mejorar la precisión
	"""

	# Respuestas del último run (15%)
	respuestas_obtenidas = {
	1: "4", # Mercedes Sosa albums
	2: "4", # Bird species video
	3: "right", # Reversed text ✅ (probablemente correcta)
	4: "Ra1#", # Chess move
	5: "funkmonk", # Wikipedia dinosaur
	6: "b,e", # Math table ✅ (probablemente correcta)
	7: "indeed", # Teal'c quote ✅ (probablemente correcta)
	8: "silver", # Equine veterinarian
	9: "bell pepper,broccoli,celery,corn,green beans,lettuce,sweet potatoes,zucchini", # Botany list
	10: "cornstarch,lemon juice,salt,strawberries,sugar", # Pie ingredients
	11: "wojciech", # Polish actor
	12: "55", # Python code output
	13: "553", # Baseball at bats
	14: "21,22,23,24,25,26,27,28,29,30,31,32,33,34,35", # Homework pages
	15: "80GSFC21N0002", # NASA article
	16: "None", # Vietnamese specimens
	17: "HAI", # 1928 Olympics
	18: "Fujiwara,Ogasawara", # Baseball pitchers
	19: "$210.00", # Excel sales
	20: "dmitrij", # Malko Competition
	}

	# Patrones observados de posibles problemas:
	problemas_potenciales = {
	"Mayúsculas/minúsculas": [5, 7, 11, 17, 18, 20], # funkmonk vs FunkMonk, indeed vs Indeed
	"Formato numérico": [1, 12, 13], # Números que podrían estar incorrectos
	"Listas de items": [9, 10, 14, 18], # Listas que podrían tener orden o items incorrectos
	"Formato especial": [15, 19], # Códigos NASA, moneda
	"Análisis de archivos": [8, 12, 14, 19, 20], # Requieren leer archivos
	}

	print("=" * 60)
	print("🔍 ANÁLISIS DE RESPUESTAS DEL ÚLTIMO RUN")
	print("=" * 60)
	print(f"\n✅ Correctas confirmadas: 3/20 (15%)")
	print(f"🎯 Objetivo: 6/20 (30%)")
	print(f"❌ Necesitamos mejorar: +3 respuestas correctas\n")

	print("📋 CATEGORÍAS DE PROBLEMAS POTENCIALES:\n")

	for categoria, preguntas in problemas_potenciales.items():
	print(f" • {categoria}:")
	print(f" Preguntas: {', '.join(map(str, preguntas))}")
	respuestas = [respuestas_obtenidas[p] for p in preguntas]
	print(f" Respuestas: {respuestas[:3]}..." if len(respuestas) > 3 else f" Respuestas: {respuestas}")
	print()

	print("\n💡 RECOMENDACIONES:")
	print(" 1. Verificar case-sensitivity (mayúsculas/minúsculas)")
	print(" 2. Mejorar procesamiento de archivos (especialmente audio/Excel)")
	print(" 3. Validar formato de listas (orden alfabético vs orden original)")
	print(" 4. Revisar precisión numérica en cálculos")