La era de la IA

¿Cómo Medimos la Inteligencia de las Máquinas?

16 min · 15 de jul de 2025
Portada del episodio ¿Cómo Medimos la Inteligencia de las Máquinas?

Descripción

En la jungla de la inteligencia artificial, con docenas de modelos como ChatGPT, Gemini y Claude compitiendo por ser el mejor, ¿cómo sabemos cuál es realmente más "inteligente"? En este episodio, exploramos el mundo de los "benchmarks": las pruebas estandarizadas diseñadas para medir las capacidades de los grandes modelos de lenguaje. Descubre qué son, cómo funcionan pruebas como MMLU o HumanEval, y por qué superar un examen universitario no significa que una IA pueda "razonar". Analizamos también sus limitaciones, cómo los modelos pueden "hacer trampa" y por qué, al final, el juicio humano se está volviendo la herramienta más importante para evaluar a las mentes artificiales. https://t.me/la_era_de_la_IA

Comentarios

0

Sé la primera persona en comentar

¡Regístrate ahora y únete a la comunidad de La era de la IA!

Prueba gratis

Empieza 7 días de prueba

$99 / mes después de la prueba. · Cancela cuando quieras.

  • Podcasts solo en Podimo
  • 20 horas de audiolibros al mes
  • Podcast gratuitos

Todos los episodios

24 episodios