Análisis comparativo de modelos de IA: rendimiento, velocidad y costos en la actualidad

Un estudio reciente evalúa el desempeño de 431 modelos de inteligencia artificial, destacando a Gemini y GPT-5.4 en capacidad de razonamiento, mientras otros se imponen en velocidad, latencia o precio.

La industria de la inteligencia artificial continúa evolucionando a un ritmo acelerado, con múltiples empresas y laboratorios compitiendo en el desarrollo de modelos que optimicen distintas capacidades. Un análisis reciente realizado por el sitio especializado Artificial Analysis, que evaluó 431 modelos mediante pruebas estandarizadas con prompts idénticos, ofrece una visión detallada del panorama actual.

En cuanto a la capacidad de procesamiento y razonamiento, los modelos que encabezan el ranking son Gemini 3.1 Pro de Google y GPT‑5.4 de OpenAI. Detrás de ellos se ubican GPT‑5.3 Codex y Claude Opus 4.6, este último desarrollado por Anthropic.

Sin embargo, el panorama cambia al evaluar otras métricas clave. En velocidad de generación de texto (tokens por segundo), el modelo más veloz es Mercury 2, con aproximadamente 732 tokens por segundo, seguido por Granite 4.0 H Small de IBM, con alrededor de 452 tokens por segundo. Modelos de la familia Qwen 3.5, creados por Alibaba, también destacan en este rubro.

En latencia (tiempo para empezar a responder), lidera Gemini 2.5 Flash‑Lite con aproximadamente 0,33 segundos, seguido muy de cerca por Qwen 3.5 0.8B con 0,34 segundos. El modelo Apriel‑v1.5‑15B‑Thinker también figura entre los de baja latencia.

El precio por millón de tokens es un factor decisivo para desarrolladores y empresas. Según la comparación, el modelo más económico es Qwen 3.5 0.8B, con un costo aproximado de 0,02 dólares. Entre las alternativas de bajo costo también se menciona Gemma 3n E4B, otro desarrollo de Google.

Finalmente, en el tamaño de la ventana de contexto (cantidad de información procesable en una interacción), destaca Llama 4 Scout de Meta, con una capacidad de hasta 10 millones de tokens. Le sigue Grok 4.20 Beta 0309, de xAI, con cerca de 2 millones de tokens, mientras que Gemini 2.0 Pro Experimental también figura entre los modelos con mayor contexto disponible.

Este análisis refleja cómo la industria se está diversificando rápidamente, con modelos que priorizan diferentes aspectos: capacidad de razonamiento, velocidad, eficiencia o costos. La competencia entre gigantes tecnológicos y nuevos laboratorios anticipa un escenario de especialización creciente, con herramientas optimizadas para tareas específicas como programación, análisis de datos o generación de contenido.

Análisis comparativo de modelos de IA: rendimiento, velocidad y costos en la actualidad

Minecraft Experience: Moonlight Trail llega a Buenos Aires con estreno mundial

Consultor político analiza la imagen y gestión del presidente Javier Milei

Productores de Daireaux obtienen fallo que anula tasa vial por falta de contraprestación municipal

Diputado solicitará citación de escribana en caso de compra de inmueble por parte de Adorni

Minecraft Experience: Moonlight Trail llega a Buenos Aires con estreno mundial

Consultor político analiza la imagen y gestión del presidente Javier Milei

Productores de Daireaux obtienen fallo que anula tasa vial por falta de contraprestación municipal

Diputado solicitará citación de escribana en caso de compra de inmueble por parte de Adorni

Mercados globales reaccionan ante señales de posible distensión en el conflicto con Irán