Resumen Semanal de IA: El duelo de titanes entre OpenAI y Google

La velocidad a la que se mueve la industria de la inteligencia artificial es vertiginosa. La semana pasada no fue la excepción, con anuncios que van desde mejoras drásticas en modelos de lenguaje hasta nuevas herramientas de hardware que prometen cambiar cómo interactuamos con la tecnología. En jbdevs.pro, hemos recopilado los hitos más importantes para que no te pierdas nada.

1. OpenAI lanza GPT-4o: Omnicanalidad y velocidad humana

Sin duda, la noticia que dominó los titulares fue el evento “Spring Update” de OpenAI. La compañía presentó GPT-4o (“o” de Omni), un modelo capaz de razonar a través de texto, audio e imagen en tiempo real.

  • Latencia mínima: El modelo responde a entradas de audio en un promedio de 320 milisegundos, similar al tiempo de respuesta humano.
  • Gratis para todos: Una de las mayores sorpresas es que GPT-4o estará disponible para usuarios del plan gratuito, democratizando el acceso a la inteligencia de nivel “Plus”.
  • Visión mejorada: Ahora puede “ver” a través de la cámara del móvil y ayudar en tareas como resolver problemas matemáticos en papel o explicar código en una pantalla.

2. Google I/O 2024: La IA en el centro de todo el ecosistema

Apenas un día después de OpenAI, Google celebró su conferencia anual de desarrolladores. La consigna fue clara: integrar Gemini en cada rincón de sus productos.

Project Astra

Google mostró su visión del futuro de los asistentes de IA con Project Astra, un agente que utiliza la cámara del teléfono para identificar objetos, recordar dónde dejamos las llaves y entender el contexto del entorno de manera fluida.

Gemini 1.5 Pro y Flash

Google anunció Gemini 1.5 Flash, un modelo optimizado para velocidad y eficiencia, y una expansión de la ventana de contexto de Gemini 1.5 Pro a 2 millones de tokens, permitiendo analizar horas de video o miles de líneas de código de una sola vez.

3. Veo e Imagen 3: El contraataque creativo

Para competir con Sora de OpenAI, Google presentó Veo, su modelo de generación de video de alta definición (1080p) con una duración de más de un minuto. Por otro lado, Imagen 3 promete ser su modelo de generación de imágenes más fotorrealista hasta la fecha, con una comprensión del lenguaje natural significativamente mejorada.

4. Apple y OpenAI: Un acuerdo inminente

Rumores de fuentes confiables indican que Apple ha cerrado un acuerdo con OpenAI para integrar la tecnología de ChatGPT en iOS 18. Se espera que los detalles se revelen en la WWDC en junio, lo que supondría un cambio radical para Siri y la integración nativa de IA en iPhones y Macs.

5. Anthropic lanza su app para iOS

Anthropic, el principal competidor ético de OpenAI, finalmente lanzó la aplicación móvil de Claude para iOS. Ahora los usuarios pueden acceder a Claude 3 (Opus, Sonnet y Haiku) directamente desde sus dispositivos móviles, permitiendo análisis de fotos y archivos sobre la marcha.

Conclusión

Esta semana ha marcado un punto de inflexión en la accesibilidad. Ya no se trata solo de modelos más potentes, sino de modelos más rápidos, multimodales y gratuitos. En jbdevs.pro seguiremos de cerca cómo estas herramientas impactan en el desarrollo de software y la productividad diaria.

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *