Google acaba de lanzar su modelo de inteligencia artificial más grande y capaz, en medio de una feroz disputa entre los pesos pesados del sector tecnológico por liderar la industria global de IA.
El modelo de lenguaje grande Gemini vendrá en tres tamaños diferentes: Gemini Ultra, su categoría más completa; Gemini Pro, con amplias capacidad; y Gemini Nano, que se utilizará para tareas específicas y dispositivos móviles.
Inicialmente las licencias para adquirir Gemini se entregarán únicamente a través de Google Cloud para que los usuarios incorporen la IA a sus propias aplicaciones.
A partir del 13 de diciembre, los desarrolladores y clientes empresariales podrán acceder a Gemini Pro a través de la API de Gemini en Google AI Studio o Google Cloud Vertex AI. Entre tanto, los desarrolladores de Android tpodrán construir con Gemini Nano.
Gemini Ultra es el primer modelo capaz de superar a expertos humanos en MMLU (comprensión masiva de lenguajes multitarea), utilizando una combinación de 57 áreas del conocimiento como física, historia, matemáticas, medicina, entre otras, para evaluar tanto el conocimiento como las habilidades para resolver problemas, incluso con matices y razonamientos complejos.
“Gemini es el resultado de esfuerzos de colaboración a gran escala por parte de equipos de Google, incluidos nuestros colegas de Google Research”, escribió el director ejecutivo, Sundar Pichai, en una publicación este miércoles.
“Fue construido desde cero para ser multimodal, lo que significa que puede generalizar y comprender, operar y combinar sin problemas diferentes tipos de información, incluidos texto, código, audio, imagen y video”, agregó.
A partir de hoy, el chatbot Bard de Google utilizará Gemini Pro y de esta manera fortalecerá sus capacidades. A inicios de 2024, la compañía lanzará “Bard Advanced”, que utilizará Gemini Ultra, confirmaron ejecutivos en una llamada con periodistas el martes.
Al ser cuestionado durante una rueda de prensa sobre si Gemini tiene alguna capacidad novedosa en comparación con otros LLM actuales, Eli Collins, vicepresidente de producto de Google DeepMind, respondió: “Sospecho que sí”, pero que todavía se está trabajando para comprender las novedosas capacidades de Gemini Ultra.
Collins dijo que Gemini es el modelo de IA más probado que ha construido la compañía y que tiene “las evaluaciones de seguridad más completas” de cualquier modelo de Google.
También manifestó que a pesar de ser su modelo más grande, Gemini Ultra es significativamente más barato de mantener. “No es sólo más capaz, es más eficiente”, afirmó. “Todavía necesitamos una cantidad significativa de computación para entrenar a Gemini, pero nos estamos volviendo mucho más eficientes en términos de nuestra capacidad para entrenar estos modelos”.