Hoy: 22 de noviembre de 2024
Las próximas versiones más avanzadas de Gemini, el conjunto de modelos de lenguaje de gran tamaño desarrollado por Google, serán integradas en dispositivos móviles a partir del próximo año, según los planes de la compañía tecnológica.
Los modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés) son sistemas de inteligencia artificial (IA) que han demostrado tener una capacidad de comprensión y generación de lenguaje muy cercana a la de los humanos. Esta tecnología impulsa tanto el chatbot de Open AI, ChatGPT, como Gemini, el de Google.
Gemini, que Google renombró a principios de febrero para referirse no solo a su chatbot sino también a sus LLM, ofrece una IA multimodal de forma nativa. Esta es capaz de comprender, operar y combinar distintos tipos de información, como texto, código, audio, imagen y vídeo.
La compañía ha desarrollado tres variantes de los modelos Gemini: Nano, Pro y Ultra (Advaced), siendo el primero optimizado para funcionar en dispositivos móviles. De hecho, ya está disponible en algunos modelos Pixel y Samsung Galaxy, donde habilita funciones como Resumir en la aplicación Grabadora y Respuesta inteligente en Gboard.
Gemini Nano también se integrará en dispositivos móviles que utilicen los nuevos procesadores Dimensity 9300 y 8300, según confirmó MediaTek a finales de febrero. Sin embargo, Google va más allá y tiene planes de integrar directamente sus modelos más potentes.
El vicepresidente de la gestión de Producto de Pixel, Brian Rakowski, ha señalado en una entrevista a CNBC que los modelos más avanzados (Pro y Ultra), actualmente accesibles en la nube y que habilitan funciones más complejas y a escala, llegarán a los smartphones el próximo año.
Rakowski afirma que “hemos logrado avances significativos en la compresión de estos modelos para su ejecución en el dispositivo”, y agrega que “ya hemos probado algunos y estamos explorando otros para diversas aplicaciones”.