Gemini 1.5 Pro, la más reciente versión del modelo de inteligencia artificial (IA) de Google, ya está disponible para el público en general en Google AI Studio, la plataforma para desarrolladores de la empresa para crear prototipos de IA generativa y probarlos.
Descrito por el gigante tecnológico como un "modelo multimodal de tamaño mediano optimizado para escalar en una amplia gama de tareas", fue lanzado a mediados del mes pasado y hasta ahora solo estaba habilitado para un grupo limitado de desarrolladores y clientes. Quienes querían solicitar acceso debían unirse a una lista de espera seleccionada.
Actualmente en versión preliminar, y diseñado para ser un reemplazo directo de Gemini 1.0 Pro, se destaca por la capacidad de datos que puede procesar. Presenta una ventana de contexto (cantidad de información pasada que un modelo puede tener en cuenta al generar respuestas) capaz de recordar y considerar un millón de tókenes (unidades básicas de información).
Según Google, esta ventana de contexto —aún en estado experimental— es "más larga que cualquier modelo de base a gran escala". "Hasta hoy, la ventana de contexto más grande del mundo para un modelo de lenguaje grande disponible públicamente era de 200.000 tókenes", precisó la empresa. Esta característica le permite procesar unas 700.000 palabras o 30.000 líneas de código de una sola vez. Además, dado que se trata de un modelo multimodal, puede absorber hasta 11 horas de audio o una hora de vídeo en una variedad de idiomas diferentes.
A pesar de sus características, Gemini ha sido foco de titulares, y no precisamente por sus ventajas. En febrero, el chatbot estuvo en el foco de las críticas luego de que su función de generación de imágenes de personas creara representaciones históricamente inexactas y racialmente diversas que llevaron a algunos usuarios indignados a decir que la compañía era racista contra los blancos. Esta situación obligó a Google a pausar dicha tecnología.
Si te ha gustado, ¡compártelo con tus amigos!