Musica

Google Gemini: qué es, cómo funciona y cómo probarlo gratis

LaLocura Prensa2 años atrás2 años atrás07 minutos

En esta guía te voy a explicar qué es, para qué sirve y cómo funciona Gemini, el LLM de Google que vas a poder utilizar como asistente en tu móvil o como chatbot en cualquier dispositivo

Si has prestado atención a las últimas noticias del panorama tecnológico, seguro que has oído hablar de Google Gemini. ¿Qué es exactamente? ¿Se trata de una nueva aplicación de Google? En realidad, bajo el paraguas de Gemini se amparan una serie de servicios, herramientas y tecnologías que merece la pena conocer. De hecho, es imposible definir a Google Gemini como una mera app, de igual modo que sucede con su rival directo, ChatGPT.

En los siguientes apartados, te muestro qué es, para qué sirve, cómo funciona y qué pasos debes seguir para probar de forma gratuita Google Gemini. Aunque se trata de una tecnología bastante avanzada, voy a intentar que mis explicaciones sean tan sencillas como sea posible. Así que no te preocupes si no sabes mucho sobre inteligencia artificial o grandes modelos de lenguaje. Sin importar los conocimientos que tengas sobre estos temas, ¡acompáñame en este viaje por la IA de Google!

Qué es Google Gemini

Google Gemini es un modelo de lenguaje grande, algo que inglés conocemos como LLM o Large Language Model. Entraría dentro del campo de la inteligencia artificial conocido como GenAI, es decir, una IA generativa. Se le denomina de esta manera porque es capaz de generar contenido original a partir de una petición del usuario.

Aunque es cierto que Google utiliza la marca Gemini en sus aplicaciones, la verdad es que realmente se refiere al propio modelo. Gemini, simplificando mucho, es el motor capaz de proporcionar funciones a otras aplicaciones. De hecho, ya se rumorea que Apple estaría pensando integrar Gemini en iOS. Por lo tanto, un servicio quizá funcione con este modelo de lenguaje sin ni siquiera mencionar su nombre.

Este es el logotipo de Gemini, el modelo de lenguaje de Google

La presentación de Gemini fue en 2023. Eso no quiere decir que Google iniciara su andadura en la IA generativa en ese momento. Hay que recordar que el chatbot de Gemini sustituyó a Google Bard. En realidad, esta es la evolución de otros modelos que la compañía ya estaba desarrollando, como LaMDA y PaLM. Lo que busca Google con Gemini es competir con GPT-4 de OpenAI, proporcionando prestaciones y herramientas similares a los usuarios.

Cómo funciona Google Gemini

Como ya te he explicado, Google Gemini es el motor que da vida a las funciones de IA de diversas aplicaciones. Es como el modelo de lenguaje de Open AI, GPT-4o. Una cosa es ChatGPT y otra el modelo que le da vida. De hecho, en este chatbot es posible elegir entre diversos modelos y hasta obtener mejores prestaciones a cambio de una membresía de pago.

Insisto en este hecho porque me ayuda a definir cómo funciona Google Gemini. Como cualquier otro LLM, este modelo ha sido entrenado con millones de textos. Esto le permite “entender” el lenguaje humano y replicarlo. Nótese que la palabra entender va entre comillas. Y es que en realidad, una modelo de lenguaje ni entiende, ni comprende, ni sabe lo que escribe. Lo que realmente hace es simular una comprensión del lenguaje humano.

Google Gemini: qué es, cómo funciona y cómo probarlo gratis

Gemini puede funcionar como una app, pero en realidad es un motor que da vida a multitud de servicios

Una de las características de Google Gemini y de otros modelos es que pueden mejorar por sí mismos. Están basados en una red neuronal de tipo transformador que propicia el aprendizaje automático de la máquina. Eso significa que, cuando comete un error y lo detecta, es capaz de corregirlo sin intervención humana.

¿Y cómo es capaz de saber qué tiene que escribir? En esencia, un modelo de lenguaje, como Gemini, funciona gracias al cálculo probabilístico. Es como el teclado predictivo del iPhone o de Gboard, que es capaz de predecir cuál será la siguiente palabra que vas a escribir. La única diferencia es que en este caso existen muchas más variables, una potencia de cálculo muy superior y un conjunto de datos enorme.

Otras características de Google Gemini

Además de todo lo que te he explicado, hay algunos detalles de Google Gemini que creo que te van a interesar. En primer lugar, ha sido diseñado desde cero. Según Google, este modelo de lenguaje no evoluciona a partir de otro, sino que ha sido creado desde cero. Esto es interesante porque nos indica algo importante sobre Gemini: no es un parche para mejorar los modelos anteriores de Google, sino un producto totalmente nuevo.

Gemini mejora en España llegan las extensiones y la app de Android para todos

Panel de Extensiones en Gemini

También destaca por ser multimodal de forma nativa. Que sea multimodal quiere decir que admite distintos tipos de entradas. No solo le vas a poder hacer peticiones en forma de texto. Más bien, tiene la capacidad para entender un dibujo, una imagen o un audio. Por otro lado, el hecho de que este rasgo se haya implementado de forma nativa tiene supuestas ventajas notorias, como que sea mucho más eficiente a la hora de analizar las diferentes peticiones. También puede influir en la precisión de sus respuestas.

Finalmente, Google ha bifurcado Gemini en modelos de distintos tamaños. El objetivo de hacerlo así es disponer de la capacidad para implementar el modelo de lenguaje de manera eficiente en distintos escenarios. Estas son las versiones disponibles por el momento:

Gemini Ultra. Sería el competidor directo de GPT-4 y necesita ejecutarse en la nube. Es la variante que más contexto admite y con más información a su alcance. Es el modelo que Google destina a las tareas más complejas.
Gemini Pro. Es una versión recortada de Gemini Ultra, que a priori también debe ejecutarse en la nube. Podría verse como el competidor directo de GPT-3.5. Es una variante más equilibrada en cuanto a prestaciones.
Gemini Nano. Esta es una de las versiones más interesantes. A pesar de ser la más limitada de todas, no requiere ejecución en la nube. Su punto fuerte es que puede integrarse en dispositivos móviles y que estos dispositivos sean capaces de gestionar las peticiones sin recurrir a un servidor externo.

Dónde probar Google Gemini y cómo hacerlo de forma gratuita

Google Gemini no tiene tanta popularidad como GPT de OpenAI y el archiconocido ChatGPT. De hecho, la podríamos incluir entre esas IA que no tanta gente conoce. De hecho, es posible que su curioso nombre ni siquiera te sonara. Por otro lado, Google también está desarrollando otros proyectos, como Google Gemma, que también tiene sus peculiaridades.

Las funciones incluidas en Gemini Advanced, la versión de pago del chatbot de Google basada en Gemini Ultra 1.0

Si quieres probar Google Gemini de forma gratuita, basta con acudir a la web gemini.google.com. Al hacer clic en este enlace, vas a ir a parar al chatbot homónimo, que te permite interactuar con el modelo de lenguaje. Ahora bien, Google también proporciona complementos para Workspace que integran su IA generativa en las diferentes aplicaciones del paquete. Es ahí donde esta tecnología se transforma, dejando de ser un chatbot y adoptando la forma de un asistente para aplicaciones de ofimática.

Para empezar a hablar con el chatbot, tan solo debes iniciar sesión con tu cuenta de Google. Ten en cuenta que, a medida que envías peticiones, estarás alimentando el entrenamiento del modelo de lenguaje. Así que te recomiendo que evites incluir datos sensibles en tus conversaciones. Por otro lado, si te suscribes, obtienes acceso a Gemini Advanced, que presumiblemente emplea Gemini Ultra para funcionar.