# Basics 4 - ¿Cómo funciona un LLM? ## Pregunta/respuesta ![[Basics 4 - Cómo funciona 1.png]] Bien, vamos a ver cómo funciona la inteligencia artificial generativa. Vamos a hablar sobre los modelos más básicos, los modelos de lenguaje. O mejor dicho, "grandes modelos de lenguaje". Quizá habréis oído llamarlos LLMs, las siglas del inglés Large Languaje Models. Un modelo de lenguaje es un modelo de inteligencia artificial capaz de crear contenido. Le haces una pregunta, y el modelo crea la respuesta. No la busca, sino que la crea al vuelo. ## Procesar y generar contenido. Leer y escribir ![[Basics 4 - Cómo funciona 2.png]] Y no funciona simplemente con preguntas y respuestas. Le puedes pasar un texto largo y pedirle, por ejemplo, un resumen. El modelo se lee el texto y crea el resumen. Digamos que el modelo parece entender muy bien todo el contenido escrito que le das, y es capaz de crear la respuesta. Sabe leer y escribir. Como si fuera una persona. Esto es una simplificación extrema. En la Píldora 1 ya comentábamos que estos modelos son capaces de mantener conversaciones naturales --> [¿Qué es la IA generativa?](1-IA-generativa.md) ## Modelos de predicción de palabras ![[Basics 4 - Cómo funciona 3.png]] La gracia es que, para crear estos modelos, hay usado datos de entrenamiento para crear un modelo capaz de predecir palabras. En modelo, en esencia, recibe la pregunta o la entrada, y simplemente hace una predicción de "cuáles son las mejores palabras que van a continuación". Esto es una simplificación burda, pero realmente es así: el modelo únicamente predice palaras, es un modelo predictivo. ## Tokens ![[Basics 4 - Cómo funciona 4.png]] Para la predicción de palabras, lo que hace el modelo es traducir la entrada a *tokens*. Los tokens son una representación matemática del lenguaje. Luego hace la predicción, en tokens, y de nuevo los convierte de nuevo a palabras. Esto de usar tokens para obtener una representación matemática de palabras es la forma que tienen los modelos de realizar operaciones matemáticas y de predicción. No es importante para nosotros ahora, pero servirá en la siguiente píldora para enteder la multimodalidad. ## Fuerza bruta: de predicción de palabras a manejo del lenguaje ![[Basics 4 - Cómo funciona 5.png]] El caso es que, y aquí viene otra característica de la inteligencia artificial generativa, el modelo ha sido entrenado con un volumen de datos enorme. Absúrdamente grande. Tan grande, y aquí viene la genialidad, que pasa de predecir palabras a "manejar el lenguaje". Pasa de simples preguntas y respuestas a "mantener conversaciones coloquiales". Esto es debido a la arquitectura interna de los algoritmos, que utiliza algo llamado "transformers", que permite este entrenamiento con volúmenes gigantes de datos. Pensad que han entrenado a los modelos GPTs con "todo el contenido que han podido recuperar de Internet". Y el resultado es un modelo que maneja el lenguaje igual o mejor que una persona, y que tiene un buen conocimiento general del mundo. # Relacionados ## Píldoras Píldora anterior: [Como una persona](3-como-una-persona.md) Siguiente píldora: [Multimodalidad](5-multimodalidad.md) ## Vídeos Esta píldora también acabó en un vídeo de AvatarDavid --> [Vídeo Como funciona](4-como-funciona-video.md)