20 de noviembre de 2024 > [!abstract] ¿de qué va esto? > Con tanto anuncio en el mercado y en Microsoft Ignite sobre **agentes**, vamos a explicar de forma súper simple (y no oficial) qué es un agente, viéndolo como la evolución del asistente de IA. # Evolución del asistente al agente en 6 pasos ## Asistentes ### 1. Modelo de lenguaje ![](Asistentes%20y%20agentes%201.png) Primero, asistentes con IA generativa donde simplemente interactuamos con un modelo de lenguaje. Está guay, casos de uso de manejo de lenguaje, ideación, brainstorming, pero bastante limitado por no tener más contenido o datos que lo que el modelo de lenguaje puede tratar. Si quiero trabajar sobre datos, tengo que copiárselos y pegárselos yo. ### 2. Modelo de lenguaje multimodal ![](Asistentes%20y%20agentes%202.png) Segundo, más interesante, cuando los modelos empiezan a ser multimodales y aceptan otros tipos de contenido, como documentos o imágenes. Aquí el caso estrella es darle un documento o una foto, y mantener una conversación alrededor del mismo. ### 3. Modelo de lenguaje con acceso a datos ![](Asistentes%20y%20agentes%203.png) Tercero, el caso al que casi todas las empresas se han metido de cabeza: RAG, o Retrieve Augmented Generation. Dotar al modelo de la capacidad de acceder a una fuente de contenidos, ya sea una librería de documentos, una base de datos. Copilot para Microsoft 365 tiene conexión con los datos del entorno corporativo de ofimática (email, calendario, documentos, etc). Un proyecto a medida podría estar conectado al gestor documental de la compañía. **** Aquí el caso se trata de mantener conversaciones con los datos. > [!warning] ojo con este caso > Funciona, pero si la fuente de documentos es muy grande o heterogénea, puede ser complejo técnicamente (por la búsqueda semántica, no tanto por la IA). El problema es que venimos de probar adjuntándole un PDF a Copilot o a ChatGPT y eso sí que funciona muy bien. El otro caso sería que el asistente esté conectado a Internet y tenga la capacidad de buscar. Esto es como empezó Copilot web (el gratis), Perplexity o recientemente ChatGPT. El caso aquí es más interesante de lo que parece. Pasamos de buscar nosotros mismos en Internet **a delegar la tarea al asistente**. La IA realiza la búsqueda por nosotros, se lee los resultados, decide cuáles son los mejores, y nos los explica en nuestro idioma y nuestro contexto. ## Agentes En todos los casos anteriores, el asistente es algo genérico. Tendrá acceso a datos y podrá usar esa fuente para las respuestas, pero sigue siendo algo genérico. **El conocimiento empieza desde cero en cada conversación**. La idea del agente es el siguiente paso: que se pueda personalizar tanto el **conocimiento** de partida, como el **comportamiento**, y además dar al asistente la posibilidad de ejecutar **acciones**. Y así nacen los agentes, como evolución de los asistentes. ### 4. Conocimiento y comportamiento ![](Asistentes%20y%20agentes%20-%20conocimiento.png) El primer punto básico sería personalizar el conocimiento y el comportamiento, de tal forma que cada conversación con el agente no parte de cero. Por ejemplo, si hablamos de ámbito legal, no se trata de "*mantener una conversación con chatgpt alrededor de un documento legal*", sino de "*mantener una conversación con un asistente que se comporta como un abogado y tiene acceso a toda la información legal de la compañía*". Esto podría ser visto como un proyecto de asistente con RAG, el punto 3 más arriba. Es cierto, pero la gracia del modelo de agente es que sea *el usuario final el que configura el agente*. Por ejemplo, sería un abogado el que configuraría en minutos este agente legal. Pero, efectivamente no es más que evolución de la tecnología. El paso adelante aquí es la herramienta de usuario final para configurar el agente. ### 5. Acciones ![](Asistentes%20y%20agentes%204.png) El siguiente paso, y este es diferencial, es la automatización. Dotar al agente de capacidad de ejecutar acciones. Ya no se trata únicamente de responder preguntas o mantener conversaciones, sino transaccionar. Y no necesariamente acciones puntuales, sino procesos de larga duración. Por ejemplo, podrías configurar un agente para que busque información para un determinado trámite, y el agente podría buscarse la vida manteniendo conversaciones con personas por chat o por email, y buscar documentos, y venir cierto tiempo después con la información consolidada. Similar al caso del asistente conectado a Internet, donde tú ya no haces la búsqueda, sino que la delegas a la IA, aquí tendríamos un salto parecido. Ya no hacemos todo el proceso, le pedimos al asistente que lo haga él. ### 6. Agentes autónomos ![](Asistentes%20y%20agentes%20-%20autónomos.png) El caso del agente autónomo es interesantísimo: imagina que todo el proceso de automatización no se inicia o forma parte de una conversación o petición al agente, sino que le configuras un *trigger* o disparador. Aquí, instruyes al agente para que, cada vez que ocurra algo en algún sitio, arranque un proceso y realice una serie de acciones. Con opción de validación humana como parte del proceso. Un caso súper simple que ha presentado Microsoft en Ignite es de algo llamado *Copilot Actions*. Fijaos que, partiendo de una plantilla estándar, se configura un flujo que - Se ejecuta el lunes a las 09:00 - Manda mensajes de Teams a varios usuarios pidiéndoles información sobre el estado de un proyecto. - Envía un email de resumen el viernes por la mañana al creador del flujo. - Se repite todas las semanas :-) ![](Asistentes%20y%20agentes%20-%20Copilot%20Actions.png) O sea, *ha delegado a la IA la tarea de recopilar información por chat*. Ha delegado conversaciones tediosas. El resto de los casos empresariales, pues os podéis imaginar: cualquier proceso repetitivo que involucre capacidades cognitivas básicas (de las que la IA ya hace mejor que nosotros) se podría automatizar completamente. Si el proceso requiere validación humana, no hay problema, se incluye como parte del proceso. Automatización. Ahí estamos con la revolución de la IA a finales de 2024 # Relacionados ## Píldoras La píldora sobre [Del asistente de productividad al agente autónomo](3-Productividad-y-agentes.md), pasando por el orquestador. ## Vídeos Esta píldora tiene un vídeo asociado, aquí --> [Agentes, evolución de los asistentes](1-Agentes-video.md)