81-El-harness-y-simular-agentes

Publicado el 28 de mayo de 2026 # El harness, en detalle y por qué montar un sistema multiagente es mucho más sencillo de lo que te han contado > [!info] Segunda parte sobre prompts, harness y agentes. Hoy nos centramos en el harness y en qué es un agente. ![](./attachments/81-El-harness-y-simular-agentes-6.webp) En el [post anterior](80-Harness-y-por-que-los-prompts-complejos-pierden-sentido.md) vimos que los prompts complejos han perdido buena parte de su razón de ser, porque los sistemas actuales hacen el trabajo que antes hacía el usuario. Y dejamos caer que lo que hace a esos sistemas más capaces es el *harness*. ## Qué es el harness El modelo de lenguaje no funciona solo. Para hacer algo útil en una tarea real necesita una capa alrededor que le diga qué herramientas puede usar, qué información tiene disponible, cómo ordenar los pasos, cuándo revisar un resultado y cuándo parar. Esa capa es el harness, y es lo que convierte a un modelo que predice texto en un sistema que ejecuta tareas. El harness es, básicamente, todo lo que rodea al modelo. ## Las piezas que tiene un harness ![](./attachments/81-El-harness-y-simular-agentes-4.webp) Un harness típico las siguientes piezas. Conviene saber cuáles son, porque ayuda a entender qué está mejorando cuando decimos "la IA funciona mejor que hace seis meses". ##### 1. Orquestación Coordina los pasos del trabajo. Decide qué se hace primero, qué después y cuándo conviene revisar. ##### 2. Herramientas Acceso a sistemas externos: leer y escribir ficheros, ejecutar código, hacer búsquedas, conectarse a otras aplicaciones. ##### 3. Memoria Lo que el sistema recuerda entre sesiones o entre pasos. Tu perfil, tus preferencias, los proyectos en los que trabajas. ##### 4. Gestión del contexto Qué información entra en cada paso al modelo, qué se descarta y qué se resume. La ventana de contexto es limitada, hay que elegir bien qué cabe en ella. ##### 5. Gestión de errores Qué hacer cuando algo falla: reintentar, pedir confirmación, validar el resultado contra un criterio antes de seguir. ##### 6. Guardarraíles Los límites del sistema. Qué puede hacer y qué no, qué requiere confirmación humana, qué información se queda fuera por motivos de seguridad o privacidad. --- Cuando la IA de hace un año no mantenía bien el hilo de una conversación larga, el problema venía casi siempre del harness gestionando mal el contexto, no del modelo. Cuando ahora la IA recuerda lo que le dijiste hace tres días, eso lo hace el harness con una buena memoria. Cuando hace un año era fácil hacerle el lío a ChatGPT para que explicara cómo hacer un cocktail molotov era porque el modelo no tenía una capa externa de guardarraíles dedicada a detectar y evitar este tipo de peticiones. ## La gestión del contexto, la palanca principal De las seis piezas, la gestión del contexto es la que aporta la mayor mejora la calidad percibida. El modelo trabaja con lo que tiene presente en cada momento: las instrucciones que recibe, los ficheros que ha leído, los resultados de los pasos anteriores, la memoria que el harness ha decidido cargar. Eso es el contexto. Y la ventana de contexto es limitada y cara de usar. Un harness bien diseñado elige en cada paso qué información entra, qué se descarta, qué se resume y qué se recupera desde una memoria externa cuando hace falta. Esa selección es lo que percibes como "la IA mantiene el hilo". Hay sistemas que van un paso más allá: construyen una capa de conocimiento persistente sobre ti. Tu correo, tus ficheros, tu calendario, tus conversaciones anteriores. El contexto no se reconstruye desde cero en cada petición; está disponible como una estructura estable que el harness mantiene actualizada. El efecto es que una petición sencilla produce un resultado bueno, porque el sistema ya sabe quién eres y en qué estás trabajando. ![](./attachments/81-El-harness-y-simular-agentes-5.webp) En el caso de Microsoft 365 Copilot, esta capa está almacenada en el entorno M365 de tu empresa. Es un índice inteligente que se va generando automáticamente. Utiliza los datos del entorno, memoria y va ejecutando un proceso de inteligencia llamado WorkIQ. El resultado es que, con cualquier prompt simple, Copilot parece saber mucho sobre tí, el trabajo que haces, los documentos más relevantes, proyectos en los que estás trabajando, etc. En el caso de Claude Cowork, este contexto se va generando en una serie de ficheros que el propio Claude va almacenando en diferentes rutas, ya sean en la capreta privada de aplicación (memoria) o en la carpeta del proyecto (contexto general). En ambos casos el funcionamiento es automático, pero tú mismo puede pedirle a la IA que almacene o borre determinada información. ## Qué es un agente, revisado ![](./attachments/81-El-harness-y-simular-agentes.webp) Con el harness en la cabeza, la definición de agente deja de ser misteriosa. Un agente son tres cosas: un modelo, un harness y un propósito/comportamiento escrito en texto. El propósito/comportamiento puede ser un fichero de texto en el que describes el rol que asume el agente, los criterios con los que actúa, el tono, el formato de entrega. El entorno con el harness carga ese fichero y se comporta como ese agente. Si cambias el fichero, cambias el agente. Aunque en la imagen Máquina me haya puesto *propósito.txt*, en la práctica se usa el formato Markdown, que es texto plano pero con una cierta estructura jerárquica y posibilidad de darle formato de forma sencilla. > [!important] Desmitificando agentes > Esto tiene una consecuencia práctica: si el comportamiento de un agente es un fichero de texto, cualquier persona que sepa escribir instrucciones puede definir uno. No hace falta código, ni integración técnica, ni un equipo de ingenieros. ## Cómo un buen harness simula un sistema multiagente ![](./attachments/81-El-harness-y-simular-agentes-1.webp) Hace un año, si querías un sistema donde varios "roles" colaboraran en una tarea compleja -por ejemplo, un equipo editorial donde uno estructura las fuentes, otro redacta, otro revisa, otro refina el estilo- la solución técnica era la arquitectura multiagente: varios agentes independientes, cada uno con su harness, hablando entre sí mediante protocolos hechos a medida o con los [nuevos protocolos MCP y A2A](31-Protocolos-MCP-A2A.md) - qué tiempos! Aquella arquitectura trasladaba el trabajo al sistema en vez de eliminarlo. Cada agente exigía su integración técnica. Los protocolos de comunicación entre agentes eran software que alguien tenía que mantener. Y el contexto se perdía por el camino: cada agente conocía su parte, ninguno tenía el cuadro completo. Un harness moderno asume el papel de orquestador por dentro. En vez de varios agentes con harnesses separados hablando entre sí, hay un único entorno con un harness capaz que carga perfiles distintos según la fase del trabajo. En la práctica funciona así: ##### 1. Defines un perfil por rol Cada uno es un fichero de texto que describe qué hace ese agente, con qué criterios, en qué formato entrega. ##### 2. El entorno los activa en el orden adecuado Primero el que estructura, luego el que redacta, luego el que revisa, luego el que refina. ##### 3. El contexto del trabajo está compartido El que redacta ve lo que dejó el que estructuró. El que revisa ve el borrador entero, no un resumen pobre. ##### 4. Cambias el sistema editando ficheros de texto Cambias el orden, ajustas un criterio, añades un rol o quitas uno. Sin tocar código. --- El resultado funcional es el mismo que el de un sistema multiagente clásico (*clásico*, ejem 😉). La diferencia está en el coste: sin código de integración, sin protocolos a mantener, sin contexto perdiéndose entre sistemas separados. ### Mis agentes Para hacerlo concreto: el sistema que uso yo para ayudarme con la newsletter y la web DavidHurtado.ai usa cinco agentes. Me se ayudan a estructurar el material, redactar los primeros borradores, revisarlo con criterio crítico (Torquemada, cómo me odia, pero cuánto le quiero) y refinar el estilo. Son cinco agentes que trabajan coordinados. Pero también son simplemente cinco ficheros de texto que un único entorno ejecuta en secuencia, con el hilo del trabajo intacto de principio a fin. Ese entorno es el harness. El propio harness es capaz de explicarnos e incluso hacernos un gráfico de cómo funciona. ![](./attachments/81-El-harness-y-simular-agentes-7.webp) Cinco agentes IA que trabajan conmigo. Que solo son cinco ficheros de texto que contienen las instrucciones, propósito y comportamiento de cómo me gusta trabajar. --- ## Cuándo sí hace falta la arquitectura multiagente ![](./attachments/81-El-harness-y-simular-agentes-2.webp) Una compleja arquitectura multiagente *tracicional*, con desarrollo a medida, sigue siendo la respuesta correcta en algunos casos: tareas que deben ejecutarse en paralelo real, con agentes corriendo a la vez en máquinas distintas; integraciones con sistemas externos que imponen sus propios protocolos; o volúmenes de trabajo y exigencias de latencia que un solo entorno no puede absorber. Para el trabajo personal, profesional individual o de equipos pequeños, esta capa de complejidad es innecesaria en casi todos los casos. Un buen harness y unos cuantos ficheros de texto cubren el terreno. ## Qué queda en manos del usuario ![](./attachments/81-El-harness-y-simular-agentes-3.webp) Si el harness asume la orquestación, la gestión del contexto y la ejecución en varios pasos, al usuario le quedan dos tareas: definir bien los propósitos y comportamientos -los ficheros que describen cada agente- y validar el resultado final. La validación es la parte que no se puede delegar. El harness puede ejecutar cien pasos solo, pero alguien tiene que revisar lo que sale, detectar lo que no está bien y decidir si publicar, usar o descartar. Ese criterio es el que decide si el sistema trabaja para ti o te produce trabajo. Validar el resultado final. Ese es el verdadero trabajo diario nuestro. Validar, refinar, pedir correcciones. Guiar a nuestros agentes. Si tienes miedo a que la IA te quite el trabajo, piensa lo siguiente: el día que dejes de validar exhaustivamente el trabajo de la IA, ese día empiezas a ser irrelevante. Queda una pregunta que cierra esta serie: cómo se escribe el propósito de un agente para que el sistema haga lo que necesitas. En algún momento futuro, os lo contaré. --- Publicado el 28 de mayo de 2026, [LinkedIn](https://www.linkedin.com/pulse/el-harness-en-detalle-y-por-qu%C3%A9-montar-un-sistema-es-de-david-srlye), [Substack](https://open.substack.com/pub/davidhurtado/p/el-harness-en-detalle-y-por-que-montar?r=4uyjfg&utm_campaign=post&utm_medium=web&showWelcomeOnShare=true), [X](https://x.com/dhtoran/status/2059875841136365591?s=20)