5 de abril de 2026
# Mapping AI into Production - Resumen estructurado con reflexiones

Este paper es parte del material fuente que me está ayudando en workshops de creación de valor con IA en empresas.
> [!example]+ Resumen estructurado con reflexiones
> ## Índice del documento
>
> **Mapping AI into Production: A Field Experiment on Firm Performance** _(Kim, Kim & Koning - INSEAD/HBS, marzo 2026)_
>
> 1. Introduction
> 2. The Mapping Problem
> 3. Empirical Context
> - 3.1 Sample selection
> - 3.2 Experimental Design
> - 3.2.1 Randomization
> - 3.2.2 Treatment Intervention: Mapping AI into Production
> 4. Data and Empirical Specification
> - 4.1 Data
> - 4.2 Outcome Measures
> - 4.3 Empirical Specification
> 5. Results
> - 5.1 Do treated firms change how they use AI?
> - 5.2 Does treatment change what tasks firms complete?
> - 5.3 Does treatment impact firm performance?
> - 5.4 Do treated firms think differently about the inputs they need?
> - 5.5 Alternative explanations for the performance effects
> - 5.6 How do treated firms map AI into their production processes?
> - 5.7 Who benefits from mapping AI into production?
> - 5.8 Estimating the firm-level returns to AI use
> 6. Discussion
> 7. Appendix
> - 7.1 Accounting for Spillovers
> - 7.2 Coding Decisions for Human Coders (7.2.1 AI Use Cases / 7.2.2 Tasks)
> - 7.3 AI Use Cases Topic Analysis
> - 7.4 Appendix Tables & Figures
>
> ---
>
> ## Resumen global
>
> Un experimento controlado con 515 startups demuestra por primera vez causalmente que la IA mejora el rendimiento a nivel de empresa, no solo en tareas individuales. El hallazgo central no es que la IA funcione, sino _por qué no funciona_ cuando no funciona: las empresas buscan demasiado localmente y no descubren dónde la IA crea valor real en su proceso productivo. Las que recibieron información sobre cómo otras firmas habían reorganizado su producción en torno a la IA encontraron un 44% más de casos de uso, completaron más tareas, consiguieron más clientes y generaron 1,9 veces más ingresos. La restricción no es el acceso a la tecnología -ambos grupos tenían las mismas herramientas- sino la capacidad de descubrir dónde y cómo desplegarla. El bottleneck es cognitivo y directivo, no técnico.
>
> ---
>
> ## 1. Introduction
>
> ### Resumen conciso
>
> La productividad de la IA a nivel de tarea está bien documentada, pero su traslación a resultados de empresa no. Este paper aborda esa brecha mediante un experimento de campo que aísla un punto de dolor específico: el _mapping problem_, la dificultad de descubrir dónde y cómo la IA crea valor dentro del proceso productivo de una empresa.
>
> ### Resumen estructurado
>
> - **Paradoja de partida:** evidencia abundante de ganancias de productividad en tareas (Brynjolfsson, Noy & Zhang, Dell'Acqua), pero esas ganancias no se agregan a resultados de empresa - patrón ya visto con otras tecnologías de propósito general (electricidad, internet)
> - **Hipótesis central:** el bottleneck no es la tecnología sino la búsqueda de dónde aplicarla
> - **El _mapping problem_ definido:** descubrir dónde y cómo la IA crea valor dentro del proceso productivo específico de cada empresa
> - **Diseño del experimento:** 515 startups de alto crecimiento en aceleradora global. El grupo tratado recibe información sobre cómo otras empresas han reorganizado su producción en torno a la IA
> - **Resultados principales anunciados:**
> - +44% más casos de uso de IA
> - +12% más tareas completadas
> - +18% más probabilidad de conseguir clientes de pago
> - 1,9x más ingresos
> - -39,5% menos demanda de capital externo
> - **Tres contribuciones declaradas:**
> 1. Primera evidencia causal de que ganancias en tareas se agregan a nivel empresa
> 2. La restricción es el _search_ sobre dónde desplegar la IA, no el acceso
> 3. La IA reshapea cómo escalan las empresas (más output con mismos inputs)
>
> ### Reflexión
>
> Este paper hace algo que la mayoría de la investigación sobre IA evita: separar "tener acceso" de "saber dónde usarla". La mayoría de debates sobre adopción de IA en empresas giran en torno a coste, habilidades técnicas o resistencia al cambio. Aquí se demuestra que dos empresas con las mismas herramientas, el mismo presupuesto y la misma formación técnica pueden obtener resultados radicalmente distintos según cómo buscan. Es una llamada de atención directa a quienes diseñan programas de adopción de IA: dar acceso a la tecnología es condición necesaria pero no suficiente. La pregunta no es "¿tienes IA?" sino "¿sabes dónde mirar?".
>
> ---
>
> ## 2. The Mapping Problem
>
> ### Resumen conciso
>
> El problema no es solo adoptar IA, sino descubrir qué actividades específicas dentro de tu proceso productivo pueden mejorarse con ella y cómo deben cambiar las actividades adyacentes para que el beneficio se materialice. Sin resolver ese problema de búsqueda, las ganancias en tareas individuales no llegan al resultado final.
>
> ### Resumen estructurado
>
> - **Por qué el mapping es difícil - tres razones:**
> 1. Las capacidades de la IA son desiguales e impredecibles: incluso expertos no aciertan dónde la IA ayuda
> 2. El espacio de búsqueda es enorme: cualquier empresa podría aplicar IA en docenas de actividades
> 3. Las complementariedades lo complican: automatizar solo una parte puede preservar el cuello de botella en lugar de eliminarlo
> - **Patrón de búsqueda por defecto:** las empresas se quedan con lo obvio (chatbot de soporte, LLM para emails); las aplicaciones de mayor valor que requieren repensar cómo se organiza el trabajo no se descubren
> - **Ejemplo ilustrativo del paper:** una empresa que usa IA para acelerar el desarrollo de producto pero no replantea cómo identifica qué quieren los clientes simplemente construye el producto equivocado más rápido. El cuello de botella se desplaza, no desaparece
> - **Distinción clave:** el _mapping problem_ es una fricción de descubrimiento, no de acceso. Dos empresas con herramientas idénticas pueden obtener retornos muy distintos si una busca más ampliamente
> - **Diferencia con el debate habitual:** la literatura y la política pública se centran en acceso y habilidades técnicas; este paper señala un bottleneck anterior: antes de invertir en rediseño de procesos, hay que descubrir _dónde_ están las complementariedades
>
> ### Reflexión
>
> Este apartado formaliza algo que cualquier consultor con experiencia real intuye: la mayoría de empresas no fracasan en la adopción de IA porque la tecnología no funcione, sino porque no saben dónde mirar. Y cuando miran, miran cerca - en lo familiar, en lo visible, en lo que ya hacen. La analogía con Alexander o con los EIP de Hohpe & Woolf es inevitable: el valor no está en el patrón individual sino en la red de relaciones entre actividades. Una empresa que automatiza contabilidad pero deja intacto el flujo de aprobaciones está eliminando síntomas, no causas. El concepto de _mapping problem_ tiene nombre propio ahora, y eso importa.
>
> ---
>
> ## 3. Empirical Context / 3.1 Sample / 3.2 Experimental Design
>
> ### Resumen conciso
>
> El experimento se realiza dentro de una aceleradora virtual global de tres meses (INSEAD, 515 startups). El grupo tratado recibe casos de estudio sobre cómo empresas nativas de IA han reorganizado su producción, con acceso a los mismos recursos técnicos y mentores que el grupo control. La aleatorización estratificada garantiza comparabilidad inicial entre grupos.
>
> ### Resumen estructurado
>
> - **Contexto:** _AI Founder Sprint_ - aceleradora virtual global, 3 meses, INSEAD
> - **Muestra:** 515 startups de fase pre-seed a seed de todo el mundo
> - 33,8% Oriente Medio y África / 23,6% Asia-Pacífico / 22,3% Europa / 20,2% Américas
> - Mediana: fundada en 2024, equipo de 4 personas
> - El 52,6% había lanzado producto; el 55,3% tenía clientes; ingresos mensuales medianos: $1.000
> - **Componentes compartidos por todos los grupos:**
> - ~$25.000 en créditos API y herramientas (Google Cloud, OpenAI, NVIDIA, Manus AI)
> - Formación técnica semanal: RAG, agentes, vibe-coding, prototipado rápido
> - Demo Days, VC Week, reportes semanales de progreso
> - **Lo que varía (solo para el grupo tratado):**
> - Workshops con casos de estudio sobre empresas que han reorganizado producción en torno a IA
> - Los casos van más allá de "qué herramientas usar" - muestran cómo cambia la estructura productiva completa
> - Cuatro casos principales: Gamma (product dev), Ryz Labs (prototipado paralelo), FazeShift (automatización AR), Ranger (modelo de negocio servicios → producto)
> - **Diseño de aleatorización:** estratificado por geografía, tracción inicial y uso de IA previo → 32 estratos, mínimo 6 empresas cada uno → 255 tratadas / 260 control
> - **Protección contra spillovers:** grupos separados en plataforma, chat deshabilitado en sesiones conjuntas
>
> ### Reflexión
>
> El diseño experimental es elegante porque aísla exactamente lo que quiere medir: no el efecto de tener acceso a IA (ambos grupos lo tienen), sino el efecto de recibir marcos conceptuales y ejemplos de reorganización productiva. Es, en esencia, un experimento sobre si el conocimiento de cómo otros han resuelto el problema de búsqueda reduce la fricción cognitiva de resolver el tuyo propio. La elección de startups es estratégica: tienen menos inercia organizativa que empresas grandes, así que si el problema aparece aquí, en grandes empresas es peor. El hecho de que los efectos no dependan del background técnico del fundador es especialmente revelador - no es un problema de habilidad, es un problema de dónde miras.
>
> ---
>
> ## 4. Data and Empirical Specification
>
> ### Resumen conciso
>
> Los datos principales son reportes semanales estructurados de cada startup a lo largo del programa: casos de uso de IA nuevos, tareas completadas, métricas de tracción. Todo codificado por pares de revisores humanos independientes. La especificación central es intención de tratar (ITT) con efectos fijos de estrato, complementada con regresiones de variables instrumentales para estimar el retorno por caso de uso.
>
> ### Resumen estructurado
>
> - **Fuentes de datos:**
> - Materiales de aplicación (pre-tratamiento): baseline de características de empresa y fundador
> - Reportes semanales de progreso (WPR): fuente principal - clientes, ingresos, costes, inversión, casos de uso de IA, tareas, demos, pitches
> - Datos de proceso y engagement: asistencia, transcripciones de reuniones grupales
> - **Variables de resultado principales:**
> - Casos de uso de IA (acumulados, validados por codificadores humanos independientes)
> - Tareas completadas (internas vs. externas)
> - Venture Progress Index: suma de 4 indicadores binarios (producto lanzado, clientes, ingresos, inversión), estandarizado
> - Ingresos y inversión totales (transformación log)
> - Demanda de capital (capital ask para Demo Day) y demanda de trabajo (puestos solicitados)
> - **Procedimiento de codificación:** dos codificadores independientes + tercero para desacuerdos, ciegos a condiciones experimentales
> - **Especificación principal:** OLS con efectos fijos de estrato, errores estándar clusterizados a nivel empresa
> - **Especificación IV (2SLS):**
> - Primera etapa: tratamiento → casos de uso de IA
> - Segunda etapa: casos de uso de IA predichos → resultados
> - Permite estimar retorno marginal por caso de uso adicional
>
> ### Reflexión
>
> La riqueza del dato es inusual en este tipo de estudios: no hay una encuesta de satisfacción al final, hay ocho semanas de reportes estructurados con métricas concretas y texto libre analizado cualitativamente. La decisión de usar codificadores humanos para validar los casos de uso - en lugar de confiar únicamente en el autoreporte - añade credibilidad metodológica real. Y el uso de variables instrumentales para ir más allá del ITT es el movimiento correcto: no solo importa si el tratamiento funcionó, sino cuánto vale cada caso de uso adicional. Ese número ($0,23 de incremento en log-ingresos por caso de uso) es el que debería aparecer en las presentaciones a directivos.
>
> ---
>
> ## 5.1 Do treated firms change how they use AI?
>
> ### Resumen conciso
>
> Sí. El grupo tratado descubrió un 44% más de casos de uso de IA y los distribuyó en más funciones de la empresa. Los mayores incrementos se concentraron en desarrollo de producto, diseño estratégico y operaciones - las áreas que requieren repensar cómo se organiza el trabajo, no simplemente añadir una capa de IA sobre lo que ya existe.
>
> ### Resumen estructurado
>
> - **Incremento cuantitativo:** 8,8 casos de uso vs. 6,1 en control → +2,7 casos de uso (+44%)
> - **Incremento cualitativo:** +0,84 categorías funcionales distintas donde se aplica IA
> - **Distribución por categorías (mayores diferencias):**
> - Desarrollo de producto: +0,67*** (prototipar, construir más rápido)
> - Diseño de producto/estrategia: +0,41** (IA como parte del producto, decisiones estratégicas)
> - Operaciones internas: +0,47*** (automatización de flujos de trabajo)
> - Menor diferencia en: research/legal/writing y ventas
> - **Patrón de evolución:** el gap se abre a partir de la semana 3 (inicio del tratamiento) y crece acumulativamente - no es un salto puntual sino descubrimiento continuo
> - **Herramientas usadas:** ambos grupos usan las mismas herramientas en proporción similar. El tratamiento cambia _dónde_ se usa IA, no _qué_ herramientas se usan
> - **Interpretación clave:** el tratamiento expande tanto la IA como input de proceso (el equipo construye más rápido) como IA como output de producto (la IA llega al cliente final)
>
> ### Reflexión
>
> El dato sobre herramientas es el más subversivo de este apartado: control y tratados usan ChatGPT, Claude, Gemini, n8n en proporciones muy similares. La diferencia no está en la caja de herramientas, está en la pregunta que se hacen antes de abrirla. Las empresas que vieron ejemplos de cómo otros habían reorganizado su producción empezaron a preguntarse "¿y si aquí también?" en partes del negocio que antes ni consideraban. Esto tiene implicaciones directas para formación corporativa: dar acceso a herramientas sin dar marcos de búsqueda es casi tan inútil como no dar las herramientas.
>
> ---
>
> ## 5.2 Does treatment change what tasks firms complete?
>
> ### Resumen conciso
>
> Las empresas tratadas completaron significativamente más tareas internas - construcción de producto, prototipado, análisis - sin diferencia en tareas externas. La IA cambia lo que las empresas pueden construir, no cuántas reuniones con clientes o inversores tienen.
>
> ### Resumen estructurado
>
> - **Total de tareas:** 20,9 (tratadas) vs. 18,5 (control) → +2,3 tareas (+12%)
> - **Desglose:**
> - Tareas internas: +2,2 tareas sobre una media de control de 9,8 → +22% (p<0,01)
> - Tareas externas: diferencia no significativa
> - **Por qué tiene sentido:** la aceleradora ofrecía las mismas oportunidades de contacto con inversores y clientes a ambos grupos. Lo que la IA cambia es la capacidad de producir - el cuello de botella estaba en construir, no en salir al mercado
> - **Evidencia cualitativa de fundadores tratados:**
> - IA como "multiplicador de fuerza", no sustituto de expertise
> - Producción interna antes externalizada ahora se hace in-house con IA
> - Necesidad percibida de equipo disminuye
>
> ### Reflexión
>
> El hallazgo de que el efecto se concentra en tareas internas y no en externas es una confirmación elegante del diseño: el tratamiento no mejoró la capacidad de vender o de hablar con inversores (eso dependía de otros factores), mejoró la capacidad de construir. Y eso es exactamente lo que predice la teoría del _mapping problem_: si reduces el cuello de botella en producción, produces más. Lo que no miden aquí - y sería interesante - es si la calidad de lo construido también cambió, o solo la cantidad.
>
> ---
>
> ## 5.3 Does treatment impact firm performance?
>
> ### Resumen conciso
>
> Sí, con impactos significativos en los indicadores de tracción más importantes. Las empresas tratadas tienen más probabilidad de conseguir clientes de pago (+18%) y generan 1,9 veces más ingresos. Los mayores efectos aparecen en la cola alta de la distribución - la IA expande el techo de lo que las mejores empresas pueden conseguir, no eleva uniformemente la media.
>
> ### Resumen estructurado
>
> - **Venture Progress Index:** +0,16 desviaciones estándar (p<0,05)
> - **Producto lanzado:** +4,7 puntos porcentuales (p<0,1)
> - **Clientes de pago:** +11 p.p. → +18% (p<0,01) - el efecto más robusto
> - **Ingresos totales:** 1,9x mayor en media; 2,2x mayor condicionado a tener ingresos
> - **Inversión:** sin efecto estadísticamente significativo en promedio
> - **Distribución de efectos - análisis de cuantiles:**
> - En ingresos: efectos mínimos hasta el percentil 80; salto importante en percentil 90-95
> - En inversión: patrón similar - los tratados en la cola alta levantan sustancialmente más capital
> - Esto es consistente con IA ampliando el techo de lo posible, no mejorando resultados marginales
> - **Sin efectos en pivotes ni cierres:** la mejora no viene de reinvenciones o cierre de empresas que empiezan de cero
>
> ### Reflexión
>
> El patrón de cola alta es el resultado más importante y menos discutido de este paper. No es que la IA mejore a todo el mundo un poco - es que eleva el techo de lo que los mejores pueden conseguir. Eso tiene implicaciones directas para cómo pensar en IA en empresas establecidas: el valor no está distribuido uniformemente. Las empresas que resuelven el _mapping problem_ en profundidad no sacan un 10% más, sacan un orden de magnitud más. Y las que no lo resuelven apenas notan diferencia. Esto debería cambiar cómo se evalúan los programas de adopción de IA - no por la mejora promedio, sino por qué pasa en la cola alta.
>
> ---
>
> ## 5.4 Do treated firms think differently about the inputs they need?
>
> ### Resumen conciso
>
> Las empresas tratadas crecen más pero demandan menos capital externo - un 39,5% menos. La demanda de trabajo no cambia. La IA parece cambiar la percepción de cuántos recursos necesitas para construir, no solo tu capacidad productiva.
>
> ### Resumen estructurado
>
> - **Demanda de capital (capital ask para Demo Day):**
> - -$224.000 en nivel absoluto → -39,5% (p<0,05)
> - El efecto es robusto a distintas transformaciones y niveles de winsorización
> - Por cuantiles: la mayor reducción en el ask está por encima del percentil 60 - los que más pedían ahora piden menos
> - **Demanda de trabajo:** sin cambios significativos ni en volumen total ni en perfiles técnicos
> - **Paradoja aparente:** en la cola alta de inversión levantada, los tratados levantan _más_ - pero esto refleja su atractivo para inversores, no que necesiten más capital
> - **Interpretación:** los fundadores tratados creen que pueden hacer más con menos. Eso es un cambio cognitivo, no solo operativo
>
> ### Reflexión
>
> Este es el resultado más contraintuitivo y potencialmente el más importante para el debate sobre el impacto de la IA en la economía. Si las empresas nativas de IA crecen más y necesitan menos capital, la estructura de la financiación de startups cambia. Si no necesitan contratar tanto, el modelo de "escala = headcount" quiebra. Y si todo eso se confirma a mayor escala, estamos ante un cambio en la relación entre crecimiento y recursos que ningún modelo económico anterior ha visto. No es solo eficiencia - es una reconfiguración de qué significa escalar.
>
> ---
>
> ## 5.5 Alternative explanations for the performance effects
>
> ### Resumen conciso
>
> Los autores descartan sistemáticamente explicaciones alternativas: no hay diferencias en motivación entre grupos, no hubo spillovers de información entre tratados y control, y los resultados están impulsados por cambios en el uso de IA, no por factores ajenos a ella.
>
> ### Resumen estructurado
>
> - **Efecto Hawthorne descartado:**
> - Las tasas de respuesta semanal son prácticamente idénticas entre grupos (sin diferencias significativas en ninguna semana)
> - El análisis de sentimiento (VADER y RoBERTa) sobre textos libres no muestra diferencias en afecto o motivación
> - **Spillovers descartados:**
> - Plataforma con grupos completamente separados, sin posibilidad de interacción
> - Chat deshabilitado en sesiones conjuntas
> - Cero fundadores del grupo control mencionaron sesiones exclusivas del grupo tratado cuando se les preguntó
> - Registros de asistencia de Zoom verificados: ningún control asistió a sesiones exclusivas de tratados
> - **Canal de IA confirmado:** las diferencias en resultados están vinculadas a los cambios en casos de uso de IA, haciendo improbable que canales no relacionados con IA expliquen los efectos
>
> ### Reflexión
>
> La robustez metodológica de este apartado es lo que convierte el paper en referencia. No es un estudio observacional con variables de control - es un experimento aleatorio con verificación de los principales riesgos de contaminación. El hecho de que ni un solo fundador del grupo control haya mencionado las sesiones exclusivas del tratado al preguntarles qué echaron de menos es una validación empírica sólida. En investigación sobre IA, donde la mayor parte de la evidencia es correlacional, esto tiene peso.
>
> ---
>
> ## 5.6 How do treated firms map AI into their production processes?
>
> ### Resumen conciso
>
> Los casos documentados muestran un patrón común: el valor no viene de usar IA en un paso aislado, sino de identificar dónde IA puede remodelar la cadena de valor completa - y actuar en consecuencia. El cambio es cognitivo antes que técnico: pasar de ver la IA como herramienta para tareas existentes a verla como forma de repensar cómo se produce valor.
>
> ### Resumen estructurado
>
> - **Patrón 1 - Prototipado sin equipo especializado:**
> - Una plataforma de licitaciones construyó un pipeline completo (clasificación → compliance → pricing) sin contratar talento técnico
> - Resultado: $0 → $40K en ingresos durante el programa, 4 clientes de pago
> - **Patrón 2 - Reemplazo del "pegamento humano" entre sistemas:**
> - Empresa de servicios de campo: 5 roles comprimidos en módulos de IA (clasificador de intención, normalizador de datos, motor de recordatorios de pago)
> - Fintech con 2.500 clientes: KYC, call center y entrevistas de contratación → IA; +20% base de clientes con reducción de costes
> - **Patrón 3 - Operar a escala o en mercados antes inviables:**
> - Salud materna: intake clínico de 1 hora → chatbot de WhatsApp en 8 minutos
> - Control de calidad en comercio: pipeline multimodal → reducción del 70% en inspección manual; de 2 a 40 clientes
> - Transporte médico: despacho reactivo → enrutamiento predictivo por IA; 60% de reservas gestionadas por IA
> - **Elemento común en todos:** el paso clave no fue aprender a usar IA, sino reconocer dónde podía remodelar la creación de valor - un cambio de perspectiva, no de habilidad técnica
>
> ### Reflexión
>
> Los casos documentados en este apartado son el corazón práctico del paper. No son experimentos de laboratorio - son empresas reales que en 10 semanas comprimieron meses de trabajo y mercados que antes eran inaccesibles. Lo que los une no es la sofisticación técnica sino la pregunta que se hicieron: ¿qué pasaría si replanteamos todo este flujo desde cero con IA? La empresa de transporte médico que pasó de despacho reactivo a posicionamiento predictivo no hizo ingeniería compleja - hizo la pregunta correcta. Y eso es exactamente lo que el tratamiento experimental les ayudó a formular.
>
> ---
>
> ## 5.7 Who benefits from mapping AI into production?
>
> ### Resumen conciso
>
> Todo el mundo, por igual. Los beneficios del tratamiento no varían significativamente según la tracción inicial de la empresa ni según si el fundador tiene formación técnica. El _mapping problem_ es una restricción cognitiva que afecta a todos, no una cuestión de habilidad técnica o punto de partida.
>
> ### Resumen estructurado
>
> - **Heterogeneidad por tracción inicial:**
> - No hay efecto diferencial significativo en el Venture Progress Index según nivel de tracción previo
> - El efecto en adquisición de clientes sí está algo más concentrado en las empresas que aún no tenían clientes (lógico: más margen de mejora)
> - Contrasta con evidencia de experimentos a nivel de tarea, donde los peores ejecutores se benefician más
> - **Heterogeneidad por background técnico:**
> - Sin diferencias significativas entre fundadores técnicos y no técnicos en ningún resultado
> - Si el tratamiento fuera sobre habilidades técnicas, los no técnicos deberían beneficiarse más - no es así
> - **Implicación:** el binding constraint es cognitivo (amplitud de búsqueda), no técnico ni gerencial. Los ejemplos y marcos lo alivian independientemente del punto de partida
>
> ### Reflexión
>
> Este resultado es el que más debería importar a quienes diseñan programas de adopción de IA en empresas grandes. No es un problema de que los no técnicos no entiendan la herramienta. No es un problema de que las empresas rezagadas necesiten más ayuda. Es un problema transversal: el sistema de búsqueda por defecto de cualquier organización es local y corto, y sin andamiaje externo (ejemplos, marcos, analogías), la mayoría de organizaciones no mira donde debería mirar. Eso aplica al CHRO de una empresa del IBEX igual que a un fundador de startup en Lagos.
>
> ---
>
> ## 5.8 Estimating the firm-level returns to AI use
>
> ### Resumen conciso
>
> Usando el tratamiento como instrumento, cada caso de uso adicional de IA inducido por el tratamiento se asocia con +0,85 tareas completadas, +3,9 p.p. de probabilidad de tener clientes y +23% en ingresos (log). Son efectos grandes, y el efecto acumulado de mapear IA ampliamente es sustancialmente mayor que el diferencial capturado entre grupos.
>
> ### Resumen estructurado
>
> - **Estimaciones IV (efectos por caso de uso adicional):**
> - Tareas completadas: +0,85 (p<0,01)
> - Venture Progress Index: +0,056 SD (p<0,05)
> - Probabilidad de tener clientes: +3,9 p.p. (p<0,01)
> - Ingresos (log): +0,23 (p<0,1)
> - Demanda de capital (log): -0,17 (p<0,1)
> - **F-estadístico de primera etapa:** >33 - instrumento fuerte
> - **Coherencia interna:** 2,7 casos de uso adicionales × 0,056 SD = 0,15 SD en Venture Progress Index ≈ estimación ITT de 0,16 SD
> - **Extrapolación (con cautela):** pasar de 0 a 8,8 casos de uso (media del grupo tratado) implicaría +0,49 SD en el índice y +34 p.p. en probabilidad de tener clientes. Heroica pero útil como benchmark
>
> ### Reflexión
>
> La coherencia entre el ITT y la estimación IV es la prueba de fuego de que el mecanismo funciona como describe el paper: el tratamiento actúa a través de los casos de uso de IA, no por algún canal paralelo. El número de $0,23 de incremento en log-ingresos por caso de uso adicional es el tipo de dato que necesita un directivo para justificar internamente una inversión en exploración sistemática de aplicaciones de IA. No es "la IA es importante" - es "cada función adicional donde despliegas IA bien equivale a este retorno medible". Eso cambia la conversación.
>
> ---
>
> ## 6. Discussion
>
> ### Resumen conciso
>
> Los resultados ofrecen una resolución parcial a la paradoja entre las capacidades demostradas de la IA y su escasa aparición en estadísticas de productividad agregada: el bottleneck es directivo, no tecnológico. El papel de la IA no es solo reducir costes de entrada - es expandir la frontera de lo que las empresas pueden construir.
>
> ### Resumen estructurado
>
> - **Resolución de la paradoja productividad:** la IA sí agrega ganancias a nivel empresa; el problema es que la mayoría de empresas no buscan donde deben
> - **Implicación para política y práctica:** el acceso no es suficiente - hay que enseñar a resolver el _mapping problem_, no solo a usar herramientas
> - **La IA reshapea el escalado:** más output con mismos inputs de capital y trabajo. Reducción de costes de experimentación, pero los efectos de cola alta sugieren también complementariedades que amplifican retornos
> - **Limitaciones honestas:**
> - Ventana de 10 semanas - efectos a largo plazo desconocidos
> - Startups early-stage con baja inercia organizativa - en grandes empresas el problema es probablemente peor
> - Las formas concretas de mapeo cambiarán a medida que los modelos mejoren
> - **Implicación final:** a medida que la IA mejore, el espacio de búsqueda se amplía y el _mapping problem_ se vuelve más difícil, no más fácil. La empresa que resuelve el mapping de hoy enfrentará el mismo problema con los modelos del año que viene
>
> ### Reflexión
>
> La última observación del paper es la más incómoda: mejorar la IA no elimina el _mapping problem_, lo agrava. Más capacidad significa más espacio donde buscar, más decisiones sobre dónde desplegar, más combinaciones posibles. Las empresas que hoy piensan que "cuando la IA sea mejor" se simplificará la decisión están equivocadas - se complicará. Lo que se vuelve más valioso no es el acceso a modelos más potentes, sino la capacidad organizativa de explorar sistemáticamente dónde y cómo usarlos. Eso no es un problema técnico. Es un problema de diseño organizativo y de aprendizaje colectivo.
>
> ---
>
> ## 7. Appendix
>
> ### Resumen conciso
>
> El apéndice detalla los controles de spillover (exhaustivos y negativos), los criterios de codificación humana para casos de uso e IA y tareas, la taxonomía de 7 categorías de casos de uso construida iterativamente, y todas las tablas de robustez y análisis de cuantiles que respaldan los resultados principales.
>
> ### Resumen estructurado
>
> - **7.1 Spillovers:** triple verificación - diseño de plataforma separada, encuesta de endline (cero menciones de sesiones exclusivas de tratados por parte de controles), auditoría manual de logs de Zoom
> - **7.2 Codificación:**
> - Casos de uso: válido/inválido/duplicado + categoría proceso/producto/modelo de negocio. Dos codificadores ciegos + tercero para desacuerdos
> - Tareas: válido/inválido/duplicado + interno/externo. Misma metodología
> - **7.3 Taxonomía de casos de uso (7 categorías finales sobre 3.752 casos válidos):**
> - Product & Strategy Design (19,7%)
> - Research, Legal & Writing (18,8%)
> - Product Development (18,2%)
> - Marketing (15,5%)
> - Technical Infrastructure (13,0%)
> - Business Operations (8,7%)
> - Sales (6,0%)
> - Proceso: 12 categorías iniciales → consolidadas a 7; 705 casos revisados manualmente; taxonomía derivada con Claude Sonnet 4.5 + revisión humana iterativa
> - **7.4 Tablas de robustez:** consistencia de efectos en ingresos, inversión y capital ask bajo distintas transformaciones (log, IHS, winsorización al 90/95/99%)
>
> ### Reflexión
>
> La taxonomía de casos de uso es un producto secundario del paper que tiene valor propio. No es solo clasificación académica - es un mapa de dónde las empresas más activas en IA están encontrando valor real. El hecho de que Product & Strategy Design y Business Operations (automatización de workflows internos) sean categorías con efectos diferenciales significativos frente a Sales o Research debería orientar dónde mirar primero en cualquier empresa. Y la honestidad de documentar que usaron Claude Sonnet para construir la taxonomía - con revisión humana iterativa - es un ejemplo de cómo reportar uso de IA en investigación académica de forma transparente.
---
# Artículo original: Mapping AI into Production A Field Experiment on Firm Performance
Enlace para descarga --> https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6513481
## Abstract
AI can deliver productivity gains on individual tasks, yet evidence on whether these gains aggregate to firm performance remains limited. We study a central friction in AI adoption, which we call the mapping problem: discovering where and how AI creates value within a firm's production process. Across 515 high-growth startups, we run a field experiment in which treated firms receive information about how other firms have reorganized production around AI, prompting them to search for use cases across a broader set of firm functions. We find that treated firms discover more AI use cases, a 44% increase, concentrated in product development and strategy. These changes result in economically meaningful performance gains. Treated firms complete 12% more tasks, are 18% more likely to acquire paying customers, and generate 1.9x higher revenue. Revenue and investment gains are largest at the 90th percentile and above, consistent with AI expanding the upper range of what firms achieve rather than modestly improving marginal ventures. Despite faster growth, treated firms do not scale inputs proportionally. Their demand for external capital investment falls by 39.5% relative to the control group, while their demand for labor remains unchanged. These results provide causal evidence that AI improves firm performance and productivity even at its current capabilities, and that discovering where and how to deploy AI is a key bottleneck in realizing the gains from this technology.
**Keywords:** Artificial Intelligence, Generative AI, Firms, Strategy, Entrepreneurship
**Suggested Citation:** Kim, Hyunjin and Kim, Dahyeon and Koning, Rembrand, Mapping AI into Production: A Field Experiment on Firm Performance (March 30, 2026). INSEAD Working Paper No. 2026/20/STR, Available at SSRN: [https://ssrn.com/abstract=6513481](https://ssrn.com/abstract=6513481) or [http://dx.doi.org/10.2139/ssrn.6513481](https://dx.doi.org/10.2139/ssrn.6513481)
---
Publicado el 5 de abril de 2026