31-Potencia-y-WTF

31 de mayo de 2026 # WTF, nos estamos acostumbrando muy rápido a las capacidades de la IA Poca broma esto que ocurre cuando le pidas a la IA algo aparentemente sencillo como *"analiza el contenido de estas carpetas y déjame un fichero con un resumen esquemático"*. En este caso particular, 79 PDFs densos con un contenido muy específico. ![](./attachments/30-Potencia.webp) Nos estamos acostumbrando muy rápido a esto, pero ciertamente es espectacular en cuanto a lo que la IA es capaz de hacer, a la par que bastante WTF y potencialmente peligroso. En palabras del propio Máquina, todo esto es lo que ha hecho: > [!example]- Proceso seguido: > > 1. **Exploración del workspace**: listé el contenido de las carpetas M1 y M2 para inventariar los PDFs (apuntes, glosarios, slides, ejercicios). > > 2. **Intento de lectura directa**: probé `read_file` sobre un par de PDFs, pero devolvieron bytes binarios crudos (PDF comprimido con FlateDecode) — inservibles como texto. > > 3. **Búsqueda de herramienta de extracción**: > - Comprobé en terminal qué tenía disponible: `pdftotext` (no), `python` (sí). > - Probé tres librerías Python con un único comando: `pypdf` (no instalada), `pdfplumber` (no instalada), `PyMuPDF`/`fitz` (instalada, v1.27.2). > - Elegí PyMuPDF; no instalé nada. > > 4. **Extracción masiva**: creé un script auxiliar (`_extract.py`) que recorre ambas carpetas, abre cada PDF con `fitz`, concatena el texto de todas las páginas y lo vuelca a un JSON (`_all_text.json`, ~1 MB de texto). > > 5. **Normalización**: un segundo script (`_dump.py`) limpió espacios/saltos y generó un `.txt` único legible para que yo pudiera leerlo con `read_file`. > > 6. **Extracción de índices**: un tercer script (`_outline.py`) detectó la sección "Contenido" de cada PDF y produjo un esquema compacto (_outlines.txt) con título + índice de cada clase. > > 7. **Lectura selectiva**: leí el dump completo de outlines + algunas secciones extendidas del texto plano para captar conceptos, cifras y casos concretos sin tener que cargar el 1 MB entero. > > 8. **Síntesis**: redacté Resumen_Esquematico_Master_IA.txt organizado por módulo → bloque → clase, con conceptos densos y poca narrativa, más dos secciones añadidas (transversales cubiertos / huecos detectables) para que te sirva de input a otra IA. > > 9. **Limpieza**: borré los seis archivos auxiliares (`_extract.py`, `_dump.py`, `_outline.py`, `_all_text.json`, _all_text.txt, _outlines.txt) dejando solo el resumen final. ![](./attachments/30-Potencia-1.webp) ## Nota En este caso, Máquina es Opus 4.7 dentro de Visual Studio Code vía suscripción de GitHub Copilot... en el modo más simple que puede existir (sin agentes, usado para leer PDFs y generar ficheros de texto --- Publicado el 31 de mayo de 2026, [LinkedIn](https://www.linkedin.com/posts/davidhurtadotoran_mentesinquietas-ugcPost-7466786555668582400-ebhD/?utm_source=share&utm_medium=member_desktop&rcm=ACoAAAAT5UsBH3ISG9LTxrgEnB7glCf9CerKWno), [Substack](https://substack.com/profile/293864668-david-hurtado/note/c-268076402?r=4uyjfg&utm_source=notes-share-action&utm_medium=web), [X](https://x.com/dhtoran/status/2061019790471229861?s=20)