Apuntes sobre Inteligencia Artificial

Lo difícil no es contestar, sino tener razón.

8. Más allá del prompt: aprovechando el toolkit oculto

Propósito: mostrar al lector que el dominio práctico de la IA no se agota en el prompting eficaz.
El siguiente paso consiste en descubrir y combinar las capacidades ocultas de las plataformas para crear sistemas funcionales - sin necesidad de programar.


8.1 La brecha invisible

Entre el “usuario competente” y el “usuario técnico” existe una franja poco explorada:
quien no programa, pero diseña interacciones estructuradas.

El usuario competente sabe redactar prompts claros, mantener el contexto y verificar resultados.
El usuario de este nivel intermedio piensa en flujos, define estados, usa herramientas integradas (intérpretes, artefactos, automatizaciones).
Su habilidad no es escribir código, sino especificar comportamientos.

En una frase: deja de pedir respuestas y comienza a diseñar comportamientos.


8.2 El problema de las capacidades ocultas

Las plataformas de IA son deliberadamente opacas.
Sus funciones más potentes están:

  • mal documentadas,
  • dispersas entre interfaces,
  • sujetas a cambios silenciosos.

Por qué no se documentan

  • Simplificación deliberada: reducir fricción para usuarios nuevos.
  • Protección comercial: las “features” diferencian productos.
  • Evolución constante: muchas están en pruebas o dependen de acuerdos legales.
  • Cumplimiento legal: ciertas funciones (automatización, scraping, ejecución de código) no pueden publicitarse sin restricciones.

Cómo descubrirlas

  1. Preguntar al modelo directamente por sus capacidades.
  2. Experimentar sistemáticamente: probar verbos (“create”, “analyze”, “visualize”) y formatos (CSV, HTML, MD).
  3. Observar patrones de respuesta: si ofrece “abrir artifact”, “descargar archivo” o “programar tarea”, hay una herramienta detrás.
  4. Seguir comunidades (Discord, Reddit, Twitter X): la mayor parte del descubrimiento es colectiva.
  5. Comparar plataformas en paralelo para ver qué funciones emergen antes en cada una.

8.3 Mapa de capacidades por plataforma (abril 2026)

Plataforma Capacidades clave Casos típicos de uso Limitaciones
ChatGPT (GPT-5.4) Code Interpreter, Deep Research, Automations, Projects (memoria), Computer Use nativo (controla pantalla, clicks, formularios), ventana de contexto de 1M tokens, razonamiento configurable en 5 niveles Análisis de datos, informes, workflows recurrentes, automatización de escritorio, tareas profesionales complejas Computer Use requiere software de terceros en ChatGPT; coste en tokens; modelo actualizado muy rápido (GPT-5.1 ya retirado)
Claude Opus 4.6 / Sonnet 4.6 Artifacts (React + Tailwind + Recharts), Claude Code (agente terminal), Claude Cowork (agente de escritorio, macOS y Windows), MCP connectors, acceso a archivos locales, tareas multi-paso, memoria en proyectos Dashboards, apps interactivas, automatización de archivos, contratos, flujos de trabajo autónomos, desarrollo de código Cowork no disponible en Linux; Computer Use solo en macOS (Windows próximamente); requiere plan de pago; app de escritorio debe permanecer abierta
Gemini 2.5 Pro Colab + App Builder + Deep Research, modo Deep Think (razonamiento avanzado), 1M tokens de contexto, multimodal nativo (texto, imagen, audio, vídeo, PDF), Project Mariner (uso de ordenador en navegador) Código Python real, investigación web actualizada, prototipos en ecosistema Google, análisis de documentos extensos, vídeo Integración profunda con Google; algunas funciones avanzadas requieren plan de pago; Project Mariner aún experimental
Copilot (Microsoft) Integración Office/VS Code + Microsoft Graph, Copilot Cowork (agente multi-paso sobre M365, basado en Claude), Critique (GPT genera, Claude revisa), Council (comparación multi-modelo), Work IQ (contexto empresarial completo) Automatización de documentos, gestión de agenda, preparación de reuniones, investigación empresarial, flujos de trabajo autónomos en Office Copilot Cowork en acceso anticipado; precio M365 E7 a 99$/usuario/mes; privacidad dependiente de permisos Graph
Perplexity Recuperación verificada con citas, búsqueda en tiempo real, Deep Research (informes largos con fuentes), respuestas multimodales Investigación documental, briefings fiables, seguimiento de noticias, consultas con verificación de fuentes No ejecuta código ni automatiza tareas; sin memoria persistente entre sesiones

Nota: El ritmo de cambio en 2026 se ha acelerado notablemente: OpenAI ha lanzado y retirado tres versiones de GPT-5.x en pocos meses. Conviene revisar esta tabla cada 4-6 semanas. La gran novedad transversal del periodo es la irrupción de los agentes autónomos -Cowork, Computer Use, Project Mariner, Copilot Cowork- que transforman los modelos de asistentes conversacionales en ejecutores de tareas.


8.4 Caso real: descubriendo los artifacts de Claude

Situación: en 2025 Claude empezó a mostrar una ventana separada con código React ejecutable - sin documentación oficial.

Descubrimiento:

  1. Claude genera código HTML/JS en una pestaña propia.
  2. Ese código puede modificarse y volver a ejecutarse.
  3. Soporta bibliotecas React, Tailwind, Recharts sin configuración.

Cómo aprovecharlo:

Prompt:
"Create an interactive dashboard in an artifact with a CSV upload, a line chart and a category filter."

Limitaciones detectadas:

  • Sin almacenamiento (localStorage desactivado).
  • Sin acceso a APIs arbitrarias.
  • Sin persistencia entre sesiones.

Aprendizaje: documentar descubrimientos y crear una “wiki personal” de capacidades.


8.5 De la idea a la especificación

Pedir:

“Ayúdame a practicar inglés corrigiendo mis frases.”

Especificar:

Create an interactive language tutor with:
- Level detection (A1-C2)
- Chat interface for practice
- Feedback panel with grammar notes
- Session summary with progress chart

No es código; es lenguaje estructurado.
El modelo traduce la especificación en una app funcional o en un informe descargable.

Clave: describe comportamientos y criterios de éxito, no solo tareas.


8.6 Casos de uso reales

a) Dashboard de proyectos (Claude Artifact)
Visualiza un CSV con fechas y categorías → muestra 3 KPIs, gráfica de líneas y filtros por rango de fecha.

Ideal para análisis rápidos sin Excel.

b) Informe automático (ChatGPT Automation)
Cada lunes a las 09:00: reúne 3 fuentes web, extrae título, fecha y resumen, y genera un Markdown descargable.

c) Resumen de documentos (Copilot)
Lee un informe Word, crea resumen ejecutivo y diapositiva PowerPoint en la misma suite.

d) Investigación temática (Perplexity)
Compila resumen con citas actualizadas y fuentes enlazadas.


8.7 Límites reales del enfoque

  • Fragilidad: los sistemas sin código dependen de interfaces en constante cambio.
  • Debugging limitado: cuando algo falla, las trazas no son visibles.
  • Mantenimiento: los artefactos o automatizaciones pueden dejar de funcionar tras una actualización.
  • Escalabilidad: estos entornos no permiten procesos masivos ni integraciones reales.
  • Privacidad: los datos subidos pasan por infraestructuras externas.
  • Supervisión de agentes: Al usar funciones de 'Computer Use' o agentes autónomos, recuerda que tú tienes el control final. Si el sistema realiza acciones inesperadas, puedes interrumpir el proceso en cualquier momento; la IA opera bajo tu autorización global, pero requiere tu vigilancia crítica en cada paso.

Regla de oro: si necesitas persistencia, seguridad o integración externa, ha llegado el momento de pasar a API o SDK.


8.8 Cómo seguir aprendiendo

  1. Practica experimentación dirigida: cada semana elige una capacidad y ponla a prueba.
  2. Documenta: capturas de pantalla, prompts efectivos, errores y workarounds.
  3. Participa en comunidades: Reddit r/LocalAI, Discord Ollama, foros de Anthropic y OpenAI.
  4. Repite pruebas tras actualizaciones: las interfaces cambian sin aviso.
  5. Aprende lectura técnica mínima: entender un error de consola te ahorrará horas.

8.9 Conclusión · La segunda alfabetización digital

La primera alfabetización fue aprender a usar ordenadores.
La segunda es entender cómo dialogan las máquinas entre sí y cómo podemos orquestarlas sin programar.

El usuario del futuro no será solo alguien que escriba bien prompts,
sino quien comprenda y combine capacidades de plataformas inteligentes de forma estratégica y responsable.

“El usuario competente sabe pedir.
El usuario avanzado sabe construir.”

A continuación: apéndices del manual — fichas técnicas, guía de Ollama, agentes, hardware y glosario de términos.

Revisado: abril 2026

TOP