Apéndice I. Ficha técnica de plataformas IA conversacionales (octubre 2025)
« GPT – Copilot – Gémini – Claude – Perplexity – Grok – DeepSeek – Otras »
ChatGPT (OpenAI · Plataforma GPT-5 · 2025)
Plataforma conversacional multimodal basada en el modelo GPT-5, orientada a tareas de análisis, redacción y experimentación sin necesidad de programación.
| Tipo / modelo base | Plataforma de inteligencia artificial general sustentada en el modelo GPT-5. |
|---|---|
| Arquitectura | Transformer multimodal unificado (texto, código, imagen). Soporte nativo de razonamiento, generación de código (Codex) y ejecución controlada mediante intérprete integrado. |
| Contexto y memoria | Ventana de hasta 256 K tokens por sesión. Memoria temporal activa; memoria persistente disponible por usuario (editable y auditable). |
| Modalidades y herramientas | Texto, código, imágenes y archivos (PDF, DOCX, CSV…). Herramientas: intérprete Python, navegación web, generación y análisis de imágenes, lectura/escritura de archivos, y entorno Canvas interactivo. Codex integrado para comprensión y refactorización de código. |
| Entornos y funciones persistentes | Proyectos: espacio persistente con archivos e instrucciones. Custom GPTs: instancias configurables con descripciones y archivos propios. Modo Agente / Automations: ejecución de tareas programadas. Búsqueda de chats: permite localizar conversaciones pasadas por contenido o fecha. |
| Conocimiento / actualización | Entrenamiento hasta 2025 H1 + acceso web para información reciente y verificada. |
| Fortalezas y rasgos generales |
|
| Limitaciones o precauciones |
|
Copilot (Microsoft · Plataforma · 2025)
Asistente de productividad integrado en el ecosistema Microsoft, basado en modelos GPT-4 Turbo / GPT-4o y orientado a tareas de texto, cálculo y automatización ofimática.
| Tipo / modelo base | Plataforma integrada en Microsoft 365, Windows y Edge, sustentada en modelos GPT-4 Turbo y GPT-4o. |
|---|---|
| Arquitectura | Transformer multimodal (texto, imagen, voz) con integración contextual a través de Microsoft Graph. Permite acceder a datos locales o en la nube (documentos, correo, calendario) según permisos del usuario. |
| Contexto y memoria | Ventana variable según aplicación (≈ 32–128 K tokens). Memoria temporal por sesión y persistencia contextual limitada mediante Microsoft Graph / account state. |
| Modalidades y herramientas | Texto, código y voz. Integración directa con Word, Excel, PowerPoint, Outlook, Teams y Edge. En Windows Copilot: acceso a funciones del sistema (modo oscuro, capturas, búsquedas). En Edge: lectura de páginas, resúmenes y generación de texto web. |
| Entornos y funciones persistentes | Contexto Microsoft Graph: permite usar datos personales (agenda, documentos, correos) dentro de las respuestas. Copilot Lab: entorno de ejemplos y aprendizaje interactivo. Copilot Designer: generación de imágenes mediante DALL·E 3 (limitado). Integración en Windows: disponible desde barra de tareas y atajo ⊞ Win +C. |
| Conocimiento / actualización | Actualización continua mediante conexión al servicio cloud de Microsoft / OpenAI; sin fecha de corte fija. |
| Fortalezas y rasgos generales |
|
| Limitaciones o precauciones |
|
Gemini (Google · Plataforma · 2025)
Plataforma conversacional y multimodal desarrollada por Google DeepMind, integrada en el ecosistema Google y orientada a búsqueda, redacción y análisis de información.
| Tipo / modelo base | Plataforma unificada basada en la familia de modelos Gemini 2.5 (Flash en versión gratuita, Pro en la de pago), accesible desde navegador y apps Android e iOS. |
|---|---|
| Arquitectura | Transformer multimodal de propósito general con integración nativa de texto, imagen, audio y vídeo. Utiliza la infraestructura de cómputo de Google Search y Colab. |
| Contexto y memoria | Ventana de contexto hasta 1 millón de tokens (según modelo). Memoria temporal de sesión; sin persistencia general entre conversaciones. |
| Modalidades y herramientas | Texto, imágenes, audio y vídeo. Herramientas disponibles en versión gratuita: búsqueda en Google, generación de código, análisis de imágenes y Deep Research (con uso limitado). Entorno técnico opcional mediante Colab para ejecutar código Python real. |
| Entornos y funciones persistentes | Gems: asistentes personalizados disponibles también en la versión gratuita; permiten configurar comportamientos concretos (p. ej., programación o investigación). Historial sincronizado: búsqueda y reanudación de chats desde la cuenta Google. La integración con Workspace (Docs, Gmail, Sheets) requiere plan Google One AI Premium. |
| Conocimiento / actualización | Acceso directo a la web mediante Google Search; información actualizada en tiempo real con respaldo de resultados verificados. |
| Fortalezas y rasgos generales |
|
| Limitaciones o precauciones |
|
Claude (Anthropic · Plataforma · 2025)
Plataforma conversacional y de análisis textual desarrollada por Anthropic, centrada en claridad, coherencia y gestión extendida del contexto.
| Tipo / modelo base | Plataforma basada en la familia de modelos Claude 3.5 (Sonnet y Haiku), accesible desde la web y API. La versión gratuita utiliza Claude 3.5 Haiku; la versión Plus, Claude 3.5 Sonnet. |
|---|---|
| Arquitectura | Transformer optimizado para comprensión de texto largo. Diseño decoder-only con mecanismos de atención ampliados para ventanas de contexto extensas (hasta 200 K tokens). |
| Contexto y memoria | Ventana de contexto hasta 200 K tokens (≈ 300 páginas). Sin memoria persistente entre sesiones; cada conversación es independiente. |
| Modalidades y herramientas | Texto e imágenes (análisis, no generación). Lectura directa de archivos PDF, DOCX, TXT y CSV. Interfaz estructurada con modo “Projects” (espacios persistentes con archivos y notas). Soporte de código y pseudocódigo, sin ejecución directa. |
| Entornos y funciones persistentes | Projects: carpetas persistentes con historial y archivos adjuntos, accesibles desde la interfaz web. Artifacts: entorno interactivo que permite visualizar y editar documentos o fragmentos de código dentro del chat (HTML, JS, React, Markdown, etc.). Historial global: búsqueda y reapertura de conversaciones previas. |
| Conocimiento / actualización | Entrenamiento hasta 2025 H1. Sin acceso directo a la web en la versión gratuita; la búsqueda conectada está disponible sólo mediante API o integraciones externas. |
| Fortalezas y rasgos generales |
|
| Limitaciones o precauciones |
|
Perplexity AI (Plataforma · 2025)
Asistente de búsqueda y síntesis de información que combina modelos de lenguaje con recuperación verificada de fuentes.
| Tipo / modelo base | Plataforma de búsqueda conversacional. Utiliza modelos propios de Perplexity y, en ciertas consultas, modelos externos (GPT-4, Claude 3, Mistral) según disponibilidad. |
|---|---|
| Arquitectura | Motor híbrido RAG (Retrieval-Augmented Generation): combina generación de texto con resultados web citados. Las respuestas se construyen a partir de documentos reales indexados en tiempo real. |
| Contexto y memoria | Contexto aproximado de 50–100 K tokens por sesión. Sin memoria persistente entre conversaciones; cada consulta es independiente. |
| Modalidades y herramientas | Texto e imágenes (búsqueda y análisis básico). Herramientas principales: búsqueda web en tiempo real, resumen con citas, comparación entre fuentes, y exportación en formato Markdown o enlace compartido. En la app móvil, lectura de enlaces y vista “copilot” para seguir temas. |
| Entornos y funciones persistentes | Threads: historial consultable de conversaciones. Collections: agrupación manual de resultados o temas guardados. Modo Focus: restringe las fuentes a dominios académicos, científicos o de noticias según el tipo de búsqueda. |
| Conocimiento / actualización | Acceso continuo a la web; la información se actualiza en tiempo real con enlaces verificados. No tiene fecha de corte de entrenamiento relevante, ya que depende de la búsqueda activa. |
| Fortalezas y rasgos generales |
|
| Limitaciones o precauciones |
|
Grok AI (xAI · Plataforma · 2025)
Asistente conversacional y de búsqueda en tiempo real integrado en la red X (Twitter) y desarrollado por xAI. Combina razonamiento contextual con acceso a información actual y entornos de trabajo persistentes.
| Tipo / modelo base | Plataforma conversacional integrada en X y grok.com, basada en el modelo Grok-5. Accesible mediante navegador o app móvil para usuarios registrados en X. |
|---|---|
| Arquitectura | Transformer decoder-only con razonamiento contextual y conexión continua al flujo público de X. Entrenamiento mixto sobre texto web, publicaciones de X y código abierto. |
| Contexto y memoria | Ventana aproximada de 200 K tokens. Memoria temporal por hilo; los Workspaces añaden persistencia local de archivos y conversaciones. |
| Modalidades y herramientas | Texto, código e imagen (análisis y generación). Acceso directo al contenido reciente de X y a la web mediante DeepSearch. Funciones principales: resumen de hilos, búsqueda contextual, análisis de código y seguimiento de tendencias. |
| Entornos y funciones persistentes | Workspaces: espacios de trabajo que agrupan documentos, archivos y chats por proyecto; admiten PDF, hojas de cálculo, imágenes y código. Colaboración: permiten compartir espacios con otros usuarios mediante enlaces seguros. Integraciones IA: DeepSearch / DeeperSearch para búsqueda ampliada y Grok Imagine para generación de imágenes o vídeos. La versión gratuita ofrece acceso limitado a Workspaces; la gestión completa requiere plan SuperGrok o Premium +. |
| Conocimiento / actualización | Acceso continuo a la web y al contenido público de X en tiempo real; sin fecha de corte de entrenamiento fija. |
| Fortalezas y rasgos generales |
|
| Limitaciones o precauciones |
|
DeepSeek AI (Plataforma · 2025)
Laboratorio y conjunto de modelos desarrollados por DeepSeek, centrados en investigación sobre eficiencia de entrenamiento y razonamiento mediante refuerzo sin supervisión humana.
| Tipo / modelo base | Familia de modelos de lenguaje abiertos desarrollados por DeepSeek (China), incluyendo DeepSeek-R1 y R1-Zero. Acceso mediante API y plataformas de demostración web. |
|---|---|
| Arquitectura | Modelo Transformer con enfoque *Mixture-of-Experts (MoE)*, activando un subconjunto de parámetros por token (≈ 37 B activos de 671 B totales). Entrenamiento basado en refuerzo directo (*Reinforcement-Only Learning*, ROL) sin intervención humana. |
| Contexto y memoria | Ventana de contexto de 128 K tokens. Sin memoria persistente entre sesiones; las conversaciones son independientes. |
| Modalidades y herramientas | Texto y código. Capacidad de razonamiento matemático y analítico destacada en tareas de prueba (MATH, GSM8K, HumanEval). No dispone de herramientas integradas ni funciones multimodales. |
| Entornos y funciones persistentes | API pública experimental con soporte para parámetros de razonamiento (temperatura, pasos de reflexión, límites de contexto). No ofrece proyectos persistentes ni almacenamiento de archivos. Distribuciones adaptadas disponibles para ejecución local en GPUs y NPUs. |
| Conocimiento / actualización | Entrenamiento cerrado a finales de 2024; sin acceso a la web ni actualización dinámica. Se centra en rendimiento matemático y eficiencia computacional más que en actualidad. |
| Fortalezas y rasgos generales |
|
| Limitaciones o precauciones |
|
Epílogo del Apéndice A1
Este es el estado de la cuestión a octubre de 2025. La evolución de las plataformas de inteligencia artificial es vertiginosa y constante: las capacidades, modelos y políticas de acceso cambian cada pocos meses. Antes de decidirte por una u otra, revisa siempre la información más reciente en las páginas oficiales de cada servicio, ya que la versión gratuita o las herramientas disponibles pueden haber variado desde la publicación de este manual.
Otras plataformas dignas de mención:
- NotebookLM (Google): orientada a la investigación y toma de notas a partir de tus propios documentos. Permite subir textos, PDFs o enlaces, generar resúmenes y preguntas, y mantener cuadernos temáticos con análisis asistido.
- Brave Leo (Brave Browser): asistente gratuito integrado en el navegador Brave; resume páginas web, vídeos y PDFs sin necesidad de cuenta externa.
- Botpress AI: entorno libre para crear agentes conversacionales personalizados mediante flujos visuales, sin necesidad de programación compleja.
- HuggingChat (Hugging Face): interfaz abierta que permite conversar con modelos de código abierto alojados en Hugging Face Hub, como Mistral o Llama 3.
- Notion AI (Notion.com): asistente integrado en la plataforma de productividad Notion; ayuda a redactar, resumir y reorganizar texto dentro de documentos colaborativos.
- Meta AI (Meta / Facebook): modelo gratuito basado en Llama 3, integrado en las aplicaciones de Meta (Instagram, WhatsApp y Messenger) y accesible vía web (meta.ai); ofrece generación de texto e imagen con conocimiento actualizado.
- Cursor AI (Editor de código): entorno de desarrollo con asistencia IA integrada; basado en modelos GPT-4/ Claude, su versión gratuita permite completar, explicar y refactorizar código directamente en el editor.
Estas plataformas representan un panorama en rápida expansión, en el que coexisten modelos cerrados, servicios híbridos y soluciones de código abierto. El criterio más importante antes de elegir sigue siendo la adecuación al uso concreto: redacción, análisis, investigación, programación o asistencia general.