Apuntes sobre Inteligencia Artificial

Lo difícil no es contestar, sino tener razón.

Apéndice I. Ficha técnica de plataformas IA conversacionales (octubre 2025)

« GPTCopilotGéminiClaudePerplexityGrokDeepSeekOtras »

ChatGPT (OpenAI · Plataforma GPT-5 · 2025)

Plataforma conversacional multimodal basada en el modelo GPT-5, orientada a tareas de análisis, redacción y experimentación sin necesidad de programación.

Tipo / modelo base Plataforma de inteligencia artificial general sustentada en el modelo GPT-5.
Arquitectura Transformer multimodal unificado (texto, código, imagen). Soporte nativo de razonamiento, generación de código (Codex) y ejecución controlada mediante intérprete integrado.
Contexto y memoria Ventana de hasta 256 K tokens por sesión. Memoria temporal activa; memoria persistente disponible por usuario (editable y auditable).
Modalidades y herramientas Texto, código, imágenes y archivos (PDF, DOCX, CSV…). Herramientas: intérprete Python, navegación web, generación y análisis de imágenes, lectura/escritura de archivos, y entorno Canvas interactivo. Codex integrado para comprensión y refactorización de código.
Entornos y funciones persistentes Proyectos: espacio persistente con archivos e instrucciones. Custom GPTs: instancias configurables con descripciones y archivos propios. Modo Agente / Automations: ejecución de tareas programadas. Búsqueda de chats: permite localizar conversaciones pasadas por contenido o fecha.
Conocimiento / actualización Entrenamiento hasta 2025 H1 + acceso web para información reciente y verificada.
Fortalezas y rasgos generales
  • Entorno unificado para texto, código y archivos.
  • Gestión persistente mediante Proyectos y Custom GPTs.
  • Integración directa de herramientas y memoria sin requerir API externa.
  • Funciones útiles en la versión gratuita: búsqueda de chats, intérprete Python, análisis de archivos e imágenes.
ChatGPT (Plataforma GPT-5) ofrece un entorno estable y multifuncional, adecuado para uso personal y profesional ligero, con herramientas integradas que cubren la mayoría de tareas cotidianas.
Limitaciones o precauciones
  • Dependencia total de conexión en la nube.
  • Persistencia y automatizaciones en fase de ajuste; pueden variar entre cuentas.
  • Las respuestas deben verificarse cuando se requiera exactitud factual.

Copilot (Microsoft · Plataforma · 2025)

Asistente de productividad integrado en el ecosistema Microsoft, basado en modelos GPT-4 Turbo / GPT-4o y orientado a tareas de texto, cálculo y automatización ofimática.

Tipo / modelo base Plataforma integrada en Microsoft 365, Windows y Edge, sustentada en modelos GPT-4 Turbo y GPT-4o.
Arquitectura Transformer multimodal (texto, imagen, voz) con integración contextual a través de Microsoft Graph. Permite acceder a datos locales o en la nube (documentos, correo, calendario) según permisos del usuario.
Contexto y memoria Ventana variable según aplicación (≈ 32–128 K tokens). Memoria temporal por sesión y persistencia contextual limitada mediante Microsoft Graph / account state.
Modalidades y herramientas Texto, código y voz. Integración directa con Word, Excel, PowerPoint, Outlook, Teams y Edge. En Windows Copilot: acceso a funciones del sistema (modo oscuro, capturas, búsquedas). En Edge: lectura de páginas, resúmenes y generación de texto web.
Entornos y funciones persistentes Contexto Microsoft Graph: permite usar datos personales (agenda, documentos, correos) dentro de las respuestas. Copilot Lab: entorno de ejemplos y aprendizaje interactivo. Copilot Designer: generación de imágenes mediante DALL·E 3 (limitado). Integración en Windows: disponible desde barra de tareas y atajo ⊞ Win +C.
Conocimiento / actualización Actualización continua mediante conexión al servicio cloud de Microsoft / OpenAI; sin fecha de corte fija.
Fortalezas y rasgos generales
  • Integración directa con herramientas de ofimática y sistema operativo.
  • Acceso contextual a datos del usuario mediante Microsoft Graph.
  • Capacidad multimodal básica (texto, imagen, voz) dentro de un mismo flujo.
  • Disponible en Windows, Edge y aplicaciones 365 sin configuración adicional.
Copilot funciona como asistente de productividad centrado en documentos y tareas diarias, con respuesta contextual y formato coherente dentro del entorno Microsoft.
Limitaciones o precauciones
  • Acceso restringido a ecosistema Microsoft; no actúa fuera de sus aplicaciones.
  • Dependencia total de la nube y de permisos Graph para acceder a datos.
  • Sin memoria persistente general entre sesiones ni personalización profunda.
  • Funcionalidad variable según región y versión de producto.

Gemini (Google · Plataforma · 2025)

Plataforma conversacional y multimodal desarrollada por Google DeepMind, integrada en el ecosistema Google y orientada a búsqueda, redacción y análisis de información.

Tipo / modelo base Plataforma unificada basada en la familia de modelos Gemini 2.5 (Flash en versión gratuita, Pro en la de pago), accesible desde navegador y apps Android e iOS.
Arquitectura Transformer multimodal de propósito general con integración nativa de texto, imagen, audio y vídeo. Utiliza la infraestructura de cómputo de Google Search y Colab.
Contexto y memoria Ventana de contexto hasta 1 millón de tokens (según modelo). Memoria temporal de sesión; sin persistencia general entre conversaciones.
Modalidades y herramientas Texto, imágenes, audio y vídeo. Herramientas disponibles en versión gratuita: búsqueda en Google, generación de código, análisis de imágenes y Deep Research (con uso limitado). Entorno técnico opcional mediante Colab para ejecutar código Python real.
Entornos y funciones persistentes Gems: asistentes personalizados disponibles también en la versión gratuita; permiten configurar comportamientos concretos (p. ej., programación o investigación). Historial sincronizado: búsqueda y reanudación de chats desde la cuenta Google. La integración con Workspace (Docs, Gmail, Sheets) requiere plan Google One AI Premium.
Conocimiento / actualización Acceso directo a la web mediante Google Search; información actualizada en tiempo real con respaldo de resultados verificados.
Fortalezas y rasgos generales
  • Búsqueda conectada con Google para respuestas actuales y fácticas.
  • Creación de código y análisis de datos disponible incluso en el nivel gratuito.
  • Asistentes (Gems) configurables sin coste adicional.
  • Capacidad multimodal equilibrada (texto, imagen, audio, vídeo).
  • Acceso a Deep Research con limitaciones de uso mensual.
Gemini (versión Flash) ofrece un entorno flexible y actualizado, adecuado para redacción, búsqueda y apoyo técnico ligero dentro del ecosistema Google.
Limitaciones o precauciones
  • Sin memoria persistente general entre sesiones.
  • La calidad y profundidad de razonamiento son inferiores al modelo Pro.
  • Integración con Workspace y contexto extendido reservados a planes de pago.
  • Privacidad sujeta a la política de datos de Google.

Claude (Anthropic · Plataforma · 2025)

Plataforma conversacional y de análisis textual desarrollada por Anthropic, centrada en claridad, coherencia y gestión extendida del contexto.

Tipo / modelo base Plataforma basada en la familia de modelos Claude 3.5 (Sonnet y Haiku), accesible desde la web y API. La versión gratuita utiliza Claude 3.5 Haiku; la versión Plus, Claude 3.5 Sonnet.
Arquitectura Transformer optimizado para comprensión de texto largo. Diseño decoder-only con mecanismos de atención ampliados para ventanas de contexto extensas (hasta 200 K tokens).
Contexto y memoria Ventana de contexto hasta 200 K tokens (≈ 300 páginas). Sin memoria persistente entre sesiones; cada conversación es independiente.
Modalidades y herramientas Texto e imágenes (análisis, no generación). Lectura directa de archivos PDF, DOCX, TXT y CSV. Interfaz estructurada con modo “Projects” (espacios persistentes con archivos y notas). Soporte de código y pseudocódigo, sin ejecución directa.
Entornos y funciones persistentes Projects: carpetas persistentes con historial y archivos adjuntos, accesibles desde la interfaz web. Artifacts: entorno interactivo que permite visualizar y editar documentos o fragmentos de código dentro del chat (HTML, JS, React, Markdown, etc.). Historial global: búsqueda y reapertura de conversaciones previas.
Conocimiento / actualización Entrenamiento hasta 2025 H1. Sin acceso directo a la web en la versión gratuita; la búsqueda conectada está disponible sólo mediante API o integraciones externas.
Fortalezas y rasgos generales
  • Alta coherencia en textos largos y análisis estructurados.
  • Interfaz clara y enfoque en lectura de documentos extensos.
  • Artifacts integrados para revisión y edición en tiempo real.
  • Projects con persistencia de archivos, sin depender de memoria algorítmica.
Claude prioriza transparencia y control del usuario sobre el contenido, con un entorno especialmente apto para redacción técnica y revisión de documentos complejos.
Limitaciones o precauciones
  • Sin ejecución de código ni automatizaciones.
  • Sin navegación web directa en la versión gratuita.
  • Memoria no persistente fuera de los Projects.
  • Menor integración externa frente a otras plataformas comerciales.

Perplexity AI (Plataforma · 2025)

Asistente de búsqueda y síntesis de información que combina modelos de lenguaje con recuperación verificada de fuentes.

Tipo / modelo base Plataforma de búsqueda conversacional. Utiliza modelos propios de Perplexity y, en ciertas consultas, modelos externos (GPT-4, Claude 3, Mistral) según disponibilidad.
Arquitectura Motor híbrido RAG (Retrieval-Augmented Generation): combina generación de texto con resultados web citados. Las respuestas se construyen a partir de documentos reales indexados en tiempo real.
Contexto y memoria Contexto aproximado de 50–100 K tokens por sesión. Sin memoria persistente entre conversaciones; cada consulta es independiente.
Modalidades y herramientas Texto e imágenes (búsqueda y análisis básico). Herramientas principales: búsqueda web en tiempo real, resumen con citas, comparación entre fuentes, y exportación en formato Markdown o enlace compartido. En la app móvil, lectura de enlaces y vista “copilot” para seguir temas.
Entornos y funciones persistentes Threads: historial consultable de conversaciones. Collections: agrupación manual de resultados o temas guardados. Modo Focus: restringe las fuentes a dominios académicos, científicos o de noticias según el tipo de búsqueda.
Conocimiento / actualización Acceso continuo a la web; la información se actualiza en tiempo real con enlaces verificados. No tiene fecha de corte de entrenamiento relevante, ya que depende de la búsqueda activa.
Fortalezas y rasgos generales
  • Recuperación con fuentes visibles y verificables.
  • Alta velocidad en búsquedas y resúmenes temáticos.
  • Modo Focus para limitar el dominio de consulta.
  • Interfaz ligera y sin necesidad de configuración.
Perplexity AI se comporta más como un motor de búsqueda explicativo que como un asistente generalista, útil para documentación rápida y verificación de datos.
Limitaciones o precauciones
  • No ejecuta código ni genera contenido prolongado.
  • Sin memoria persistente ni personalización.
  • Calidad dependiente de las fuentes disponibles en la web.
  • No admite automatizaciones ni carga de archivos.

Grok AI (xAI · Plataforma · 2025)

Asistente conversacional y de búsqueda en tiempo real integrado en la red X (Twitter) y desarrollado por xAI. Combina razonamiento contextual con acceso a información actual y entornos de trabajo persistentes.

Tipo / modelo base Plataforma conversacional integrada en X y grok.com, basada en el modelo Grok-5. Accesible mediante navegador o app móvil para usuarios registrados en X.
Arquitectura Transformer decoder-only con razonamiento contextual y conexión continua al flujo público de X. Entrenamiento mixto sobre texto web, publicaciones de X y código abierto.
Contexto y memoria Ventana aproximada de 200 K tokens. Memoria temporal por hilo; los Workspaces añaden persistencia local de archivos y conversaciones.
Modalidades y herramientas Texto, código e imagen (análisis y generación). Acceso directo al contenido reciente de X y a la web mediante DeepSearch. Funciones principales: resumen de hilos, búsqueda contextual, análisis de código y seguimiento de tendencias.
Entornos y funciones persistentes Workspaces: espacios de trabajo que agrupan documentos, archivos y chats por proyecto; admiten PDF, hojas de cálculo, imágenes y código. Colaboración: permiten compartir espacios con otros usuarios mediante enlaces seguros. Integraciones IA: DeepSearch / DeeperSearch para búsqueda ampliada y Grok Imagine para generación de imágenes o vídeos. La versión gratuita ofrece acceso limitado a Workspaces; la gestión completa requiere plan SuperGrok o Premium +.
Conocimiento / actualización Acceso continuo a la web y al contenido público de X en tiempo real; sin fecha de corte de entrenamiento fija.
Fortalezas y rasgos generales
  • Acceso inmediato a información actual y publicaciones recientes.
  • Workspaces con persistencia y colaboración en línea.
  • Herramientas de búsqueda y análisis social integradas (DeepSearch).
  • Modo conversacional rápido, adecuado para noticias y análisis contextuales.
Grok AI combina búsqueda en tiempo real y gestión de proyectos, ofreciendo un entorno híbrido entre red social y asistente analítico.
Limitaciones o precauciones
  • Uso condicionado a una cuenta X activa y a sus políticas de privacidad.
  • Funciones avanzadas (Workspaces completos, DeeperSearch, Imagine) disponibles sólo en planes de pago.
  • Sin memoria personal global ni automatizaciones.
  • Privacidad limitada por la integración con el entorno X.

DeepSeek AI (Plataforma · 2025)

Laboratorio y conjunto de modelos desarrollados por DeepSeek, centrados en investigación sobre eficiencia de entrenamiento y razonamiento mediante refuerzo sin supervisión humana.

Tipo / modelo base Familia de modelos de lenguaje abiertos desarrollados por DeepSeek (China), incluyendo DeepSeek-R1 y R1-Zero. Acceso mediante API y plataformas de demostración web.
Arquitectura Modelo Transformer con enfoque *Mixture-of-Experts (MoE)*, activando un subconjunto de parámetros por token (≈ 37 B activos de 671 B totales). Entrenamiento basado en refuerzo directo (*Reinforcement-Only Learning*, ROL) sin intervención humana.
Contexto y memoria Ventana de contexto de 128 K tokens. Sin memoria persistente entre sesiones; las conversaciones son independientes.
Modalidades y herramientas Texto y código. Capacidad de razonamiento matemático y analítico destacada en tareas de prueba (MATH, GSM8K, HumanEval). No dispone de herramientas integradas ni funciones multimodales.
Entornos y funciones persistentes API pública experimental con soporte para parámetros de razonamiento (temperatura, pasos de reflexión, límites de contexto). No ofrece proyectos persistentes ni almacenamiento de archivos. Distribuciones adaptadas disponibles para ejecución local en GPUs y NPUs.
Conocimiento / actualización Entrenamiento cerrado a finales de 2024; sin acceso a la web ni actualización dinámica. Se centra en rendimiento matemático y eficiencia computacional más que en actualidad.
Fortalezas y rasgos generales
  • Alto rendimiento en tareas de razonamiento simbólico y matemático.
  • Arquitectura eficiente con reducción significativa del coste de inferencia.
  • Modelo de referencia en investigación sobre entrenamiento sin RLHF.
  • Implementaciones ligeras disponibles para uso local.
DeepSeek representa un avance técnico en aprendizaje por refuerzo puro y eficiencia computacional, más relevante como modelo de investigación que como asistente de propósito general.
Limitaciones o precauciones
  • Ausencia de herramientas integradas o funciones multimodales.
  • Sin memoria persistente ni entorno de trabajo.
  • Entrenamiento cerrado y documentación parcial en inglés y chino.
  • Rendimiento desigual fuera de dominios numéricos o estructurados.

Epílogo del Apéndice A1

Este es el estado de la cuestión a octubre de 2025. La evolución de las plataformas de inteligencia artificial es vertiginosa y constante: las capacidades, modelos y políticas de acceso cambian cada pocos meses. Antes de decidirte por una u otra, revisa siempre la información más reciente en las páginas oficiales de cada servicio, ya que la versión gratuita o las herramientas disponibles pueden haber variado desde la publicación de este manual.

Otras plataformas dignas de mención:

  • NotebookLM (Google): orientada a la investigación y toma de notas a partir de tus propios documentos. Permite subir textos, PDFs o enlaces, generar resúmenes y preguntas, y mantener cuadernos temáticos con análisis asistido.
  • Brave Leo (Brave Browser): asistente gratuito integrado en el navegador Brave; resume páginas web, vídeos y PDFs sin necesidad de cuenta externa.
  • Botpress AI: entorno libre para crear agentes conversacionales personalizados mediante flujos visuales, sin necesidad de programación compleja.
  • HuggingChat (Hugging Face): interfaz abierta que permite conversar con modelos de código abierto alojados en Hugging Face Hub, como Mistral o Llama 3.
  • Notion AI (Notion.com): asistente integrado en la plataforma de productividad Notion; ayuda a redactar, resumir y reorganizar texto dentro de documentos colaborativos.
  • Meta AI (Meta / Facebook): modelo gratuito basado en Llama 3, integrado en las aplicaciones de Meta (Instagram, WhatsApp y Messenger) y accesible vía web (meta.ai); ofrece generación de texto e imagen con conocimiento actualizado.
  • Cursor AI (Editor de código): entorno de desarrollo con asistencia IA integrada; basado en modelos GPT-4/ Claude, su versión gratuita permite completar, explicar y refactorizar código directamente en el editor.

Estas plataformas representan un panorama en rápida expansión, en el que coexisten modelos cerrados, servicios híbridos y soluciones de código abierto. El criterio más importante antes de elegir sigue siendo la adecuación al uso concreto: redacción, análisis, investigación, programación o asistencia general.

TOP