En el último año, la palabra “agente” se ha utilizado para describir casi cualquier cosa que incluya un modelo de lenguaje. Sin embargo, en el mundo del desarrollo de software y sistemas de producción, un verdadero Agente de Inteligencia Artificial es una pieza de arquitectura mucho más compleja e interesante que un simple chatbot conectado a una API de OpenAI con un “system prompt” largo.

La ilusión del Chatbot

Cuando un usuario interactúa con ChatGPT, está interactuando con un modelo que procesa texto y devuelve texto. El modelo no “hace” nada más que adivinar la siguiente palabra más probable basándose en su entrenamiento y en la ventana de contexto. Si le pides a un chatbot genérico que revise el stock de tu tienda, te responderá que, como modelo de lenguaje, no tiene acceso a internet o a bases de datos privadas.

Un Agente IA, por otro lado, está diseñado desde su núcleo para ser orientado a la acción. Está equipado con un arsenal de herramientas (Tools) y funciones (Function Calling) que le permiten observar el mundo exterior, interactuar con él, modificar su estado y volver con resultados.

Arquitectura de un verdadero Agente

Para construir un agente útil en entornos B2B o para automatización de procesos, necesitamos una arquitectura que incluya:

  1. Motor de Razonamiento (LLM): El “cerebro” que toma decisiones sobre qué herramientas usar.
  2. Memoria de Corto y Largo Plazo: Para mantener el contexto de la sesión actual y recordar preferencias históricas o información estructurada de una base de datos vectorial (RAG).
  3. Catálogo de Herramientas (Tools): Funciones deterministas (código Python/Node) que el agente puede ejecutar. Desde buscar en la base de datos hasta enviar un email o ejecutar un pago.
  4. Reglas y Barandillas (Guardrails): Lógica estricta que impide que el agente realice acciones destructivas o responda fuera de su dominio.

Ejecución con estado

La diferencia más notable para el usuario final es que el agente no solo conversa, resuelve. Cuando un cliente entra a un ecommerce y le dice al agente “Necesito cancelar mi último pedido”, el agente no responde “Por favor llama al soporte”. El agente, de forma autónoma:

  • Usa la herramienta get_user_session para identificar al cliente.
  • Usa la herramienta fetch_recent_orders para buscar en la base de datos de Shopify o WooCommerce.
  • Evalúa si el pedido está dentro del margen de tiempo de cancelación según las reglas de negocio.
  • Usa la herramienta cancel_order a través de una llamada API.
  • Informa al usuario que su pedido ha sido cancelado con éxito y envía el comprobante de reembolso.

El fin de los “Wrappers”

A medida que la tecnología madura, las empresas se dan cuenta de que conectar un input text a una API genérica no aporta valor real. El verdadero valor está en la ingeniería de sistemas: en cómo orquestamos el modelo de lenguaje dentro de un ecosistema digital seguro, predecible y altamente integrado con nuestras herramientas operativas (CRMs, ERPs, Bases de datos).

Ese es el trabajo que me apasiona: construir sistemas, no solo prompts.


Volver al Archivo