En el último año, la palabra “agente” se ha utilizado para describir casi cualquier cosa que incluya un modelo de lenguaje. Sin embargo, en el mundo del desarrollo de software y sistemas de producción, un verdadero Agente de Inteligencia Artificial es una pieza de arquitectura mucho más compleja e interesante que un simple chatbot conectado a una API de OpenAI con un “system prompt” largo.
La ilusión del Chatbot
Cuando un usuario interactúa con ChatGPT, está interactuando con un modelo que procesa texto y devuelve texto. El modelo no “hace” nada más que adivinar la siguiente palabra más probable basándose en su entrenamiento y en la ventana de contexto. Si le pides a un chatbot genérico que revise el stock de tu tienda, te responderá que, como modelo de lenguaje, no tiene acceso a internet o a bases de datos privadas.
Un Agente IA, por otro lado, está diseñado desde su núcleo para ser orientado a la acción. Está equipado con un arsenal de herramientas (Tools) y funciones (Function Calling) que le permiten observar el mundo exterior, interactuar con él, modificar su estado y volver con resultados.
Arquitectura de un verdadero Agente
Para construir un agente útil en entornos B2B o para automatización de procesos, necesitamos una arquitectura que incluya:
- Motor de Razonamiento (LLM): El “cerebro” que toma decisiones sobre qué herramientas usar.
- Memoria de Corto y Largo Plazo: Para mantener el contexto de la sesión actual y recordar preferencias históricas o información estructurada de una base de datos vectorial (RAG).
- Catálogo de Herramientas (Tools): Funciones deterministas (código Python/Node) que el agente puede ejecutar. Desde buscar en la base de datos hasta enviar un email o ejecutar un pago.
- Reglas y Barandillas (Guardrails): Lógica estricta que impide que el agente realice acciones destructivas o responda fuera de su dominio.
Ejecución con estado
La diferencia más notable para el usuario final es que el agente no solo conversa, resuelve. Cuando un cliente entra a un ecommerce y le dice al agente “Necesito cancelar mi último pedido”, el agente no responde “Por favor llama al soporte”. El agente, de forma autónoma:
- Usa la herramienta
get_user_sessionpara identificar al cliente. - Usa la herramienta
fetch_recent_orderspara buscar en la base de datos de Shopify o WooCommerce. - Evalúa si el pedido está dentro del margen de tiempo de cancelación según las reglas de negocio.
- Usa la herramienta
cancel_ordera través de una llamada API. - Informa al usuario que su pedido ha sido cancelado con éxito y envía el comprobante de reembolso.
El fin de los “Wrappers”
A medida que la tecnología madura, las empresas se dan cuenta de que conectar un input text a una API genérica no aporta valor real. El verdadero valor está en la ingeniería de sistemas: en cómo orquestamos el modelo de lenguaje dentro de un ecosistema digital seguro, predecible y altamente integrado con nuestras herramientas operativas (CRMs, ERPs, Bases de datos).
Ese es el trabajo que me apasiona: construir sistemas, no solo prompts.