MCP

Mediante la integración de diferentes MCPs, un modelo de lenguaje puede extender sus capacidades pudiendo actuar de forma directa sobre otras aplicaciones como bases de datos, correo electronico, creacion de carpetas, copia de archivos ...

5/13/20253 min read

     Cómo ampliar las capacidades de "ACTUAR" de una IA

Los modelos de lenguaje actuales son increíblemente capaces de comprender, generar texto y responder preguntas basándose en un vasto conocimiento. Sin embargo, su habilidad para actuar en el mundo digital es limitada. Pueden explicarte con detalle cómo crear un archivo o consultar una base de datos, pero no pueden realizar acciones directamente, como cambiar archivos de una carpeta a otra, duplicarlos o por ejemplo añadir un registro en una base de datos existente.

Cuatro ejemplos prácticos:

  1. Interactuar con el Sistema de Archivos: Un MCP diseñado para sistemas de archivos permite al modelo gestionar y manipular directamente archivos y carpetas en una máquina local. Esto incluye listar archivos en un directorio específico, crear nuevas carpetas, mover archivos basándose en criterios (como su tipo), e incluso generar contenido y guardarlo como un archivo con un nombre y formato específico. Esto le otorga al modelo la capacidad de controlar operaciones básicas del ordenador y combinar la generación de texto con la persistencia en disco.

  2. Acceder a Bases de Datos: Al utilizar un MCP para bases de datos como Postgres, el modelo adquiere la habilidad de conectarse a bases de datos (locales o remotas) y ejecutar consultas SQL. Puede listar las tablas disponibles y extraer datos de ellas según la consulta. Esta capacidad puede combinarse con la interacción del sistema de archivos para exportar los datos obtenidos a un archivo (por ejemplo, un CSV) guardado localmente. Esto permite al modelo trabajar con datos estructurados almacenados en bases de datos.

  3. Integrarse con Servicios en la Nube (APIs): Un MCP puede facilitar la comunicación con servicios externos a través de sus APIs. Un ejemplo práctico muestra cómo se puede obtener información detallada sobre un usuario en una plataforma como GitHub (repositorios, actividad) y revisar el estado de tareas o problemas (issues) en un proyecto. Un ejemplo más avanzado incluso demostró la capacidad de intentar crear una pull request para actualizar dependencias de software, lo que implica leer contenido del repositorio, identificar cambios y generar la descripción adecuada. Otro caso, un MCP personalizado para el clima, permite al modelo consultar una API meteorológica en tiempo real. El modelo recibe y es capaz de interpretar la respuesta (incluyendo JSON), presentando la información del clima (temperatura, precipitación, pronóstico) al usuario de manera comprensible, sin que la lógica de formateo de la respuesta esté codificada explícitamente en el MCP. Esto supera la limitación de los modelos de no tener información en tiempo real.

  4. Navegar y Extraer Información de la Web: Mediante un MCP como el de Playwright, el modelo obtiene la capacidad de navegar por páginas web. Puede visitar una URL específica y extraer datos de elementos concretos de la página (como títulos o listas). Además, esta función se puede combinar con la interacción con archivos locales para comparar la información extraída de una web con datos almacenados y modificar archivos locales si se detectan diferencias. Esto habilita al modelo para interactuar directamente con contenido web.

En resumen, el Model Context Protocol transforma los modelos de lenguaje de ser solo fuentes de conocimiento a ser agentes capaces de realizar acciones. Les permite conectar e interactuar activamente con su entorno digital, desde el sistema operativo local hasta servicios en la nube y la web, abriendo un gran abanico de posibilidades para la automatización y la interacción avanzada.

Es aquí donde el Model Context Protocol (MCP) se convierte en una pieza clave. Este protocolo funciona como un estándar de comunicación que permite a los modelos de lenguaje interactuar con otros sistemas a través de servidores especializados. Piensa en ello como un "adaptador universal" que conecta la inteligencia artificial a diversas fuentes de datos y herramientas.

Mediante la integración de diferentes MCPs, un modelo de lenguaje puede extender sus capacidades de formas muy significativas.