Un benchmark reciente de un desarrollador chino compara tres frameworks principales para la llamada a herramientas de agentes: Function Calling de OpenAI, MCP de Anthropic y el prototipo de investigación Toolformer. El estudio mide la latencia y la tasa de éxito en múltiples escenarios de prueba, revelando que Function Calling ofrece la latencia más baja para tareas simples, mientras que MCP sobresale en flujos de trabajo complejos de múltiples pasos. Toolformer es prometedor pero se queda atrás en preparación para producción. Para los equipos de ingeniería que construyen agentes de IA, estos datos ayudan a seleccionar el framework según la complejidad de la tarea y los requisitos de rendimiento.
Una comparación detallada de tres frameworks de llamada a herramientas de agentes con datos de latencia y tasa de éxito.