Un nouvel article provocateur, DCI (Direct Contextual Indexing), fait des vagues en arguant que l'infrastructure complexe d'embeddings et d'index vectoriels qui sous-tend la plupart des systèmes RAG pourrait être excessive pour de nombreuses tâches d'agents. Les auteurs proposent plutôt une alternative étonnamment simple : utiliser une correspondance de chaînes de type grep directement sur un corpus de texte bien structuré. Leurs expériences montrent que pour des tâches comme le question-réponse factuel et le suivi d'instructions, DCI peut égaler ou même surpasser la recherche traditionnelle basée sur les embeddings, tout en étant des ordres de grandeur plus simple à déployer et à déboguer. L'idée clé est que de nombreuses requêtes d'agents sont de nature lexicale, et que le prétraitement moderne du texte peut rendre grep étonnamment efficace. Cependant, l'approche pourrait avoir du mal avec les tâches de similarité sémantique et les contextes multilingues. Pour les développeurs construisant des agents légers et transparents, DCI offre une alternative convaincante qui mérite d'être évaluée. L'article est un rappel opportun que la dépendance par défaut de la communauté IA aux embeddings peut parfois être un marteau cherchant un clou.
Un nouvel article, DCI (Direct Contextual Indexing), propose de remplacer les embeddings denses et les index vectoriels par une simple recherche basée sur grep pour les agents IA. L'approche revendique des performances comparables ou supérieures sur certaines tâches tout en réduisant considérablement la complexité de l'infrastructure. Cela remet en question le paradigme RAG dominant et pourrait influencer la façon dont les développeurs construisent des systèmes d'agents légers et interprétables.