Comparaison des analyseurs Azure AI Search : standard.lucene vs en.microsoft

Un guide pratique pour comprendre les différences entre les analyseurs dans Azure AI Search, en se concentrant sur le stemming vs la lemmatisation et les échecs de recherche réels.

Azure AI Search propose plusieurs analyseurs pour l'indexation de texte, mais un mauvais choix peut entraîner des échecs de recherche surprenants. Un scénario courant : indexer le mot 'brief' puis rechercher 'briefs' ne renvoie aucun résultat. Cela se produit car l'analyseur standard.lucene par défaut utilise un stemming de base, qui peut ne pas gérer correctement les formes plurielles. En revanche, l'analyseur en.microsoft applique une lemmatisation plus sophistiquée, reconnaissant 'briefs' comme une forme de 'brief'. Cet article explique les différences techniques entre ces analyseurs et fournit des conseils pour choisir le bon analyseur pour votre index de recherche. Pour les équipes construisant des applications de recherche sur Azure, comprendre cette distinction est essentiel pour offrir des expériences de recherche précises et conviviales.