Quels analyzer pour une recherche?

Karel_SUEDILE · January 31, 2017, 10:44am

Bonjour,
je souhaiterai mettre en place une recherche un peu spécifique sur mes documents.

Actuellement, j'utilise query_string sur des documents indexés avec l'analyzer french.
Ca me permet d'avoir des résultats cohérents lors des recherches avec des mots au singulier comme au pluriel.
Par ex: si je cherche "vins", ES me donne des résultats pertinents, idem avec "vin"

Cependant, j'ai un document qui contient "disneyland".
Je voudrais pouvoir le retrouver avec une recherche "disney" tout en conservant l'analyzer french.
J'ai tenté d'ajouter un wildcard, mais en faisant ça, ça fausse mes résultats pour une recherche sur "vins*".

Pourriez-vous me guider sur une solution à appliquer ?

dadoonet · January 31, 2017, 10:58am

Une solution simple serait peut-être d'ajouter un synonyme disney pour disneyland ?

Karel_SUEDILE · January 31, 2017, 11:05am

Effectivement, Je pourrais aussi alimenter mes documents avec un champ "tags" qui ferait office de liste de synonymes.

Mais si on ne prend pas en compte cette solution, n'y a-t-il pas un tokenizer ou analyzer spécifique pour ce genre de cas ?
J'ai vu l'existence de n-gram, mais j'ai peur qu'il ne soit pas vraiment prévu pour cela.
Ai-je tort ?

Karel_SUEDILE · January 31, 2017, 2:39pm

Je viens de relire pas mal de documentation.
Il semble que j'ai les choix suivants :

synonym
stemmer override
ngram

je suis bien tenté d'utiliser ngram puisqu'il ne nécessite pas l'entretien d'un fichier annexe.
Cependant, je voudrais avoir votre avis sur la viabilité de ce tokenizer.

Pour compléter ma demande, mes recherches seront essentiellement des recherches d'un mots (voire jusqu'à 3 max j'imagine), un peu comme si vous alliez sur amazon pour chercher "lave-linge".

Karel_SUEDILE · February 1, 2017, 11:05am

De ce que j'ai compris en lisant divers posts sur le sujet,
ngram semble etre assez gourmand en espace disque.
Etant donné que mon cas "disney" semble être assez exceptionnel,
je suis parti sur la solution que tu m'as indiqué, à savoir le synonyme.
Merci

Topic		Replies	Views
Recherche partielle d'un mot Discussions en français	2	557	September 5, 2022
Analyzer pour une recherche partielle respectant l'ordre des mots Discussions en français	5	2385	July 26, 2017
Comportement étrange sur une recherche full text Discussions en français	6	670	March 28, 2019
Bien indexer et rechercher en français? Discussions en français	3	2075	January 29, 2016
Item manquant dans le résultat de la recherche Discussions en français	3	692	November 20, 2018

Quels analyzer pour une recherche?

Related topics