| Recherche en texte intégral |
Le moteur de recherche REFLEXION recherche sur la totalité du corpus textuel indexé, dont le périmètre est défini par l’administrateur lors de l’indexation.
Tous les mots sont pris en compte. |
| Contrôle d'accès et prise en chage de la sécurité |
Le moteur de recherche REFLEXION prend en compte l'authentification de base et l'authentification intégrée Windows. Cela permet de s'assurer qu'un utilisateur ne verra dans ses résultats de recherche que les documents auxquels il a droit. Plusieurs méthodes de contrôle de l'accès de l'utilisateur aux résultats de recherche sont proposées. |
| Nombre de mots-clés entrés par l’utilisateur |
Illimité |
| Toutes les formes des mots : les formes fléchies |
Les formes dites fléchies (ou flexions) en linguistique, sont celles du masculin/féminin (+neutre dans certaines langues), du singulier/pluriel, et les formes conjuguées des verbes.
Lorsque l'option "formes fléchies" est activée (ce qui est le cas par défaut), le moteur donnera les mêmes résultats quelque soit la forme d'un même mot entrée par l'utilisateur.
Par exemple, une recherche sur le mot cheval donnera les résultats complets en recherchant aussi avec le mot chevaux, pluriel de cheval. De même en anglais, une recherche sur oxen donnera les mêmes résultats qu’avec le mot ox.
Le moteur tient également compte de formes différentes d'un même mot (par ex : beau, bel, beaux, belle, belles ; oeil, œil, yeux).
Cette fonctionnalité s’applique aux noms, adjectifs et verbes. Active par défaut, elle peut être désactivée par l’utilisateur.
|
| Opérations booléennes (résumé) |
L’interface conviviale du moteur de recherche REFLEXION évite à l’utilisateur l’emploi des opérations booléennes rebutantes et sources d’erreurs : le moteur se charge lui-même de traduire la demande de l’utilisateur en requêtes utilisant les opérations booléennes (ET, NON, OU) adaptées à cette demande. Voir aussi : Opérations booléennes (pour les connaisseurs). |
| Proximité |
Permet de retenir parmi les documents contenant les mots entrés, seulement ceux où le premier et le dernier mot sont séparés par n mots au plus (les mots dits banals – voir ci-dessous – sont comptés).
L’idée est que la proximité des mots dans un même document donne une bonne indication de la pertinence de ce document par rapport à l’ensemble des concepts qui intéressent l’utilisateur.
|
| Expressions |
Cette option permet de rechercher les documents contenant exactement la phrase ou expression entrée par l’utilisateur. |
| Termes à exclure |
Cette option restrictive permet d’éliminer de la liste de résultats tous les documents contenant l’un des mots à exclure (ou l’une de ces formes si l’option « formes fléchies » est active). |
| Le traitement des langues |
Le moteur de recherche REFLEXION traite actuellement le français et l’anglais.
La base de données linguistique française contient environ 290 000 formes relevant de plus de 62 000 familles de mots (noms, adjectifs, verbes, et autres catégories grammaticales).
La base de données linguistique anglaise contient 148 000 formes relevant de plus de 80 000 familles de mots. Des bases linguistiques pour d'autres langues peuvent être ajoutées sur votre demande.
|
| Mots dits « banals » |
Il s’agit de mots tels que pronoms, conjonctions, etc, qui ne se réfèrent pas à des objets, concepts ou actions : ces mots sont indexés mais ne sont pas pris en compte dans la recherche. REFLEXION propose dans chaque langue une liste d’environ 300 mots banals que l’administrateur peut personnaliser par ajout, suppression ou modification. |
| Caractères accentués |
Le moteur de recherche REFLEXION prend en compte les lettres accentuées et le c cédille. Mais il offre aussi à l'utilisateur la possibilité d'oublier les accents, tout en obtenant, dans la plupart des cas, des résultats identiques
(sauf pour les cas ambigus comme surr / sûr ou cote / côté / côte). |
| Caractères « ligatures » |
Ce terme désigne en français les caractères liant deux voyelles en un seul caractère : æ, Æ, œ et Œ. Les ligatures apparaissent dans la typographie des documents et sont donc prises en compte dans l’indexation, et stockées sous forme de deux voyelles : l’utilisateur peut entrer ces caractères sous forme de 2 voyelles ou sous forme de ligature (s'il peut le faire sur son clavier ou avec une combinaison de codes ASCII) . La recherche donnera tous les documents contenant indifféremment ces deux formes. |
| Mélange de caractères |
L’utilisateur peut entrer tout mot composé de lettres, de chiffres et de traits d’union.
Le joker '*' peut être utilisé pour remplacer uen suite de caractères, mais seulement en fin de mot. |
| Séparateurs |
Est considéré comme mot toute chaîne de caractères précédée et suivie par un caractère séparateur.
Le moteur de recherche REFLEXION prend en compte plus de 50 caractères séparateurs dont une dizaine sont utilisés couramment.
Il peut donc indexer des textes ayant des ponctuations diverses, des plus courantes aux plus rares. |
| Efficacité de la recherche grâce au codage des mots |
Le moteur de recherche REFLEXION utilise un système de codage des mots qui lui confère d'excellentes performances de recherche en optimisant les temps de réponse. De plus, ce système est à la base de l'efficacité linguistique du moteur. Bien entendu, ce codage est transparent pour l'utilisateur. |
| Réduction des ambiguïtés |
Le moteur de recherche REFLEXION résout une partie des ambiguïtés dès l’indexation en privilégiant les utilisations les plus fréquentes (notamment par un ordre de priorité décroissante noms - adjectifs – verbes). |
| Exhaustivité |
Le moteur de recherche REFLEXION est exhaustif lors de la recherche sur un corpus donné, grâce à sa recherche en texte intégral et à ses bases linguistiques fines et étendues, et grâce à sa technique d’indexation qui prend en compte les mots nouveaux. Le fait qu’une recherche sur un mot (avec flexions) ne donne aucun résultat signifie que ce mot n’est pas présent dans le corpus sous l’une ou l’autre de ses formes grammaticales. De plus, le moteur prévient l’utilisateur si un mot entré n’est présent ni dans la base linguistique ni dans la liste des mots nouveaux du corpus. |
| Opérations booléennes (pour les connaisseurs) |
Les opérations booléennes sont définies par rapport à la notion de « document élémentaire » telle que définie lors de l’indexation, et à la propriété « contenant tel mot », ce qui peut les rendre assez complexes en pratique.
Les mots entrés dans la zone de saisie sont liés par l’opérateur ET. Par exemple : on cherche les documents contenant chacun cheval ET course.
Les formes fléchies de chacun des mots sont liées par l’opérateur OU INCLUSIF. Par exemple : on veut les documents contenant chacun (cheval OU chevaux OU les deux formes) ET (course OU courses OU les deux formes).
Les mots entrés dans la zone de saisie « exclusions » sont liés entre eux par l’opérateur OU INCLUSIF au niveau du document élémentaire. Par exemple : on exclut les documents contenant chacun boucherie OU boucheries OU abattoir OU abattoirs OU toute combinaison de ces formes.
Finalement, la même question complète pourra être exprimée de la façon suivante :
« Trouver l’ensemble des documents contenant chacun (cheval OU chevaux) ET (course OU courses) moins l’ensemble des documents contenant (boucherie OU boucheries OU abattoir OU abattoirs) ».
Cela peut donner lieu à des expressions booléennes différentes selon la méthode de sélection choisie.
|
| Présentation des résultats |
Le moteur de recherche REFLEXION présente à l'utilisateur la liste des documents satisfaisant aux critères et options de recherche indiqués. La mise en forme de cette liste et le choix des informations à afficher est entièrement paramétrable dans le module d'administration. |
| Pertinence |
Le moteur de recherche REFLEXION classe par pertinence décroissante la liste des documents répondant à la question de l'utilisateur.
Pour chaque document est calculé un indice (ou rang) de pertinence qui tient compte de plusieurs facteurs, notamment :
le poids relatif de chaque document dans le corpus indexé et par rapport à sa langue,
le nombre d'occurrences des mots clés dans le document et dans le corpus.
|
| Surlignage des mots recherchés |
Le clic sur l'un des titres de la liste provoque l'affichage du document sélectionné. Les mots recherchés présents dans le document apparaissent en couleur (cette fonctionnalité s'applique aux documents de type texte, html ou asp). |