Article

22 février 2018
Autoveille

Mesures de statistiques textuelles TF-IDF, Rappel, Précision vues par un expert en TAL

Extrait de l’article :

« Le TF-IDF est une méthode historique, fondée dans les années 80, pour implémenter des outils de recherche d’information. L’exemple typique est le moteur de recherche, qui doit sélectionner les documents les plus pertinents pour une requête donnée. Une simple recherche booléenne dans les index donne trop de résultats, qui ne sont pas ordonnés.

L’algorithme TF-IDF pallie cela en exploitant simultanément le nombre d’occurrences des termes (TF) et leur importance sémantique dans la collection de documents (IDF) pour ordonner les résultats, et présenter en haut de la liste ceux qu’un calcul statistique simple nous indique être les plus pertinents. »

Source : AUTOVEILLE

Lien vers l’article : Les mesures de statistiques textuelles TF-IDF