GLOSSARY ENTRY (DERIVED FROM QUESTION BELOW) | ||||||
---|---|---|---|---|---|---|
|
20:59 Jun 13, 2013 |
English to French translations [PRO] Tech/Engineering - Computers: Systems, Networks / File System Connectors / best practice methods to Server installation | |||||||
---|---|---|---|---|---|---|---|
|
| ||||||
| Selected response from: FX Fraipont (X) Belgium Local time: 10:37 | ||||||
Grading comment
|
Summary of answers provided | ||||
---|---|---|---|---|
4 +1 | non stemmatisé / racinisé |
|
non stemmatisé / racinisé Explanation: "HamSpamGram/docs/rapport/chap2_reprensentation_donnees.tex ... https://github.com/sipi/.../blob/.../chap2_reprensentation_d... Avant d'effectuer la génération des fichiers \texttt{arff} à importer dans \textit{WEKA}, le corpus a été stemmatisé\footnote{Stemmatisé $=$ Racinisé}. Dans le but ..." "La racinisation (ou stemmatisation) est le nom donné au procédé qui vise à transformer les flexions en leur radical ou stemme. Il cherche à rassembler les différentes variantes flexionnelle et dérivationnelle d’un mot autour d’un stem. Les techniques utilisées pour ce faire reposent généralement sur une liste d’affixes de la langue considérée et sur un ensemble de règles de désuffixation construites a priori qui permettent, étant donné un mot de trouver son stem. Algorithmes pour racinisation ont été étudiés en informatique depuis 1968. Les meilleurs algorithmes connus de racinisation ont été développés par Lovins (1968) et Porter (1980) Un stemmer (ou racinisateur) est un algorithme de racinisation qui supprime les suffixes flexionnels et dérivationnels pour réduire les différentes formes d'un mot à leur racine. Cette racine doit être comprise dans un sens morphologique : deux mots peuvent ici avoir la même racine morphologique, mais des sens différents. Les moteurs de recherche utilisent des stemmers pour améliorer la recherche d'information. Les mots-clés d'une requête ou d'un document sont représentés par leurs racines plutôt que par les mots d'origine. Plusieurs variantes d'un terme peuvent ainsi être groupées dans une seule forme représentative, ce qui réduit la taille du dictionnaire, c'est-à-dire le nombre de termes distincts nécessaires pour représenter un ensemble de documents. Un dictionnaire de taille réduite permet de gagner à la fois de l'espace et du temps d'exécution." http://kaidokid.wikispaces.com/ |
| ||
Grading comment
| |||
Notes to answerer
| |||
Login to enter a peer comment (or grade) |
Login or register (free and only takes a few minutes) to participate in this question.
You will also have access to many other tools and opportunities designed for those who have language-related jobs (or are passionate about them). Participation is free and the site has a strict confidentiality policy.