Analyse lexicale d'un texte.

L'analyse des fréquences des mots dans un texte permet des observations intéressantes à propos de ce texte. Il s'agit de comptabiliser la fréquence de chaque mot dans le texte. Cela donne en outre des indications sur le vocabulaire utilisé dans le texte. Ce type d'analyse permet donc d'une part d'extraire le lexique utilisé dans le texte, pour analyser sa richesse, sa diversité, le comparer éventuellement à d'autres tables lexicales, mais en outre il permet de voir quels sont les mots les plus utilisés dans le texte.

 

L'outil présenté ici permet de déposer un texte dans le premiercadre et d'obtenir dans le cadre 2 la liste ordonnée des mots de plus de deux lettres qui le composent selon l'ordre des fréquences.

On dépose le texte à analyser dans le premier cadfre par un simple "copier".

On lance le calcule de fréquence au moyen du bouton "Calculer les fréquences".

Pour normaliser les calculs, le texte est transformé en majuscules et débarrassé des caractères accentués (ils sont remplacés par les majuscules correspondantes).

La liste résultat est présentée sous la forme d'une ligne par mot, chaque ligne contenant le mot et sa fréquence, séparés par une tabulation.

On peut donc récupérer directement ce résultat pour le coller dans un tableur. On obtiendra alors dans le tableur deux colonnes, l'une pour la liste ordonnée des mots, l'autre pour les fréquences.

 

Outil réalisé par Patrick Lanneau

Entrez un texte à analyser Tableau de fréquences