Comment imprimer une liste des mots utilisés dans un texte ?

Résolu/Fermé
Lucjs - 28 mars 2023 à 11:04
 Lucjs - 28 mars 2023 à 14:02

Bonjour,

Ayant un texte en anglais, je voudrais imprimer la liste complète des mots utilisés par fréquence décroissante pour pouvoir détecter rapidement les mots rares et en chercher la signification.

L'extension Grammalecte de Libre Office permet de visualiser cette liste, mais apparemment sans pouvoir l'imprimer ou l'exporter.

Si vous connaissez une extension ou un programme permettant de le faire (je peux éventuellement convertir le texte au format adéquat), merci..

2 réponses

Merci, j'avais bien compris toutes les nuances de la rareté d'un mot, mais là n'était pas la question. Entretemps, j'ai découvert Linguist, extension  de Open Office et j'ai donc installé celui-ci avec l'extension en question, et j'ai le résultat cherché. Résolu, donc. Cordialement.

2
brucine Messages postés 14399 Date d'inscription lundi 22 février 2021 Statut Membre Dernière intervention 1 mai 2024 1 833
28 mars 2023 à 12:44

Bonjour,

Contrairement à Lightproof ou Language Tool (pour rester dans le domaine du gratuit), Grammalecte est franco-français et ignore sauf erreur de ma part tout des autres langues; il n'est en outre pas ou plus mis à jour régulièrement, on voit régulièrement des critiques quant à des bugs, mais c'est une autre question.

En dehors comme je l'ai évoqué de tester avec d'autres correcteurs, Grammalecte ne sort apparemment (je ne m'en sers pas) qu'une copie écran de la "liste de recensement" et ne propose, c'est un inconvénient pour ce qui suit, apparemment qu'un dictionnaire personnalisé.

A ce que je comprends, il ne s'agit pas de mots "rares" dans la langue anglaise, mais de ceux qui le sont pour toi et la fréquence rare d'un mot dans un document (je passe les termes techniques spécifiques) n'augure pas de sa rareté tout court dans la langue, donc seulement quelques pistes.

A défaut que semble exister un fichier disque ou un export du Recenseur, on peut toujours faire une copie écran qu'on conservera en l'état ou qu'on convertira en fichier texte par un logiciel OCR.

Une autre approche est de jouer sur les dictionnaires, si je pouvais en utiliser deux personnalisés anglais (un pour les mots que je connais, l'autre pour ceux que je ne connais pas encore), ce serait parfait mais ce ne semble pas être le cas.

Par contre, le dictionnaire personnalisé est bien lui enregistré dans un fichier xxx.dic, ce qui m'offre probablement différentes pistes.

Je peux, s'il est déjà alimenté, exporter ce dictionnaire personnalisé que je vais remplacer par un vierge; quand je vais lire mon document, je n'ajouterai à ce dictionnaire vierge que les mots que je ne connais pas et j'exporterai le résultat vers un fichier à un autre nom ou bien avec un autre emplacement: en principe, je pourrai ouvrir ce fichier dic avec le Bloc Notes ou Writer.

J'importerai en retour le dictionnaire "original" sauvegardé à la fin de l'opération, quitte à y ajouter les entrées des mots inconnus quand ils ne le seront plus.

On peut peut-être aussi jouer sur les étiquettes; si j'attribue une étiquette spécifique à ces mots inconnus, je vais pouvoir cette à nouveau sauvegarder le dictionnaire cette fois-ci total, mais l'importer dans Calc en 2 colonnes: le filtrage sur la deuxième colonne ne ramènera que les mots inconnus.

0