Rechercher : dans
Par :

Texte: Suppression des doubons et occurence

Dernière réponse le 15 jun 2008 à 23:13:30 Vetruve, le 14 jun 2008 à 02:07:21 
 Signaler ce message aux modérateurs

Bonjour,

Je souhaiterais trouver un logiciel si possibible open source qui a partir d'un fichier texte créer la liste des mots utilisés en supprimant les doublons et en donnant eventuellement l'occurence de chaque mot dans le texte.

Merci

Configuration: Windows XP
Firefox 2.0.0.14

Meilleures réponses pour « Texte: Suppression des doubons et occurence » dans :
Sed - Insertion de texte VoirInsérer du texte dans un fichier Introduction Syntaxe Ajout de texte Insérer une ligne avec "i" Ajouter une ligne avec "a" Échanger une ligne avec "c" Introduction Il est parfois utile de pouvoir insérer du texte en en-tête d'un ou...
Sed - Trucs et astuces VoirSubstitution Affichage Suppression Espace et tabulation Ligne vide Intervalle régulier Divers Joindre des lignes Affichage insensible à la casse Substitution Substituer "foo" par "bar" à chaque ligne Seulement la 1ère...
[Word] Supprimer tous les liens hypertextes VoirLorsque vous copiez-collez un extrait d'une page web, vous risquez fort d'obtenir dans le texte de nombreux liens hypertextes. Voici deux solutions pour supprimer les liens hypertextes d'un document Word. 1° solution : un lien hypertexte à la...

1

BloodyAngel, le 14 jun 2008 à 02:08:21

Hello
bah je te le fais si tu veux... tu me donnes combien ? ^^
Aides-toi et le ciel t'aidera...

Répondre à BloodyAngel

2

Vetruve, le 14 jun 2008 à 02:37:38

Ok, à 20 Euros de l'heure ca me coute combien ?

Répondre à Vetruve

3

BloodyAngel, le 14 jun 2008 à 02:51:48

Bin vu que ça me prendra environs 20 minutes, ça devrait faire +/-5€ ^^
Dans une base de données Access ça te va ?
Sinon je le fais en C# mais il te faut le framework (si ton pc est ok avec les maj windows ça devrait pas poser de soucis).

Aides-toi et le ciel t'aidera...

Répondre à BloodyAngel

6

Vetruve, le 14 jun 2008 à 03:27:48

Non, je préfererai un executable autonome avec un programme ou tu lui rentre le fichier en entrée.
Lorsque tu execute l'application "occurence", le fichier de sortie s'enregistrera au même endroit avec pour nom "nomdufichier-occurence"

A la fin je souhaiterai pourvoir ouvrir le fichier dans excel avec dans la première colonne, les mots triés par ordre alpha et en deuxième colonne le nombre d'occurence.

Option filtrage: pouvoir donner en entrée des mots qu'il faut éliminer (exemple: le, de, je, tu,...).

Répondre à Vetruve

4

Vetruve, le 14 jun 2008 à 02:55:57

Mon premier besoins est de compter les mots.

Mon deuxième besoin est compter les termes:

Exemple: "Les T-Labs sont un centre de recherche où informaiciens et linguistes travaillent pour enseigner aux ordinateurs à s'exprimer comme des être humains."

Je souhaiterai avoir comme résultat

* Centre de recherche, 1
* informaticiens, 1
* linguiste, 1
* enseigner aux ordinateurs, 1
* s'exprimer comme des êtres humains, 1

Répondre à Vetruve

5

BloodyAngel, le 14 jun 2008 à 02:57:27

Oki...
ce que je te propose, c'est qu'un formulaire te permette d'entrer les mots ou morceaux de phrases recherchées (avec des options comme prise en compte des majuscules, etc.). Ensuite un bouton te permet de lancer l'analyse et tu obtiens le résultat...
Aides-toi et le ciel t'aidera...

Répondre à BloodyAngel

7

Vetruve, le 14 jun 2008 à 03:33:30

Non je pense que la deuxième partie est trop complexe car je souhaiterai une analyse automatique. Pour ce deuxième besoin je pense qu'il me faudra un vrai logiciel prevu pour cela. http://labs.translated.net/?l=fr

Sinon pour le premier besoin je t'ai repréciser ma demande. On en reparle demain !?

A+

Répondre à Vetruve

8

Vetruve, le 14 jun 2008 à 14:53:08

Je crois que j'ai trouvé mon bonheur ici. http://www.niederlandistik.fu-berlin.de/textstat/software-en­.html
merci

Répondre à Vetruve

9

 Vetruve, le 15 jun 2008 à 23:13:30

Encore un autre Textstat http://www.lunerouge.org/spip/article.php3?id_article=364
Celui-ci est plus orienté sur les statistiques mais il calcul aussi la fréquence des mots. Il est en français, et plus simple d'utilisation que l'autre. Il n'est par contre pas possible d'ajouter plusieurs fichier à l'analyse contrairement a l'autre.

Répondre à Vetruve