Modifier contenu de plusieurs cellules qui se ressemblent avec le même contenu

Signaler
Messages postés
18
Date d'inscription
mercredi 27 février 2019
Statut
Membre
Dernière intervention
18 février 2020
-
 eugene -
Bonjour à tous,

J'ai un fichier excel avec 38 148 lignes, chaque ligne contient des infos sur des articles scientifiques : ex
Goldsby, T.J., Griffis, S.E., Roath, A.S., Modeling lean, agile, and leagile supply chain strategies (2006) Journal of Business Logistics, 27 (1), pp. 57-80

Je souhaite par la suite calculer les fréquences, c'est à dire combien de fois l'article de Goldsby apparaît.
Le problème c'est que parfois, Goldsby va être écrit avec une majuscule, parfois une minuscule, parfois le journal sera "Journal of Business Logistics" parfois "Journal of Bus Log".
Faussant par la suite mes résultats de fréquence.

Pensez-vous qu'il existe une fonction excel qui fasse en gros : des que les cases se ressemble, remplace tout par le même ?

En gros : Si A1 ressemble à A2 et/ou à A3 alors remplacer A1, A2 et A3 par A1 (et ainsi de suite avec tous les articles)

Par ce que sinon je suis entrain de le faire à la main, mais je pense qu'avec ce nombre de lignes j'en ai encore pour plusieurs années.

Merci d'avance !!

6 réponses

Messages postés
50954
Date d'inscription
lundi 13 août 2007
Statut
Contributeur
Dernière intervention
18 février 2020
12 115
Bonjour.
Pensez-vous qu'il existe une fonction excel qui fasse en gros : des que les cases se ressemble, remplace tout par le même ? En gros : Si A1 ressemble à A2 et/ou à A3 alors remplacer A1, A2 et A3 par A1 (et ainsi de suite avec tous les articles)

Non, je n'en connais pas. Tu devras probablement passer par une macro, si tu connais VBA.

Avec les outils classiques Tri et Filtre, je crains que 38000 lignes, cela fasse ramer Excel ...
Mais tu pourrais d'abord effectuer un tri, puis fractionner ton tableau en 10 ou 50 tableaux plus petits (par exemple une feuille pour les lignes commençant par A) ...
Dans un troisième temps, tu pourrais appliquer un filtre automatique personnalisé, ou carrément un filtre avancé https://support.office.com/fr-fr/article/filtrer-à-l-aide-de-critères-avancés-4c9222fe-8529-4cd7-a898-3f16abdff32b
Parvenu à ce stade, tu peux utiliser l'outil Remplacer (Ctrl+H) ...

Mais c'est peut-être bien ce que tu voulais dire par "je suis en train de le faire à la main" ?

Cordialement.
Raymond PENTIER
Messages postés
50954
Date d'inscription
lundi 13 août 2007
Statut
Contributeur
Dernière intervention
18 février 2020
12 115
Quelle taille fait ton fichier ?
jujumty
Messages postés
18
Date d'inscription
mercredi 27 février 2019
Statut
Membre
Dernière intervention
18 février 2020

Exactement j'ai commencépar filtrer par nom.
Je copie colle la case A1 dans A2, A3... A15 (si c'est le même article mais écrit de façon différente).
Le problème c'est qu'en plus d'être très long je peux, sans faire exprès, une erreur manuelle. (par exemple collé encore A1 dans A16 alors que c'est un article différent...)
J'aurais aimé une solution automatique.
Je connais un peu VBA (je ne suis pas très douée), mais je ne saurais même pas quoi mettre dans la macro.. auriez-vous une idée ?
Messages postés
18
Date d'inscription
mercredi 27 février 2019
Statut
Membre
Dernière intervention
18 février 2020

Bonjour,
il fait 6 612 Ko
Messages postés
23265
Date d'inscription
mardi 11 septembre 2007
Statut
Contributeur
Dernière intervention
18 février 2020
5 919
Bonjour,

tu as l'addin Fuzzy Lookup (recherche floue) de MS qui pourrait t'aider ici : https://www.microsoft.com/en-us/download/details.aspx?id=15011
Une présentation ici : http://www.emarketeur.fr/ressources/productivite/comparaison-listes-excel-fuzzy-logic-donne-coup-de-vieux-vlookup/

Le soucis que tu risques de rencontrer est que tu veux une recherche approximative (déjà pas fiable à 100%) mais surtout sur une partie de chaine ce qui t'oblige à baisser le seuil d'acceptabilité, et donc plus de faux positifs....
eric


jujumty
Messages postés
18
Date d'inscription
mercredi 27 février 2019
Statut
Membre
Dernière intervention
18 février 2020

Je te remercie ! ça à l'air génial et exactement ce dont j'ai besoin.
Seule question, dans l'exemple de emarketour, il compare entre deux colonnes, malheureusement je n'en ai qu'une. Penses-tu que ça fonctionne ?
eriiic
Messages postés
23265
Date d'inscription
mardi 11 septembre 2007
Statut
Contributeur
Dernière intervention
18 février 2020
5 919 > jujumty
Messages postés
18
Date d'inscription
mercredi 27 février 2019
Statut
Membre
Dernière intervention
18 février 2020

hum, je ne pense pas que ce soit adapté pour ce fonctionnement.
En plus je ne sais pas si te rends compte de ce que représente de faire 38000! comparaisons, sur des chaines où c'est bien lent en plus.
Même si tu loues l'ordinateur du CEA ça risque d'être juste. Attend les processeurs quantiques ;-)

Il faudrait découper le travail.
En te créant un dictionnaire des auteurs dans une autre colonne déjà, pour les normaliser.
Ensuite pour les expressions, je ne vois pas trop comment simplifier...
Dépose un fichier sur cjoint.com qu'on voit à quoi ça ressemble, mais je ne le sens pas bien...
eric
jujumty
Messages postés
18
Date d'inscription
mercredi 27 février 2019
Statut
Membre
Dernière intervention
18 février 2020
> eriiic
Messages postés
23265
Date d'inscription
mardi 11 septembre 2007
Statut
Contributeur
Dernière intervention
18 février 2020

C'est bon le document est sur le site, il s'appelle BDD 678 scopus. c'est un out file (je l'ouvre avec excel cela fonctionne) :D
Voici le lien !
https://www.cjoint.com/c/JBkiIleTuuM
Messages postés
18
Date d'inscription
mercredi 27 février 2019
Statut
Membre
Dernière intervention
18 février 2020

Oui en effet j'ai passé la fin du dimanche à regarder ce qui se rapproche le plus c'est l' algorithme Levenshtein mais en macro déjà pour 100 lignes ça bug alors plus de 38 000 x 38 000 je pense que ça ne passera jamais... je vous mets quand même le fichier au cas ou mais je pense que je vais faire les plus important à la main, enlever toutes les majuscules, faire un recherche et remplace sur les journaux les plus connus et voilà hahaha !

Merci quand même :D
Messages postés
50954
Date d'inscription
lundi 13 août 2007
Statut
Contributeur
Dernière intervention
18 février 2020
12 115


Voici ce que j'ai pu élaborer pour commencer :
https://cjoint.com/c/JBkxI5sMDoM
jujumty
Messages postés
18
Date d'inscription
mercredi 27 février 2019
Statut
Membre
Dernière intervention
18 février 2020

Super merci beaucoup, je vais essayer comme ça et voir :D
Bonjour,
Peut-être pourriez-vous voir du côté de la fonction Excel / Données / Convertir, délimité par des virgules, ce qui découperait votre tableau en tranches, et utiliser la fonction de filtre automatique.
Si cela peut faire avancer le schmilblick...
Cordialement
https://cjoint.com/c/JBlgK3FaOzN
https://cjoint.com/c/JBlg2rw63uN
jujumty
Messages postés
18
Date d'inscription
mercredi 27 février 2019
Statut
Membre
Dernière intervention
18 février 2020

Merci beaucoup, j'avais essayé cette étapes mais ça ne rendait pas aussi bien, j'avais des problèmes avec mes colonnes !
> jujumty
Messages postés
18
Date d'inscription
mercredi 27 février 2019
Statut
Membre
Dernière intervention
18 février 2020

Je vous avais suggéré ces fonctions à tout hasard.
Par curiosité, est-ce que cela vous a effectivement aidé ?