Jeu de caractères dans la commande renameFermé

Question

Bonjour, 

Je souhaite renommer des fichiers avec la commande rename, notamment remplacer les "e" accentués par "e", et je constate un comportement bizarre avec les jeux de caractères définis par "[]". Exemple sur un fichier nommé initialement "titié":
rename -v "s/[éè]/e/g" *
titié renamed as titiee

rename -v "s/é/e/g" *
titié renamed as titie

rename -v "s/[ie]/a/g" *
titie renamed as tataa

Pourquoi le "é" est-il remplacé par "ee" quand il est spécifié dans un intervalle comme dans l'exemple 1 alors que l'exemple 2 montre qu'il est correctement remplacé quand il est spécifié seul et que l'exemple 3 montre que l'usage d'un intervalle est correct...

Configuration: Linux / Firefox 44.0

UnGars · Answer

Salut,

Parce que quand tu écris "s/[ie]/a/g" c'est le i ou le e indifféremment qui sont remplacés par le caractère a et ça autant de fois que nécessaire (présence du g en fin de syntaxe).

Pour un remplacement, c'est y et non s qu'il faut employer et en mettant toutes les correspondances :

$ echo 'éèêëîïôöù' | sed 'y/éèêëîïôöù/eeeeiioou/'eeeeiioou$ echo "l'été sera bientôt là." | sed 'y/éèêëîïôöà/eeeeiiooa/'l'ete sera bientot la.

nolyann · Answer

Salut,

Merci pour ta réponse mais je crois que tu as mal compris ma question.
Dans mes trois exemples, je suis d'accord avec les deux derniers. Mais je ne comprends pas pourquoi dans le premier j'obtiens titiee et non pas titie. L'interprétation de la commande est "si on rencontre un é ou un è, le substituer par un e" et non pas deux...

nolyann · Answer

Salut,
Désolé pour mon silence durant 4 jours.
En fait il semble que le problème existe uniquement quand le caractère à substituer est d'une part accentué et d'autre part entre crochets, même seul. Mes exemples 2 et 3 montrent que ça fonctionne en dehors de ces deux conditions. Personnellement je suis en UTF8 aussi mais en anglais. Question au passage: comment fais-tu pour connaître l'encodage? Y a-t-il une commande?

En fait j'utilise la commande rename dans un script et je voulais cumuler les caractères accentués comme ceci:
rename -v "s/[áàâäãÁÀÂÄÃ]/a/g" *rename -v "s/[éèêëẽÉÈÊËẼ]/e/g" *rename -v "s/[íìîïĩÍÌÎÏĨ]/i/g" *rename -v "s/[óòôöõÓÒÔÖÕ]/o/g" *rename -v "s/[úùûüũÚÙÛÜŨ]/u/g" *
Je devrai donc les écrire dans un appel à rename séparé, ce qui va pas mal ralentir mon script. Tant pis.

dubcek · Answer

hello
1 caractère à la fois, ça passe
$ lsaéè  titié  èèè$ rename -nv 's/é/e/g;s/è/e/g' *aéè renamed as aeetitié renamed as titieèèè renamed as eee$ rename -nv 's/[éè]/e/g' *aéè renamed as aeeeetitié renamed as titieeèèè renamed as eeeeee$

nolyann · Answer

Je ne savais pas qu'on pouvais cumuler des expressions de sed dans rename. Ainsi mon script sera quand-même un peu plus rapide.
Merci à tous pour vos réponses.

dubcek · Answer

essayer ça pour tous les accents
$ C1="ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýþÿ"$ C2="AAAAAAACEEEEIIIIDNOOOOOOUUUUYPSaaaaaaaceeeeiiiionoooooouuuuyby"$ C3="$(for((i=0; i<${#C1}; i++)); do echo -n "s/${C1:$i:1}/${C2:$i:1}/g;"; done)"$ rename -nv "$C3" *
test
$ touch $C1$ lsÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýþÿ $ rename -nv "$C3" *ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýþÿ renamed as AAAAAAACEEEEIIIIDNOOOOOOUUUUYPSaaaaaaaceeeeiiiionoooooouuuuyby

zipe31 · Answer

Re-

Je confirme que c'est un problème d'encodage UTF-8. 
Sur une VM avec Debian 8 en UTF-8 j'ai reconfiguré les locales :

 sudo dpkg-reconfigure locales

en fr_FR@euro, redémarré la session et refait des tests :

jp@debian8:~/trash$ localeLANG=fr_FR@euroLANGUAGE=LC_CTYPE="fr_FR@euro"LC_NUMERIC="fr_FR@euro"LC_TIME="fr_FR@euro"LC_COLLATE="fr_FR@euro"LC_MONETARY="fr_FR@euro"LC_MESSAGES="fr_FR@euro"LC_PAPER="fr_FR@euro"LC_NAME="fr_FR@euro"LC_ADDRESS="fr_FR@euro"LC_TELEPHONE="fr_FR@euro"LC_MEASUREMENT="fr_FR@euro"LC_IDENTIFICATION="fr_FR@euro"LC_ALL=

jp@debian8:~/trash$ touch tétèjp@debian8:~/trash$ lstétèjp@debian8:~/trash$ rename -n -v 'y/[éè]/e/' t*rename(tétè, tete)

jp@debian8:~/trash$ touch tétètàtôtùjp@debian8:~/trash$ lstétè  tétètàtôtùjp@debian8:~/trash$ rename -n -v 'y/éèàôù/eeaou/' t*rename(tétè, tete)rename(tétètàtôtù, tetetatotu)

Jeu de caractères dans la commande rename

7 réponses

Discussions similaires

Newsletters