Rechercher : dans
Par :

Remplacement de caractères UTF8 sous Unix

Dernière réponse le 3 mai 2004 à 20:27:03 Barrand, le 9 jan 2004 à 11:09:57 
 Signaler ce message aux modérateurs

Bonjour,
Je rencontre un petit problème.
J'ai un fichier en UTF8 dans lequel j'ai besoin de supprimer des caractères accentuée. Le remplacement ne semble pas possible par tr.

Auriez vous une solution ?

Merci d'avance

Meilleures réponses pour « Remplacement de caractères UTF8 sous Unix » dans :
Utiliser des accents et autres caractères spéciaux VoirDans la plupart des langages de programmation, on ne peut utiliser directement les accents et autres caractères non-anglosaxon. La solution est l'unicode, une sorte de code universel. Par exemple pour afficher la chaine de caractères : " là, ça...
Sed - Conversion retours chariots DOS (CRLF) / UNIX (LF) VoirConversion format de fichier DOS UNIX / UNIX DOS Préambule Ce qu'il faut savoir Conversion DOS vers UNIX Conversion UNIX vers DOS Préambule Il existe déjà des utilitaires (dos2unix et unix2dos) qui s'acquittent très bien ce...
PHP - Nettoyer une chaîne de caractères VoirVoici une fonction en PHP qui peut être assez pratique, surtout quand on fait de l'URL Rewriting. Cette fonction permet de transformer les caractères de n'importe quelle chaîne de caractères en chaîne non accentuée, en enlevant les caractères...
Télécharger CharView VoirCe programme est nouveau, mais il présente des atouts intéressants. CharView est un outil de visualisation de polices. Le programme permet de visionner les symboles ASCII ( 256 caractères ) ou Unicode ( toutes les polices ). Vous pourrez zoomer,...
VBScript - Les fonctions de chaînes de caractères VoirLes fonctions de chaînes de caractères Fonction Description Filter(InputStrings, Value[, Include[, Compare]]) Sélectionne des chaînes de caractères parmi un tableau de chaînes...
Javascript - Les chaînes de caractères VoirQu'est-ce qu'une chaîne de caractère Une chaîne de caractère est, comme son nom l'indique, une suite de caractères. On la représente par la suite de caractères encadrée par des guillemets simples (') ou doubles ("), sachant que les deux types de...
Le bus USB (Universal Serial Bus) VoirPrésentation du bus USB Le bus USB (Universal Serial Bus, en français Bus série universel) est, comme son nom l'indique, basé sur une architecture de type série. Il s'agit toutefois d'une interface entrée-sortie beaucoup plus rapide que les ports...

1

jisisv, le 9 jan 2004 à 11:36:08

Sous Debian, il y a le package yudit
ii yudit 2.5.4-2 unicode text editor
L'éditeur, il faut aimer, mais celà peut-être utile
Tu peux parcontre utiliser l'utilitaire en ligne de commande fourni: uniconv
[johand@zoot] ~/tmp $cat bidon
ééééé
ààààà
[johand@zoot] ~/tmp $uniconv -in bidon -encode iso-8859-1
ééééé
ààààà

Fait un
°man uniconv
°unniconv --help
et une recherche de package pour ton système sur le net!

Pour ton problème inspire toi d'un truc du genre
uniconv -in bidon -encode iso-8859-1 | tr "éàù" "eau"
uniconv -in bidon -encode iso-8859-1 | tr -d "éàù"
Je ne sais pas ce que tu veux faire exactement...

Johan
The software said "Requires Windows98, Win2000, or better,
So I installed Unix.

Répondre à jisisv

2

jisisv, le 9 jan 2004 à 11:38:07

Petite précision:
uniconv est fourni dans le package yudit !

Johan
The software said "Requires Windows98, Win2000, or better,
So I installed Unix.

Répondre à jisisv

3

 Cédric, le 3 mai 2004 à 20:27:03

Et pour des fichiers? J'ai un serveur Samba, qui était en UTF8, et que j'ai passé en 8859-15 histoire de pouvoir manipuler les fichiers accentués enregistrés par les stations windows.
Tout marche mieux, sauf les anciens fichiers bien sur, qu'il me faut renommer.

Merci
Cédric

Répondre à Cédric