Rechercher : dans
Par :

[PERL] Suppression caractères non ascii

Dernière réponse le 19 avr 2007 à 09:31:43 fbaviere, le 18 avr 2007 à 14:36:09 
 Signaler ce message aux modérateurs

Bonjour,

Souw Windows, j'ai un fichier avec des caracteres zarbi venant d'un gros système et dont je ne peux changer ni la provenance ni la facon dont il vient.

Je souhaite enlever ces caractères zarbi (ascii invisibles mais hétéroclites....CR,LF,BEL,DC3,STX,NULL...)... ces caractères gène le traitement de awk et sed mais bizarement pas de perl (je n'ai pas compris pourquoi)

Ils sont en fin de ligne et compris entre un DC3 et un LF.


Je compte utiliser la commande suivante en perl
s/\x13....\x0A/\x0D\x0A/g;
et malheureusement cela n'enleve rien.

J'ai raté surement quelquechose


un petit exemple inclu

Un petit coup de pouce serait super!!!

Configuration: Windows XP
Internet Explorer 6.0

Meilleures réponses pour « [PERL] Suppression caractères non ascii » dans :
Supprimer un fichier contenant des caractères spéciaux VoirSi le fichier que vous souhaitez supprimer commence par un caractère "moins" (-), la commande rm risque de prendre la suite comme une option de la ligne de commande. Pour y remédier, une première solution consiste à faire précéder le nom du...
PHP - Nettoyer une chaîne de caractères VoirVoici une fonction en PHP qui peut être assez pratique, surtout quand on fait de l'URL Rewriting. Cette fonction permet de transformer les caractères de n'importe quelle chaîne de caractères en chaîne non accentuée, en enlevant les caractères...
Utiliser des accents et autres caractères spéciaux VoirDans la plupart des langages de programmation, on ne peut utiliser directement les accents et autres caractères non-anglosaxon. La solution est l'unicode, une sorte de code universel. Par exemple pour afficher la chaine de caractères : " là, ça...
Caractères spéciaux HTML VoirCodage des caractères spéciaux Le standard HTML demande de respecter le codage des caractères ASCII 7 bits, c'est-à-dire que les caractères accentués ne sont pas autorisés. Il faut pour cela utiliser un codage particulier. Pour...
Codage Base64 VoirLe codage Base64 Le principe du codage Base 64 consiste à utiliser des caractères US-ASCII (caractères non accentués) pour coder tout type de données codé sur 8 bits. Les protocoles de courrier électronique ont en effet été prévus à...
VBScript - Les fonctions de chaînes de caractères VoirLes fonctions de chaînes de caractères Fonction Description Filter(InputStrings, Value[, Include[, Compare]]) Sélectionne des chaînes de caractères parmi un tableau de chaînes...

1

dubcek, le 18 avr 2007 à 16:12:51

Et avec s/\0x13....\0x0A/\0x0D\0x0A/g; ?

Répondre à dubcek

2

 fbaviere, le 19 avr 2007 à 09:31:43
  • +1

http://cjoint.com/?etjEg10P6W

Merci mais ca ne marche pas mieux ... mais au moins j'ai mis la pièce jointe.

Répondre à fbaviere