Fichiers identiques mais differents

Fermé
MrSlave Messages postés 2587 Date d'inscription lundi 28 avril 2008 Statut Membre Dernière intervention 26 août 2011 - 13 sept. 2010 à 10:26
MrSlave Messages postés 2587 Date d'inscription lundi 28 avril 2008 Statut Membre Dernière intervention 26 août 2011 - 13 sept. 2010 à 11:03
Bonjour,

J'ai un petit soucis concernant des fichiers xml que j'utilise dans une appli de reporting.
J'utilise des fichiers xml présents dans une ancienne appli, et ceux ci fonctionnent sans problème. Mais si je copie le contenu d'un de ces fichiers, le nouveau fichier pose problème.

Par exemple, si je copie le contenu du fichier "Current_Year.xml" dans un nouveau fichier "test.xml", d'une part la taille ne sera pas la même 177ko contre 89ko pour le nouveau fichier, et de plus, lors d'un XmlDocument.load, le nouveau fichier va planter parce qu'il contient des caractères spéciaux. Ces caractères sont présents dans l'ancien fichier mais ne posent pas de problème.

Le contenu étant exactement identique, j'aurai aimé savoir si quelqu'un savait pourquoi ces fichiers étaient si différents. :/

Je vous remercie.
A voir également:

2 réponses

Reivax962 Messages postés 3671 Date d'inscription jeudi 16 juin 2005 Statut Membre Dernière intervention 11 février 2021 1 011
Modifié par Reivax962 le 13/09/2010 à 10:54
Bonjour,

Tu as typiquement un problème d'encodage.
On peut s'en douter en voyant que la taille du nouveau fichier est deux fois plus petite : les caractères doivent être codés sur un octet, contre deux pour le fichier d'origine.

Si tu utilises Notepad++, tu peux facilement remédier à cela :
Ouvre les deux fichiers. En bas à droite, l'encodage utilisé est affiché (ex. : ANSI, Unicode...)
Il ne te reste qu'à convertir ton nouveau fichier dans le même encodage que l'ancien.
Par exemple, Menu Encodage, option Convertir en ***, et n'oublie pas de le sauvegarder.

Si tu utilises un autre logiciel, soit il a une option similaire, je te laisse la trouver, soit il n'en a pas (comme le bloc-note windows), et il est alors temps de changer de crêmerie ;)

Xavier

PS : l'encodage est la façon dont les textes sont représentés en binaire. Plus l'informatique (et la mémoire disponible) évolue, plus l'encodage utilisé est complexe. Au début, on ne pouvait avoir que les caractères de base, sans accents : c'était l'ASCII, codé sur 7 bits (128 caractères possibles). Au fur et à mesure, on a inclus des caractères plus complexes. En UTF-8, on peut coder du cyrillique, du japonais, du chinois... Il utilise de 1 à 4 octets suivant les caractères à coder.
1
MrSlave Messages postés 2587 Date d'inscription lundi 28 avril 2008 Statut Membre Dernière intervention 26 août 2011 146
13 sept. 2010 à 11:03
Raaa, mais quel con. >.<

Je te remercie, c'était tout à fait ça. :)
J'ai tout mis en Unicode, pis plus de problème.
J'utilise conTEXT, donc pas de soucis, il y a bien l'option pour changer. ^^
0