Rechercher : dans
Par :

Fichiers binaire/texte/ascii

Dernière réponse le 27 mar 2002 à 15:44:43 S, le 26 mar 2002 à 15:16:12 
 Signaler ce message aux modérateurs

Comment reconnait-on un fichier binaire d'un fichier texte ?
et un fichier texte ascii (7 bit) d'un autre (8bit) sous linux ou windows ? peut-on le savoir avec php ?
merci

Meilleures réponses pour « Fichiers binaire/texte/ascii » dans :
Parser un fichier binaire en PHP VoirSupposons que vous ayez enregistré des données binaires dans un fichier, c'est-à-dire un enregistrement brut qui n'est pas traduit en texte. C'est une chose que l'on fait couramment avec certains langages de bas niveau comme le C ou le...
Fichier DAT VoirFormat DAT Un fichier DAT Un fichier .dat est un fichier de données (.DAT signifie data). En général, il s'agit d'un fichier binaire, créé par un programme et utilisable uniquement par ce programme, ce qui signifie qu'il n'est pas censé être ouvert...
PHP - Les fichiers VoirLa gestion des fichiers avec PHP Avec PHP, la création ou la lecture de fichiers est, une fois de plus, assez simple. Il existe une multitude de fonctions dédiées à l'utilisation des fichiers. La communication entre le script PHP et le fichier...
Robots.txt VoirPrésentation du fichier robots.txt Le fichier robots.txt est un fichier texte contenant des commandes à destination des robots d'indexation des moteurs de recherche afin de leur préciser les pages qui peuvent ou ne peuvent pas être indexées. Ainsi...

1

Hilikus, le 26 mar 2002 à 17:02:47

Pour faire la distinction entre fichiers binaire et ascii, tu lit la première ligne de ton fichier : si ca contient que des 0 et 1, alors c'est binaire.

Répondre à Hilikus

2

zebiloute, le 26 mar 2002 à 18:17:50

T' en as d'autres des comme ca ?

Non serieusement a la base ts les fichiers peuvent être considérer comme des fichiers binaires. Cela depende de comment tu les lis.

Je ne penses vraiment po que l on puisse les differencier ne connaissant po le format.

Quand ça veut Po ça veut po !!!
- Et ben y a plus qu'à attendre -

Répondre à zebiloute

3

sebsauvage, le 26 mar 2002 à 18:20:54
  • +2

Bon.

Un bon fichier ASCII standard n'a effectivement aucune valeur supérieure à 7 bits (0...127), mais dans la pratique, on utilise 8 bits (pour coder les caractères accentués par exemple, qui sont absents du code ASCII).

Donc, difficile de les différencier.

Enfin, humainenement, ça saute aux yeux.
Pour un logiciel, c'est moins évident.

Une astuce pour différencier: Faire des statistiques du fichier.
Dans un fichier texte:
- on trouvera en grande majorité des codes < 128.
- on trouvera beaucoup d'espace (code 32).
- on trouvera assez souvent des retours à la ligne (10, 13 ou 13+10 selon la provenance du fichier texte).
- selon la langue, certains caractères se trouveront plus souvent ('e' par exemple).
- on ne trouvera pas généralement pas d'octets de valeur 0 au milieu du fichier.
- les codes ascii inférieurs à 32 sont très rares, en dehors de 9 (tabulation), 10/13 (retours à la ligne) et 12 (saut de page).

Je pense qu'on doit pouvoir s'en sortir avec ça et bricoler une routine capable de discerner les deux avec un assez bon pourcentage de réussite.

Répondre à sebsauvage

4

JP, le 26 mar 2002 à 18:38:45

Merci pour votre aide

voici 2 solutions 100% efficaces qui peuvent vous être utiles

sur UNIX

file mon-fichier pour savoir si on a un fichier binaire (exécutable) ou un fichier texte. On obtient pour un fichier texte, comme sortie mon-fichier : ascii text.

<?
echo exec("file test");
echo "<br>";
echo exec("file test2");
?>

http://amf66.asso.fr/test.php

en invoquant un script Perl

if (-B "$NomFichier") {
print "Le fichier est binaire...\n";
}

Répondre à JP

5

jisisv, le 27 mar 2002 à 15:39:01
  • +1

C'est plutôt dangereux de faire un exec avec n'importe quel fichier, non?

Si le fichier est un exe (sous win$) ou un script/executable sous Unix bonjour les ennuis.

Une r?gle souvent utilisée est de lire les 256 ou 512 premiers
caract?res et d'y rechercher les bytes de valeur inférieure ? 32 .
Si byte décelé --> data binaire
Sinon texte

Rappelons que sous les Unices existe la commande file
qui si le fichier /etc/magic est bien ? jour , fournit
une bonne idée du contenu du fichier
exemple:
johand@zoot:~/tmp/images$ file smiley.gif
smiley.gif: GIF image data, version 89a, 17 x 17

Allways close to Open Source...
Johan Daine

Répondre à jisisv

6

 jisisv, le 27 mar 2002 à 15:44:43
  • +1

Je précise caract?res < 32 différents de \r \n \t
Allways close to Open Source...
Johan Daine

Répondre à jisisv
Collection CommentÇaMarche.net