Bonjour,
Je récupère un flux xml et j'affiche les infos qui m'interesse avec le parser de php. Le but est d'inserer ces infos dans une bdd mysql ensuite...
J'ai un problème dès qu'il y a des accents dans les donées xml...
Mon flux est encodé en utf-8, je conserve cet encodage dans mon fichier php, mais dès que le parser croise un caractere accentué, il coupe la chaine et n'affiche que les lettres qui suivent l'accent ???
J'ai fais des recherche un peu partout et je n'ai pas trouvé de discussion à ce sujet...
Merci de votre aide.
Voila mon parser :
<?php
header('Content-Type: text/xml; charset=utf-8');
$fichier = "http://www...";
// Ma propre fonction de traitement des balises ouvrantes
function fonctionBaliseOuvrante($parseur, $nomBalise, $tableauAttributs)
{
// En fait... nous nous conteterons de mémoriser le nom de la balise
// afin d'en tenir compte dans la fonction "fonctionTexte"
global $derniereBaliseRencontree;
$derniereBaliseRencontree = $nomBalise;
}
// Ma propre fonction de traitement des balises fermantes
function fonctionBaliseFermante($parseur, $nomBalise)
{
global $derniereBaliseRencontree;
global $nom_salle;
global $ville;
global $nom_manif;
global $genre;
global $url;
global $date_debut;
global $date_fin;
switch ($nomBalise) {
case "MANIF" :
// nous quittons un bloc item
// nous pouvons afficher le titre de l'article
echo "$nom_salle<br />";
echo "$ville<br />";
echo "$nom_manif<br />";
echo "$genre<br />";
echo "$url<br />";
echo "$date_debut<br />";
echo "$date_fin<br /><br /><br />";
}
// On oublie la dernière balise rencontrée
// et tout le reste
$derniereBaliseRencontree = "";
}
// Ma propre fonction de traitement du texte
// qui est appelée par le "parseur"
function fonctionTexte($parseur, $texte)
{
global $derniereBaliseRencontree;
global $nom_salle;
global $ville;
global $nom_manif;
global $genre;
global $url;
global $date_debut;
global $date_fin;
// Nous n'affichons pas le texte ou lien directement
// nous attendrons de rencontrer la balise fermante
// et ainsi d'avoir tous les élements avant l'affichage.
// ATTENTION: Par défaut les noms des balises sont
// mises en majuscules
switch ($derniereBaliseRencontree) {
case "NOM_SALLE":
$nom_salle = $texte;
break;
case "VILLE":
$ville = $texte;
break;
case "NOM_MANIF":
$nom_manif = $texte;
break;
case "GENRE":
$genre = $texte;
break;
case "URL":
$url = $texte;
break;
case "DATE_DEBUT":
$date_debut = $texte;
break;
case "DATE_FIN":
$date_fin = $texte;
break;
}
}
// Création du parseur XML
$parseurXML = xml_parser_create();
// Je précise le nom des fonctions à appeler
// lorsque des balises ouvrantes ou fermantes sont rencontrées
xml_set_element_handler($parseurXML, "fonctionBaliseOuvrante"
, "fonctionBaliseFermante");
// Je précise le nom de la fonction à appeler
// lorsque du texte est rencontré
xml_set_character_data_handler($parseurXML, "fonctionTexte");
// Ouverture du fichier
$fp = fopen($fichier, "r");
if (!$fp) die("Impossible d'ouvrir le fichier XML");
// Lecture ligne par ligne
while ( $ligneXML = fgets($fp, 1024)) {
// Analyse de la ligne
// REM: feof($fp) retourne TRUE s'il s'agit de la dernière
// ligne du fichier.
xml_parse($parseurXML, $ligneXML, feof($fp)) or
die("Erreur XML");
}
xml_parser_free($parseurXML);
fclose($fp);
?>

Pour être capable de lire les accents dans le fichier XML il a besoin de faire un <![CDATA[...]]>, mais une fois les accents lus, pour les afficher comme faut, il faut utiliser utf8_decode() malgrès le fait qu'on soit en ISO-8859-1
MERCI MILLE FOIS!
En effet tu avais raison pour le utf8_decode() et contrairement à bussy 14 message precedent je n'utilise pas du tout !CDATA dans mon XML!! :D ;, apres 1000 et 1 recherches : j'utilise donc dans ma fonction de traitement des caracteres intra balises :
function char($parser,$data) {
global $balise_ouv;
global $n;
global $tab;
$tab[$n][$balise_ouv].=utf8_decode($data);
// echo $data . " ";
}
en header de mon parser.php je mets : header('Content-Type: text/xml; charset=ISO-8859-1');
en tete de mon fichier xml je fous : <?xml version="1.0" encoding="iso-8859-1"?>
Et envoie la sauce mon coco!! ID ID ID
Ouf!! :D
// Fonction associée à l'événement données textuelles
function characterData($parser, $data)
{
global $globaldata;
if ($globaldata != "")
{
$globaldata = $globaldata . $data;
}
else
{
$globaldata = $data;
}
// echo "<font color=red>".$data."</font><br>";
}
et à la fin de votre fonction associée à l'événement fin d'élément
function endElement($parser, $name)
il faut finir par l'instruction $globaldata = "";
à savoir :
function endElement($parser, $name)
{
...
$globaldata = "";
}
et voilà !
lors du traitement des noeuds :
<N1> contenu quelconque </N1>
<N2> contenu é avec à â accent(s) </N2>
la lecture de N2 n'affichera plus seulement "â accent(s)", mais la concaténation de "contenu "+"é avec "+"à "+â accent(s)"
hope it'll help you ='D