Pandas UnicodeDecodeError

Fermé
salahoum Messages postés 21 Date d'inscription mardi 15 janvier 2019 Statut Membre Dernière intervention 4 mars 2019 - 29 janv. 2019 à 10:16
salahoum Messages postés 21 Date d'inscription mardi 15 janvier 2019 Statut Membre Dernière intervention 4 mars 2019 - 6 févr. 2019 à 18:19

Bonjour,
y'a un solution ?


Configuration: Windows / Chrome 71.0.3578.98
A voir également:

2 réponses

jordane45 Messages postés 38144 Date d'inscription mercredi 22 octobre 2003 Statut Modérateur Dernière intervention 21 avril 2024 4 650
29 janv. 2019 à 10:33
Bonjour,

Les images ne nous permettant pas de copier/coller si besoin....., merci de poster tes codes sur le forum en utilisant les BALISES DE CODE
Explications disponibles ici : https://codes-sources.commentcamarche.net/faq/11288-les-balises-de-code




0
salahoum Messages postés 21 Date d'inscription mardi 15 janvier 2019 Statut Membre Dernière intervention 4 mars 2019
29 janv. 2019 à 11:02
mais monsieur le code est très petit
import pandas as pd
df = pd.read_csv("transfoo.csv")
le problème est l'erreur
et merci
0
Whismeril Messages postés 19026 Date d'inscription mardi 11 mars 2003 Statut Contributeur Dernière intervention 20 avril 2024 931 > salahoum Messages postés 21 Date d'inscription mardi 15 janvier 2019 Statut Membre Dernière intervention 4 mars 2019
29 janv. 2019 à 12:06
Y’a pas de mais, c’est la troisième fois (au moins) qu’on te le demande.
C’est aussi la troisième fois (au moins) qu’on te demande de rester dans la discussion initiale
https://forums.commentcamarche.net/forum/affich-35822704-lire-et-ecrire-des-csv-en-python
0
salahoum Messages postés 21 Date d'inscription mardi 15 janvier 2019 Statut Membre Dernière intervention 4 mars 2019 > Whismeril Messages postés 19026 Date d'inscription mardi 11 mars 2003 Statut Contributeur Dernière intervention 20 avril 2024
5 févr. 2019 à 11:29
je m’excuse
0
[Dal] Messages postés 6174 Date d'inscription mercredi 15 septembre 2004 Statut Contributeur Dernière intervention 2 février 2024 1 083
Modifié le 5 févr. 2019 à 14:24
Donc, ton code est :

import pandas as pd
df = pd.read_csv("transfoo.csv") 

Et l'erreur retournée par pandas est :
"UnicodeDecodeError: 'utf-8' codec can't decode byte ..."
.

Cette erreur peut se produire lorsque le fichier texte que tu passes à pandas a un format d'encodage qui n'est pas Unicode.

Détermine quel est le format d'encodage de ton fichier. Ensuite, passe la description de ce format avec une option "encoding". Par exemple, pour un format en "ISO-8859-15" :

import pandas as pd
df = pd.read_csv('transfoo.csv', encoding = 'ISO-8859-15')

Dal
0
[Dal] Messages postés 6174 Date d'inscription mercredi 15 septembre 2004 Statut Contributeur Dernière intervention 2 février 2024 1 083
Modifié le 5 févr. 2019 à 14:42
Si tu ne connais pas le format d'encodage de ton fichier texte, tu peux essayer de le déterminer (ou de transformer le format en UTF8), en utilisant une des solutions décrites ici : https://stackoverflow.com/questions/33819557/unicodedecodeerror-utf-8-codec-while-reading-a-csv-file/33819765

Par exemple, cette réponse propose d'utiliser la bibliothèque Python chardet pour tenter de déterminer le format :

import pandas as pd
import chardet
with open('filename.csv', 'rb') as f:
    result = chardet.detect(f.read())  # or readline if the file is large

df = pd.read_csv('transfoo.csv', encoding=result['encoding'])
0
Whismeril Messages postés 19026 Date d'inscription mardi 11 mars 2003 Statut Contributeur Dernière intervention 20 avril 2024 931
5 févr. 2019 à 14:44
Bonjour Dal, ce post est un quadruplon...
la discussion initiale est toujours ouverte.
0
[Dal] Messages postés 6174 Date d'inscription mercredi 15 septembre 2004 Statut Contributeur Dernière intervention 2 février 2024 1 083
Modifié le 5 févr. 2019 à 15:11
Bonjour Whismeril ,

J'ai vu ces deux autres fils :

https://forums.commentcamarche.net/forum/affich-35822704-lire-et-ecrire-des-csv-en-python
https://forums.commentcamarche.net/forum/affich-35850203-affichage-fichier-csv

Cependant, la question posée ici est différente, et concerne un problème de format d'encodage d'un fichier passé à la bibliothèque Python pandas empêchant le chargement correct du fichier csv par pandas qui, manifestement, n'affectait pas les éventuels autres fichiers .csv utilisés dans les tests selon les informations échangées. Le fil 35822704 ne concerne pas un problème d'utilisation de la bibliothèque pandas, qui n'est pas utilisée dans le code échangé et le fil 35850203 concerne bien pandas, mais pose une autre question relative au formatage de l'affichage de dataframes par cette bibliothèque (et où aucun problème d'encodage de texte n'affecte la chargement du fichier).

Je ne vois pas que la même question soit posée 4 fois, ou dans 4 posts différents.. mais peut-être ais-je mal vu ?
0
Whismeril Messages postés 19026 Date d'inscription mardi 11 mars 2003 Statut Contributeur Dernière intervention 20 avril 2024 931
5 févr. 2019 à 16:31
Je n’avais pas compris que la question était différente.
Les autres fils ont été supprimés
0
salahoum Messages postés 21 Date d'inscription mardi 15 janvier 2019 Statut Membre Dernière intervention 4 mars 2019 > [Dal] Messages postés 6174 Date d'inscription mercredi 15 septembre 2004 Statut Contributeur Dernière intervention 2 février 2024
6 févr. 2019 à 12:04
apres changer le par Unicode
0