Rechercher : dans
Par :

[Python] manipuler un string

Dernière réponse le 7 déc 2005 à 11:02:47 keloss, le 3 déc 2005 à 17:30:29 
 Signaler ce message aux modérateurs

Cher CCM-eurs

Je suis (encore!) debutant en Python, je cherche transformer une string contenant des nombres et des virgules, points-virgule, \n ou \t en une liste de nombres.

La methode .split ne prend qu'un argument: je ne peux qu'enlever un des elements sus-mentionne..

J'ai essaye d'utiliser les expressions regulieres. Mais je n'arrive pas a faire que re.split enleve tous les elements [,;\n\t]

J'ai tente d'utiliser re.sub pour remplacer ces elements par des espaces (que j'evacue plus tard de la liste avec string.remove)

Encore une fois je n'arrive pas a faire un pattern qui remplace tous les caracteres voulus. Je dois le faire un par un..

Question:

Y a-t-il moyen de faire plus vite? Une expression reguliere pour faire tout ca? Ou mieux une methode de string?

Merci d'avance,

PS; desole pour les accents: je ne maitrise pas le qwerty
<hs>je lisais les premiers episodes de Phrack, la partie PWN en particulier fait vraiment conquete de l'ouest! Tres divertissant</hs>

Meilleures réponses pour « [Python] manipuler un string » dans :
Enregistrer une vidéo en streaming (Youtube, Dailymotion...) VoirDe plus en plus de sites diffusent du contenu vidéo en streaming, c'est-à-dire en diffusion à la demande. Ainsi, il est nécessaire d'être connecté pour pouvoir en lire le contenu, voire de se connecter à partir de la page diffusant le contenu...
Comment regarder des films en streaming ? VoirStreaming payant en Haute définition Films en streaming gratuits sur Youtube et Dailymotion Les films et vidéos libres de droits Le visionnage de films en streaming (flux vidéo) sur internet est payant ou gratuit. La législation...
Comment voir des séries/films en streaming sur Internet ? VoirComment voir des séries/films en streaming sur Internet ? Les adresses légales du streaming Les sites de Catch-up et VOD Chaines TV des FAI Les sites des chaines du câble, satellite et TNT Autres sites et outils de visionnage légal Ce que...
Javascript - L'objet String VoirLes particularités de l'objet String string est un mot anglais qui signifie "chaîne", il s'agit en fait de chaîne de caractères. L'objet String est un objet qui contient un certain nombre de propriétés et de méthodes permettant la manipulation...
Le langage SQL VoirQu'appelle-t-on SQL? SQL (Structured Query Language, traduisez Langage de requêtes structuré) est un langage de définition de données (LDD, ou en anglais DDL Data Definition Language), un langage de manipulation de données (LMD, ou en anglais DML,...
Les structures en langage C VoirDifférence entre une structure et un tableau Un tableau permet de regrouper des éléments de même type, c'est-à-dire codés sur le même nombre de bits et de la même façon. Toutefois, il est généralement utile de pouvoir rassembler des éléments de...

1

kilian, le 3 déc 2005 à 18:07:16
  • +1

Salut,

Tout d'abord tu crées une liste de chiffre (mais en caractères):

chiffres= ('1','2','3','4','5','6','7','8','9')

Metton que tu aies cette chaine à vérifier:
chaine="jsldkgh\rm.qeigj534qshfsgn\n"

Il suffit de faire un test d'appartenance à chiffres pour chaque caractère, et si un élément n'appartient pas à chiffres, on l'élimine.
for caractere in chaine:
        if not caractere in chiffre:
                 chaine=chaine.split(caractere)
                 chaine="".join(chaine)


Et voilà.
Il doit y avoir plus rapide je pense....

Répondre à kilian

2

keloss, le 3 déc 2005 à 18:22:43

--Kilian:

Merci pour cette reponse eclaire! Je vous tiens au courant..

Je precise, en fait j'essaie d'ecrire un programme pour faire un regression lineaire:

Il faut ouvrir un fichier de donnees (juste des coordonnees). Comme file.read() pond une string, je dois en extraire les coordonnees que je vais mettre dans une liste.

Ensuite on verra pour la manipulation des donnees..

Répondre à keloss

3

kilian, le 4 déc 2005 à 22:59:01

Ok. Ben si tu as un soucis n'hésite pas ....

Répondre à kilian

4

Bob El Ahn, le 6 déc 2005 à 17:09:49

Coucou, re,

Dans mon programme (ich bin keloss) je tente de separer une liste en deux: avec un sur 2 elements de la premiere liste dans chaque liste fille.

J'ai commence par faire:

def getxnylist(listemere):
       xlist = [n for n in listemere if listemere.index(n) % 2 == 0]
       ylist = [n for n in listemere if listemere.index(n) % 2 != 0]
       return xlist, ylist


Ahem, evidemment si on a 2 fois le meme element dans la liste mere ca fausse tout..

J'ai donc ruse:
def getxlist(firstlist):
        lx = []
        if firstlist:
                lx = [firstlist[0]] + getxlist(firstlist[2:])         
        return lx               

def getylist(firstlist):
        ly = []
        if firstlist:
                ly = [firstlist[1]] + getylist(firstlist[2:])
        return ly
        
def getxnylist(firstlist):
        """Creates two lists. Each list has one out of two elements of the first list.
        
        The first list will represent x-values, the second  y-values."""
        lx = getxlist(firstlist)
        ly = getylist(firstlist)
        return lx, ly    

Notez la fonction recursive ;-) (en fait j'avais survole le manuel de Ocaml juste avant).

Mais y a-t-il une technique plus rapide (un moyen de slicer une liste avec un pas defini?), plus malin, plus cool: un truc qui pythonne?!

Peace, ~Wonderful Bangladesh~

Répondre à Bob El Ahn

5

Bob El Ahn, le 6 déc 2005 à 17:15:53

Bon mais j'ai tout de meme une beta-beta version a vous offrir (pour ces foules silencieuses qui attendaient un programme de regression lineaire..)

import sys

def main():
        """Will calculate a simple linear regression."""
        try:
                filename = raw_input("Which file to import? ")
                f = open(filename, "r")
                try:
                        stringdata = f.read()
                        f.close()
                        okdata = convert(stringdata)
                        xlist, ylist = getxnylist(okdata)
                        T = len(xlist)
                        Ex = sum(xlist)
                        Ey = sum(ylist)
                        Exsq = listsqsum(xlist)
                        Exy = listxysum(okdata)
                        b2 = (T*Exy - Ex*Ey)/(T*Exsq - Ex**2)
                        b1 = (Ey/T) - b2*(Ex/T)
                        print "yt = " + str(b1) + " + (" + str(b2) + ")Xt"                 
                except ValueError:
                        print "Invalid values in there, sorry, only take numbers.."
                        sys.exit()                
        except IOError:
                print "File does not exist!"
                sys.exit()
                
def convert(ustring):
        """Formats input text file into a list of floating numbers.
        
        Admits anything as separators between numbers but '.'. Will take all nu-
        bers in consecutively, ignoring anything in between. Make sure your x-values
        are first."""
        accepted = ('.', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9')
        
        for char in ustring:
                if not char in accepted:
                        ustring = ustring.split(char)#knock off anything not in
                        ustring = " ".join(ustring)#accepted, replace by whitespace
                        
        ustring = ustring.split()#then split on whitespace
                       
        ustring = [float(num) for num in ustring]#make sure numbers are decimals
        
        return ustring

def alternativeconvert(ustring):
        """Formats through regular expression."""
        pat = re.compile('[^0-9.]')#import re..
        ustring = re.split(pat, ' ', ustring)
        ustring = ustring.split()
        ustring = [decimal.Decimal(num) for num in ustring]#import decimal..
        return ustring
        
def getxlist(firstlist):
        lx = []
        if firstlist:
                lx = [firstlist[0]] + getxlist(firstlist[2:])         
        return lx               

def getylist(firstlist):
        ly = []
        if firstlist:
                ly = [firstlist[1]] + getylist(firstlist[2:])
        return ly
        
def getxnylist(firstlist):
        """Creates two lists. Each list has one out of two elements of the first list.
        
        The first list will represent x-values, the second  y-values."""
        lx = getxlist(firstlist)
        ly = getylist(firstlist)
        if len(lx) != len(ly):
            print "Missing coordinates.. Make sure you have pairs."
            sys.exit()
        else:
            pass
        return lx, ly                  
        
def listsqsum(l):
        """Sums the squares of the elements of a list."""
        total = 0
        if l:
                total = (l[0])**2 + listsqsum(l[1:])
        return total
        
def listxysum(l):
        """Sums the product of the l-list elements two by two."""
        total = 0
        if l:
                total = l[0]*l[1] + listxysum(l[2:])
        return total
        
if __name__ == "__main__":
        main()

        
#TODO:
#code a general summation function --> summation(expression, indexstart, indexstop)
#as yet one can only calculate y=b1+b2x --> allow for different transformations on x
#expand simple linear regression to multiple regression
#add standard errors, R**2 and other interesting values

#def summation(expr, i=0, n):

Bon c'est un debut :-(

Sinon est-ce que quelqu'un connait un bon tuto sur les librairies standard, comme sys et os: ca m'a l'air vachement marrant, j'ai hate de tester les system calls et les flags et tout et tout (nohup here i come!).

Peace, ~Wonderful Bangladesh~

Répondre à Bob El Ahn

6

kilian, le 6 déc 2005 à 20:41:01

Oui il y a un truc plus cool en quelques sortes :-)

def getxlist(firstlist):
        return firstlist[::2]

def getylist(firstlist):
       return firstlist[1::2]


Pour une liste ou une chaîne tu as
liste [premier index : dernier index : tous les n index]

Par exemple si
liste=[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Voilà ce que donneront quelques tests:
liste [1:-2:2] donnera [1, 3, 5, 7]
C'est à dir liste à partir du second caractère jusqu'au -2 ème (un nombre négatif, ça signifie en partant de la fin) et tous les deux index.

Si tu ne mets rien sauf dans le troisième indice: liste [::2], alors il considèrera depuis le premier caractère jusqu'au dernier et tous les deux caractères.

Tu as je ne sais combien de combinaisons.... :-)

Répondre à kilian

7

kilian, le 6 déc 2005 à 20:48:09

Ah et si tu mets un nombre négatif dans le troisième indice:

liste [::-2]

Alors il te ressortira la liste tous les deux éléments et à l'envers :-)

Ca pythonne comme il faut!

Répondre à kilian

8

 keloss, le 7 déc 2005 à 11:02:47

Excellent!

Merci!

Je me sens pousser une langue fourchue et un corps glissant! Ca va pythonner!

Peace,

Répondre à keloss