Rechercher : dans
Par :

Perl : expressions régulières

Dernière réponse le 26 oct 2008 à 14:01:44 deniss92, le 17 jun 2008 à 16:04:36 
 Signaler ce message aux modérateurs

Bonjour,
Je cherche à mettre en place un script sous Perl qui converti le 1er caractère du 1er mot (non numérique) et le 1er caractère du dernier mot en majuscule, dans le champ adresse.

Voici le fichier source :

9999999999N;33000128;TERRIEUR;ALAIN;13 rue thibault chabrand;95240;CORMEILLES EN PARISIS;FRANCE
1234567891Z;44150912;TERRIEUR;ALEX;10 RUE CHARLE DROT;92500;RUEIL MALMAISON;FRANCE
1987654321F;00000178;PEUPLU;JEAN;15 rue bernard de jussieu;92600;ASNIERES SUR SEINE;FRANCE
1357911134G;00000180;OPERA;CHANTAL;25 Rue de la Marne;78800;HOUILLES;FRANCE

le script actuel est le suivant ;

#!/usr/bin/perl
#
# script maj.pl

use POSIX qw(locale_h);

$old_locale = setlocale(LC_CTYPE);

setlocale(LC_CTYPE, "fr_FR.ISO8859-1");

$delimited_in = ';';
$delimited_out = "\t";

use locale;
while (<>)
{
($ine , $id , @tab) = split /$delimited_in/;
$tab[0] =~ s/(\w+)/\u\L$1/g; ### 1ère lettre de la colonne nom du tableau en majuscule.
$tab[1] =~ s/(\w+)/\u\L$1/g; ### 1ère lettre de la colonne prenom du tableau en majuscule.
$tab[2] =~ s/(\pL+)/\u\L$1/g;
#$tab[2] =~ s/^\D+\S(\w+)/\u\L$1/g;
print join $delimited_out, ($id , $ine , @tab) ;
}

setlocale(LC_CTYPE, $old_locale);

Le problème est que le script converti en majuscule le 1er caractère de chaque mot du champ adresse. Et je n'ai pas encore trouvé la bonne syntaxe.

Si quelqu'un a une idée, ce serait vraiment sympa.

Merci d'avance

Configuration: Linux Fedora
Firefox 2.0.0.14

Meilleures réponses pour « Perl : expressions régulières » dans :
[RegExp] Récupérer une adresse IP VoirFinalité Mise en œuvre Explications Interprétation du motif Récupérer une adresse IP Finalité Pour récupérer une IP dans un fichier texte, fichiers journaux, pages web, etc. Mise en œuvre L'expression régulière suivante combinée à la...
Sed - Trucs et astuces VoirSubstitution Affichage Suppression Espace et tabulation Ligne vide Intervalle régulier Divers Joindre des lignes Affichage insensible à la casse Substitution Substituer "foo" par "bar" à chaque ligne Seulement la 1ère...
PHP - Expressions régulières VoirQu'est-ce qu'une expression régulière? Les expressions régulières sont des modèles créés à l'aide de caractères ASCII permettant de manipuler des chaînes de caractères, c'est-à-dire permettant de trouver les portions de la chaîne correspondant au...
Javascript - L'objet RegExp VoirLes particularités de l'objet RegExp L'objet RegExp est un objet permettant de manipuler des expressions régulières, c'est-à-dire des modèles créés à l'aide de caractères ASCII permettant de manipuler des chaînes de caractères, afin de trouver des...

1

deniss92, le 26 oct 2008 à 10:12:15

Bonjour,

J'avais laisser un peu de côté ce script. Voilà le script que j'ai finalement mis en place. Toutefois, on peut faire mieux.

#!/usr/bin/perl
#
# script maj.pl

use POSIX qw(locale_h);

$old_locale = setlocale(LC_CTYPE);

setlocale(LC_CTYPE, "fr_FR.ISO8859-1");

$delimited_in = ';';
$delimited_out = "\t";

use locale;
while (<>)
{
($ine , $id , @tab) = split /$delimited_in/;
$tab[0] =~ s/(\w+)/\u\L$1/g; ### 1ère lettre de la colonne nom du tableau en majuscule.
$tab[1] =~ s/(\w+)/\u\L$1/g; ### 1ère lettre de la colonne prenom du tableau en majuscule.
($num,$prem,@tab2)=split(/ /,lc($tab[2]));## Absorption numéro, rue et le reste en tableau=> le tout en minuscule
$prem=~s/(\w+)/\u\L$1/g;## convertion du premier caractère de la rue en majuscule
$end=pop(@tab2);## extraction du dernier mot du tableau
$end=~s/(\w+)/\u\L$1/g;## convervion du premier caractère de la ville en majuscule
$tab[2]=join ' ',($num,$prem,@tab2,$end);## affectation de l'ensemble dans tab2[]
print join $delimited_out, ($id , $ine , @tab) ;


}

setlocale(LC_CTYPE, $old_locale);

--------------------------------------------------------
Résultat

33000128 9999999999N Terrieur Alain 13 Rue thibault Chabrand 95240 CORMEILLES EN PARISIS FRANCE
44150912 1234567891Z Terrieur Alex 10 Rue charle Drot 92500 RUEIL MALMAISON FRANCE
00000178 1987654321F Peuplu Jean 15 Rue bernard de Jussieu 92600 ASNIERES SUR SEINE FRANCE
00000180 1357911134G Opera Chantal 25 Rue de la Marne 78800 HOUILLES FRANCE

Répondre à deniss92

2

lami20j, le 26 oct 2008 à 13:14:08
  • +1

Salut,

Une autre façon de le faire

#!/usr/bin/perl

while(<>){
  s/^                   # ancrage début chaine
    ([^;]*);            # le 1er champ numérique
    ([^;]*);            # le deuxième
    (\w)([^;]*);        # le nom
    (\w)([^;]*);        # le prénom
    (\d+)\s+(\w)([^;]*) # l'adresse
    \s(\w+);            # 1er mot de la rue
    ([^;]*);            # le code postal
    ([^;]*);            # la ville
    ([^;]*)             # le pays
    /$1 $2 \u$3\L$4\E \U$5\L$6\E $7 \u$8\L$9\E \u\L$10\E $11 $12 $13/x;
  print;
}
Résultat
lami20j@debian:~/trash$ perl ccm0.pl deniss92
9999999999N 33000128 Terrieur Alain 13 Rue thibault Chabrand 95240 CORMEILLES EN PARISIS FRANCE
1234567891Z 44150912 Terrieur Alex 10 Rue charle Drot 92500 RUEIL MALMAISON FRANCE
1987654321F 00000178 Peuplu Jean 15 Rue bernard de Jussieu 92600 ASNIERES SUR SEINE FRANCE
1357911134G 00000180 Opera Chantal 25 Rue de la Marne 78800 HOUILLES FRANCE
106485010510997108

Répondre à lami20j

3

 deniss92, le 26 oct 2008 à 14:01:44

Bonjour lami20j

C'est encore plus puissant ton script.
Les expressions réguliaires sont indigestes ; mais ça simplifie tellement la vie ... !

Merci et bravo

A bientôt

Répondre à deniss92
Collection CommentÇaMarche.net