Rechercher : dans
Par :

Perl-Bash recherche et extraction d'une ligne

Dernière réponse le 30 nov 2007 à 16:24:04 phoenix1984, le 22 nov 2007 à 15:36:37 
 Signaler ce message aux modérateurs

Bonjour,

je suis débutant en perl ... voici la situation :

je part d'un fichier, ou d'une variable, peut importe ... ce fichier contient plusieurs lignes avec du texte et une valeur ( il s'agit de % d'utilisation et de noms de Filesystem )

ex:

/app 80%
/bin 30%
/toto 25%

je voudrais savoir comment extraire UNIQUEMENT la ligne dont le pourcentage est supérieur à 50% ...

j'arrive à lire un fichier ligne par ligne ... j'arrive à chercher un mot bien précis dans du texte, mais pas à n'extraire qu'une ligne, celle qui contient ce que je cherche ...

Merci de votre aide !!

Configuration: Linux
Firefox 2.0.0.8

Meilleures réponses pour « Perl Bash recherche et extraction d'une ligne » dans :
Comment lire un fichier ligne par ligne VoirComment lire un fichier ligne par ligne Préambule Boucle while Syntaxe Exemple Astuces Bonus Boucle for Syntaxe Préambule Une des erreurs les plus communes dans l'apprentissage des scripts "bash" sous GNU/LInux pour lire un fichier...
[Windows] Démarrer/arrêter un service en ligne de commande VoirL'outil netsh (netsh.exe) permet d'automatiser le démarrage ou l'arrêt d'un service grâce à la ligne de commande suivante : Pour démarrer un service : Net start nom_du_service Pour arrêter un service : Net stop nom_du_service Cela nécessite les...
Exécuter un script shell VoirExécution d'un script Pour pouvoir exécuter un script ou un programme en ligne de commande il y a plusieurs possibilités : 1. Le chemin absolu 2. Le chemin relatif 3. Modifier la variable PATH Note: Le Sha...
Perl - Les fichiers VoirLa notion de filehandle On appelle filehandle (traduisez descripteur de fichier), dans un programme Perl, le nom permettant de manipuler une connexion d'entrée-sortie (les entrées-sorties standards vues précédemment sont connues par les filehandles...
Perl - Introduction VoirHistoire de Perl Perl (Practical Extraction and Report Language) est un langage de programmation dérivé des scripts shell, créé en 1986 par Larry Wall afin de mettre au point un système de News entre deux réseaux. Il s'agit d'un langage interprété...

1

lami20j, le 22 nov 2007 à 15:45:28

Salut,

root@debian:~/trash# cat ccm.pl
#!/usr/bin/perl
use strict;use warnings;
while (<DATA>){
        print if /\s[5-9]\d+%/;
}
__END__
/app 80%
/bin 30%
/toto 25%

root@debian:~/trash# perl ccm.pl
/app 80%


lami20j

Répondre à lami20j

2

jipicy, le 22 nov 2007 à 15:53:19

Salut,

#! /bin/bash

while read ligne
do
if [ "$(grep -o '[0-9][0-9]*' <<<$ligne)" -ge 50 ]
then echo "$ligne"
fi
done < "$1"
;-))

Z'@+...che.
JP : Zen, my Nuggets ! ;-)
Le savoir n'est bon que s'il est partagé.

Répondre à jipicy

3

phoenix1984, le 22 nov 2007 à 16:38:38

Bonjour,

merci à tous les 2 pour votre réponse si rapide !! c'est super j'ai du bash et du per! les 2 codes fonctionnent nikel !

juste une petite chose :

lami20j => comment faire pour aller lire les infos dans un fichier appart ? là il faut que les infos soient sous le _END_

A vous 2 => pour mon exemple j'ai mis "/app 80%" comme exemple ... mais mon fichier est un résultat d'une commande du genre "df -h" ou "bdf -t nfs" ... là si j'utilise vos codes avec mon fichier de résultat j'ai un message d'erreur ... "expression de type entien attendu" ...

merci de m'éclairer pour ne chercher que la valeur xx % dans la ligne ...

derniere petite chose je ne comprend pas exactement:

"print if /\s[5-9]\d+%/;" & "[ "$(grep -o '[0-9][0-9]*' <<<$ligne)" -ge 50 ]"

et c'est mieux de comprendre merci !! :)

Répondre à phoenix1984

4

lami20j, le 22 nov 2007 à 16:45:51

Salut,

voilà

root@debian:~/trash# cat ccm.pl
#!/usr/bin/perl
use strict;use warnings;
while (<>){
        print if /\s(?:[5-9]\d|\d{3,})%/;
}
__END__
root@debian:~/trash# cat phoenix
/app 80%
/bin 30%
/toto 25%
root@debian:~/trash# perl ccm.pl phoenix
/app 80%
root@debian:~/trash# df -h | perl ccm.pl
/dev/hda1             8,8G  5,4G  3,0G  65% /
/home/jacques/a.iso   571M  571M     0 100% /media/cdrom0
je vais t'expliquer plus tard, j'ai améliorer la regex ;-)
lami20j

Répondre à lami20j

5

phoenix1984, le 22 nov 2007 à 17:09:49

Whaoo !

tout simplement génial la dernière commande ! je l'ai couplé avec un ssh et du coup j'execute le "df -h" sur un poste distant en filtrant avec le fichier perl !! nikel !

par contre je comprend vraiment pas cette ligne : "print if /\s(?:[5-9]\d|\d{3,})%/;" .... c'est là dedans que tu as choisis de filtrer tout ce qui est au dessus de 50% ??

je ne vois pas trop où ( utilie pour faire une modif' ultérieure :)

merci encore !

Répondre à phoenix1984

6

jipicy, le 22 nov 2007 à 17:20:51

Voilà le script modifié :

#! /bin/bash
# Décommenter pour débuguer
#set -xv

while read ligne
do
# On récupère dans une variable le résultat de la commande "grep -o"
#+ "grep -o" ne récupère que le motif correspondant à l'expression régulière mise entre guillemets
#++ dans ton cas, au moins un chiffre (ou plusieurs) suivi(s) du caractère "%"
#+++ le "<<<$variable" est une façon plus simple de lire une variable sur le flux d'entrée
num=$(grep -o '[0-9][0-9]*%' <<<$ligne)
# On compare la valeur de la variable en l'amputant du caractère "%" à l'aide de l'expansion des
#+ variables, voir le man bash à ce sujet 
#++ et on redirige les erreurs dues à une variable vide vers le néant
if [ "${num/\%/}" -ge 50 ] 2>/dev/null
then echo "$ligne"
fi
done < "$1"
;-))

Z'@+...che.
JP : Zen, my Nuggets ! ;-)
Le savoir n'est bon que s'il est partagé.

Répondre à jipicy

7

lami20j, le 22 nov 2007 à 19:36:13

#!/usr/bin/perl
use strict;use warnings;
while (<>){ # cette opérateur permet de lire les lignes
            # des fichiers passer en arguments
  print if /\s(?:[5-9]\d|\d{3,})%/; # affiche seulement les lignes
                                    # qui correspondent à la regex
}
__END__
/\s(?:[5-9]\d|\d{3,})%/

\s - reconnaît un espace
(?: ) permet le regroupement sans capture
1er alternative [5-9]\d
[5-9]\d - trouves toutes les nombre plus grands que 50 jusqu'à 99
[5-9] - c'est une classe de caractères qui permet de reconnaître 5,6,7,8 ou 9
\d - c'est une classe de caractères qui reconnaît les chiffres de 0 à 9
donc on peut la lire comme ça
50
51
.
.
59
60
.
.69
.
.
90
.
.
99


2ème alternative \d{3,}
reconnaît les nombres de minimum 3 chiffres
elle peut être améliorer vu qu'on cherche les nombres plus grand que 100
ce qui donne [1-9]\d{2,} - nous n'avons pas besoin de reconnaître un group de minimum 3 chiffres qui commence avec 0

l'alternative

| - permet de reconnaître soit la partie gauche soit la partie droite de l'alternative

Voici l'exemple avec la regex modifiée
lami20j@debian:~/trash$ cat ccm.pl
#!/usr/bin/perl
use strict;use warnings;
while (<>){
  print if /\s(?:[5-9]\d|[1-9]\d{2,})%/;
}
__END__
lami20j@debian:~/trash$ df -h | perl ccm.pl
/dev/hda7             9,2G  4,6G  4,2G  52% /
/dev/hda8              28G   15G   12G  56% /home

lami20j

Répondre à lami20j

8

phoenix1984, le 23 nov 2007 à 09:59:42

Un grand merci à lami20j & jipicy !! :)

merci pour les explications détaillées ! je suis d'autant plus content d'avoir 2 réponses ( bash et Perl ) !

J'ai mis vos messages en "Répondent à la question"

vu que cela rentre dans la meme classe, pourriez vous me dire comment faire quelque chose de similaire avec un mot ?

xxx1 is running
xxx2 is running
xxx3 is not running
xxx4 is running
xxx5 is running

J'arrive à faire une recherche de "not" ... mais je n'arrive pas à afficher juste cette ligne ...

mon code :

# Permet d'utiliser des commandes shell .. ici cat .
use Shell qw(cat);

# On entre le contenu du fichier de log dans la variable $contenu
$contenu= cat("../logs/cluster/status_cluster.log");

# Vérification dans $contenu de la présence du mot "not"
if($contenu =~ /(n.*t)/)
{
open(monFile,">../logs/instances/pb_instances.txt");
print monFile"Attention, une instances ne tourne pas :\n $contenu \n";
close(monFile);
.......

merci :)

Répondre à phoenix1984

9

jipicy, le 23 nov 2007 à 10:04:20

Re-

Pour n'afficher que la ligne contenant "not" tu peux faire avec sed :

sed -n '/not/p' fichier
;-))

Z'@+...che.
JP : Zen, my Nuggets ! ;-)
Le savoir n'est bon que s'il est partagé.

Répondre à jipicy

10

lami20j, le 23 nov 2007 à 10:27:55

Salut,

if($contenu =~ /(n.*t)/)
{
open(monFile,">../logs/instances/pb_instances.txt");
print monFile"Attention, une instances ne tourne pas :\n $contenu \n";
close(monFile);


Il ne faut pas mettre open à l'intérieur de la boucle while sinon pour chaque ligne contenant not tu auras un appel système assez couteux
Il faut aussi eviter de sauvegarder dans une variable le contenu d'un fichier

tu ouvre le fichier avant la boucle et tu le ferme après
l'écriture tu le fait dans la boucle

Voici une possibilité

open LOG,"../logs/cluster/status_cluster.log"
    or die "E/$ : $!\n";
open MONFILE,">../logs/instances/pb_instances.txt"
    or die "E/S : $!\n"; 

while (<LOG>){
  print MONFILE "Attention, une instances ne tourne pas :\n $contenu \n" if /\bnot\b/;
}
close(monFile); 

Par convention c'est bien d'utiliser les majuscules pour handle de fichier
lami20j

Répondre à lami20j

11

jipicy, le 23 nov 2007 à 10:31:24

Salut,

Par convention c'est bien d'utiliser les majuscules pour handle de fichier
Quand on manipule trop de langues, on finit par se mélanger les pinceaux ;-DDD

Z'@+...che.

JP : Zen, my Nuggets ! ;-)
Le savoir n'est bon que s'il est partagé.

Répondre à jipicy

12

lami20j, le 23 nov 2007 à 10:33:58

Hello,

Quand on manipule trop de langues, on finit par se mélanger les pinceaux
Heureusement qu'on ne manipule pas les pinceaux pour mélanger les langues ;-DDDDDD
lami20j

Répondre à lami20j

13

jipicy, le 23 nov 2007 à 10:40:40

;-DD

Z'@+...che.

JP : Zen, my Nuggets ! ;-)
Le savoir n'est bon que s'il est partagé.

Répondre à jipicy

14

phoenix1984, le 23 nov 2007 à 12:01:56

Bonjour,
ok lami20j je ne savais pas pour les pinceaux-langues ... je vais corriger tout ca .. merci pour "sed" et "if /\bnot\b/"

par contre je reviens juste sur ton code "/\s(?:[5-9]\d|\d{3,})%/ ". si je comprend bien, c'est l'alternative \d qui gère les unités de 50 ... autrement dit :

/\s(?:[5-9]\d|\d{3,})%/ pour 50%
/\s(?:[8-9]\d|\d{3,})%/ pour 80%
/\s(?:[1-9]\d|\d{3,})%/ pour 10%

par contre ... comment faire pour filter ce qui dépasse 85% ?

j'ai honte ... mais j'ai testé :

/\s(?:[8-9][5-9] |\d{3,})%/

cela ne fontionne pas trop ...

merci ;)

Répondre à phoenix1984

15

lami20j, le 23 nov 2007 à 12:28:06

lami20j@debserv:~/trash$ cat aa
ligne1 80%
ligne2 85%
ligne1 87%%
ligne1 100%
ligne1 10%

lami20j@debserv:~/trash$ perl -ne 'print if /(?:8[5-9]|9[0-9]|[1-9]\d{2,})/' aa
ligne2 85%
ligne1 87%%
ligne1 100%
Cette fois il y a besoin de 3 alternatives

une pour 85 ... 89
une pour 90 ... 99
une pour 100.............

Dans ton exemple [8-9][5-9] ne peux reconnaître que
85 à 89
95 à 99
mais il te manque de 90 à 94

lami20j

Répondre à lami20j

16

lami20j, le 23 nov 2007 à 19:34:04

Salut,

voici encore une possibilité plus simple à gérer.
cette fois il s'agit d'une comparaison numérique, tu n'auras qu'à remplacer 85 avec la valeur que tu voudras

lami20j@debserv:~/trash$ cat ccm.pl
#!/usr/bin/perl
use strict;use warnings;

while(<>){
  (my $val) = $_ =~ /\D(\d+)%/;
  next unless $val;
  print if $val >= 85;
}
lami20j@debserv:~/trash$ cat aa
ligne1 80%
ligne2 85%
ligne1 87%%
ligne1 100%
ligne1 10%

lami20j@debserv:~/trash$ perl ccm.pl aa
ligne2 85%
ligne1 87%%
ligne1 100%


lami20j

Répondre à lami20j

17

 phoenix1984, le 30 nov 2007 à 16:24:04

Nikel ! encore merci ! :)

Répondre à phoenix1984
Collection CommentÇaMarche.net