Suppression de doublons avec awk

Résolu/Fermé
UnFortMaticien Messages postés 5 Date d'inscription lundi 2 janvier 2012 Statut Membre Dernière intervention 18 janvier 2012 - 2 janv. 2012 à 22:06
UnFortMaticien Messages postés 5 Date d'inscription lundi 2 janvier 2012 Statut Membre Dernière intervention 18 janvier 2012 - 3 janv. 2012 à 11:02
Bonjour,

J'ai un fichier dont certaines lignes se répètent. J'ai réussi à supprimer les doublons avec la commande suivante :
awk '!x[$0]++' "$1" > "$2"
$1 est l'argument contenant le chemin d'accès du fichier à nettoyer et $2 celui du fichier sans doublons. Cependant, je veux que le traitement du fichier se fasse à partir d'une ligne particulière définie par son numéro et non du début du fichier. J'ai essayé de faire intervenir la variable NR (par exemple NR > 10 pour commencer à partir de la 11ème ligne) dans la commande awk mais je n'ai pas réussi.

Quelqu'un aurait une solution ?

Merci par avance.


A voir également:

1 réponse

dubcek Messages postés 18718 Date d'inscription lundi 15 janvier 2007 Statut Contributeur Dernière intervention 22 mars 2024 5 615
Modifié par dubcek le 3/01/2012 à 08:44
hello
comme ça ?
awk 'NR > 10 && !x[$0]++' "$1" > "$2"
2
UnFortMaticien Messages postés 5 Date d'inscription lundi 2 janvier 2012 Statut Membre Dernière intervention 18 janvier 2012
3 janv. 2012 à 11:02
Merci infiniment, ça marche à merveille ! :D
0