Forum Astuces.divers [Terminal] Comment se répartissent les données ?

Posté par  .
Étiquettes : aucune
0
13
août
2001
Vous avez beaucoup de données (des fichiers logs par exemple), et vous souhaiteriez connaître les lignes qui reviennent le plus fréquemment. `Unix Power Tools' http://www.oreilly.com/catalog/upt/ vous recommande d'utiliser la séquence sort-uniq-c-sort-n qui comptera les différents éléments. Conjuguez ceci avec des 'cut', 'sed' ou 'tr' adéquats qui simplifieront l'entrée standard.
- La distribution des mots dans le dico:
$ cat french.dict | cut -c-1 | sort | uniq -c | sort -n
- Les messages d\'erreurs du serveur web:
# cat access_log* | cut -f9 -d' ' | sort | uniq -c | sort -n
- Les connexions des utilisateurs:
$ last | tr '0-9' '7' | sort | uniq -c | sort -n
  • # Re: Comment se répartissent les données ?

    Posté par  . Évalué à 1.

    A noter qu'un « sort -rn » à la place de -n permet d'inverser le sens du tri et d'avoir les lignes les plus fréquente en premier. Un dernier pipe vers {more|less|un fichier} et le tour est joué. On peut aussi ajouter un head ou un tail selon la situation.
  • # Re: Comment se répartissent les données ?

    Posté par  . Évalué à 1.

    A propos des logs, il faut les lire, et personne ne les lits exhaustivement, il faut un programme qui les analyse: logcheck envoie par mail les lignes qui ne correspondent pas à un pattern attendu.

    url: http://packages.debian.org/unstable/admin/logcheck(...)

    (si vous avez une distrib de rigolo cliquez sur source code, la homepage sur psionic.com a disparu)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.