Forum Astuces.divers [Terminal] Comment se répartissent les données ?

Posté par cornofulgur le 13 août 2001 à 12:46.

Étiquettes : aucune

août

2001

Vous avez beaucoup de données (des fichiers logs par exemple), et vous souhaiteriez connaître les lignes qui reviennent le plus fréquemment. `Unix Power Tools' http://www.oreilly.com/catalog/upt/ vous recommande d'utiliser la séquence sort-uniq-c-sort-n qui comptera les différents éléments. Conjuguez ceci avec des 'cut', 'sed' ou 'tr' adéquats qui simplifieront l'entrée standard.
- La distribution des mots dans le dico:
$ cat french.dict | cut -c-1 | sort | uniq -c | sort -n
- Les messages d\'erreurs du serveur web:
# cat access_log* | cut -f9 -d' ' | sort | uniq -c | sort -n
- Les connexions des utilisateurs:
$ last | tr '0-9' '7' | sort | uniq -c | sort -n

# Re: Comment se répartissent les données ?

Posté par Obsidian le 27 mars 2003 à 15:51. Évalué à 1.

A noter qu'un « sort -rn » à la place de -n permet d'inverser le sens du tri et d'avoir les lignes les plus fréquente en premier. Un dernier pipe vers {more|less|un fichier} et le tour est joué. On peut aussi ajouter un head ou un tail selon la situation.
# Re: Comment se répartissent les données ?

Posté par Alain Tésio le 24 mars 2004 à 13:41. Évalué à 1.

A propos des logs, il faut les lire, et personne ne les lits exhaustivement, il faut un programme qui les analyse: logcheck envoie par mail les lignes qui ne correspondent pas à un pattern attendu.

url: http://packages.debian.org/unstable/admin/logcheck(...)

(si vous avez une distrib de rigolo cliquez sur source code, la homepage sur psionic.com a disparu)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.

# Re: Comment se répartissent les données ?

# Re: Comment se répartissent les données ?