Cyril F a écrit 46 commentaires

# La métrologie dans le HPC avec Perfwatcher

Posté par Cyril F le 24 mai 2013 à 11:31. En réponse au journal HPC Magazine : Le média de référence du HPC et du Big Data.. Évalué à 1.

J'ai travaillé dans une banque Française sur des grids de plusieurs milliers de serveurs Unix (principalement Linux) et y ai développé un outils (Libre, sinon je n'en parlerais pas ici) de métrologie conçu à la initialement pour le HPC.

Il est basé sur Collectd pour la collecte des données et l'enrichie de plusieurs modules dont un module d'agrégation des données afin de présenter les performances par groupes de serveurs.

Perfwatcher s'est récemment doté d'un module permettant de stocker les données de performance des processus ce qui permet, sur un simple clic d'afficher l'équivalant d'un "top" comprenant l'ensemble des processus. Cliquez-droit sur un moment précis dans un graph et le "top" du moment en question apparaît.

Finalement j'installe Perfwatcher aussi bien sur des grids de milliers de serveurs que pour quelques unités.

Je proposerai bientôt une dépêche dédié à cet outil.

http://la-rache.com
# Choix multiples

Posté par Cyril F le 20 mai 2013 à 09:00. En réponse au sondage Quel débugger utilisez vous ?. Évalué à 10.

GDB et Valgrind …

http://la-rache.com
# Buffer Overflow

Posté par Cyril F le 13 octobre 2011 à 14:43. En réponse à la dépêche Dennis Ritchie, un père d’UNIX, nous a quittés. Évalué à 8.

Segmentation fault

http://la-rache.com
# Puppet

Posté par Cyril F le 18 juillet 2008 à 13:30. En réponse au journal Instalaltion remote/automatic d'un parc de machines. Évalué à 3.

Puppet est parfait pour cela.
http://la-rache.com
[^] # Re: Comme sur son foutu Solaris.

Posté par Cyril F le 18 février 2008 à 16:36. En réponse au message Date de lancement d'un processus. Évalué à 1.

C'est une 2.4.21, j'ai récupéré un parc de machine en RHEL3 que je migre en RHEL5 quand Mr Solaris ne me les pique pas ...
http://la-rache.com
[^] # Re: lstart est ton ami

Posté par Cyril F le 18 février 2008 à 16:33. En réponse au message Date de lancement d'un processus. Évalué à 2.

Il n'y est pas dans la 5.0.
http://la-rache.com
[^] # Re: Comme sur son foutu Solaris.

Posté par Cyril F le 18 février 2008 à 14:52. En réponse au message Date de lancement d'un processus. Évalué à 1.

Un ls de /proc me donne tout les répertoires à la date d'aujourd'hui ...

Ici c'est la guerre entre Solaris et Linux (Windows est hors concours ...).

Je lutte au quotidien pour garder mes machines sous linux. Et encore je n'ai pas le choix de la distrib, c'est Redhat, car support etc ...

J'ai installé une Debian en cachette ...
http://la-rache.com
[^] # Re: lstart est ton ami

Posté par Cyril F le 18 février 2008 à 14:48. En réponse au message Date de lancement d'un processus. Évalué à 3.

Merci,

Autant pour moi, le man de ps de cette satanée RedHat n'en parle pas ...

Je viens de trouver ça sur le man bien plus complet de ma Debian ...
http://la-rache.com
[^] # Re: Correction

Posté par Cyril F le 05 février 2008 à 13:08. En réponse au message /dev/disk. Évalué à 1.

En fait j'utilise la suite Veritas Volume Manager, et il se contrefout des symlinks, il utilise les /dev/sdX .

Je ne suis pas fan du propriétaire, mais je reconnais qu'avec VM ils ont fait un bon boulot. Le vxfs est très performant. Vivement qu'ils continuent à le libérer comme ils l'ont en partie fait avec LVM.

Cyril
http://la-rache.com
[^] # Re: Correction

Posté par Cyril F le 30 janvier 2008 à 11:21. En réponse au message /dev/disk. Évalué à 1.

- Redhat (po le choix), ES5, linux 2.6.18
Il n'y a pas de log car il n'y a pas lieu d'en avoir à mon avis.
Les machines sont des DL360G5 Bi-xeon 3Ghz avec des cartes Qlogic HBA 2xxx

Le problème n'est pas lié au matériel ni à la distribution et je ne pense pas non plus lié au noyau.

Sauf erreur de ma part le /dev est peuplé par udev qui au passage gère le plug&play/hotplug en permettant des lancement d'application à la découverte de nouveau matériel.

Mon soucis est que les nodes créés dans le /dev à la découverte d'un nouveau disque san par ex. ne sont pas supprimé à la suppression de ce matériel.

Ceci ne pose pas de problème fondamental (sauf à moi ...). J'ai épluché la doc de udev, mais je n'ai rien trouvé à propos d'un "cleanage" du /dev

Ujne solution que je n'aime pas serait de forcer udev à faire un rm du node à l'arrêt d'un périphérique ...

Voilà, en plus clair, ma première demande.

A votre bon cœur les amis.
http://la-rache.com
# Correction

Posté par Cyril F le 29 janvier 2008 à 17:16. En réponse au message /dev/disk. Évalué à 0.

les /dev/sdX sont toujours là en fait ...
http://la-rache.com
[^] # Re: reiserfs ?

Posté par Cyril F le 24 janvier 2008 à 19:26. En réponse à la dépêche Btrfs : Le système de fichiers du futur. Évalué à 4.

Dans le même genre, chez Oracle, ils nous ont pondu OCFS qui est loin d'être une merveille ... Mes données s'en souviennent ...
http://la-rache.com
[^] # Re: cat /proc/scsi/qla2x00/*

Posté par Cyril F le 11 janvier 2008 à 22:42. En réponse au message Fibre channel et monitoring. Évalué à 1.

Il s'agit en fait de stats sur les disques vus par la hba, telles que l'on pourrait avoir avec iostat.

Sous Solaris il existe la commande luxadm qui, d'après un collègue, donnerait ce genre d'infos.

Je pense me rabattre vers les mib du switch ...
http://la-rache.com
[^] # Re: iostat

Posté par Cyril F le 11 janvier 2008 à 15:39. En réponse au message Fibre channel et monitoring. Évalué à 1.

Sous linux on obtient que des infos sur les disques et la charge cpu avec iostat :-(
[troll]Ca ne me fera pas passer à aix[/troll]
http://la-rache.com
[^] # Re: Y'a aussi...

Posté par Cyril F le 08 janvier 2008 à 08:57. En réponse au message CPU usage per user .... Évalué à 1.

La commande w ne m'indique que la consomation des users ayant un tty et non tout ceux des démons et autres proccess.

Mais dans l'idée c'est ce genre d'affichage que je recherche ...
http://la-rache.com
[^] # Re: top

Posté par Cyril F le 07 janvier 2008 à 17:15. En réponse au message CPU usage per user .... Évalué à 1.

Merci jiyuu,

En fait je suis à la recherche des informations de consomation cpu et mémoire agrégée par utilisateur.

ex:
user cpu mem
root 25% 200M
www 15% 80M
etc ...

Et non la liste de leurs process.

Le script de castorpilot le fait :
ps -eo user,pcpu,pmem | tail -n +2 | awk '{num[$1]++; cpu[$1] += $2; mem[$1] += $3} END{printf("NPROC\tUSER\tCPU\tMEM\n"); for (user in cpu) printf("%d\t%s\t%.2f%\t%.2f%\n",num[user], user, cpu[user], mem[user]) }'

Si un top -qquechose ou une autre commande le faisait ça serait bien utile ...
http://la-rache.com
[^] # Re: htop

Posté par Cyril F le 07 janvier 2008 à 13:09. En réponse au message CPU usage per user .... Évalué à 1.

Celle là me convient (tant qu'un copier/coller est possible).

Merci
http://la-rache.com
[^] # Re: htop

Posté par Cyril F le 07 janvier 2008 à 11:19. En réponse au message CPU usage per user .... Évalué à 1.

Voici la sortie de prstat -t :

NPROC USERNAME SIZE RSS MEMORY TIME CPU
184 root 901M 491M 0.8% 5:23.23 0.3%
5 sysdba 11M 9000K 0.0% 0:00.02 0.0%
10 oragestp 1666M 1322M 2.4% 0:01.35 0.0%
21 oraindi 5625M 5128M 9.4% 0:19.03 0.0%
2 sybportf 9920K 9360K 0.0% 0:00.00 0.0%
13 orawpepe 2408M 1898M 3.5% 0:02.14 0.0%
13 orarfp 2285M 1811M 3.3% 0:00.46 0.0%
9 oramatpe 1197M 877M 1.6% 0:01.51 0.0%
16 orasib 3607M 2933M 5.4% 0:00.44 0.0%
18 oraintra 1886M 1488M 2.7% 0:00.55 0.0%
9 oraharpe 1197M 876M 1.6% 0:00.46 0.0%
20 oratrane 2903M 2454M 4.5% 0:03.44 0.0%
13 oraclic 1886M 1412M 2.6% 0:39.36 0.0%
9 oraevrep 2940M 2745M 5.0% 0:00.27 0.0%
24 orasiban 4074M 3119M 5.7% 0:01.42 0.0%
9 oracegct 1206M 878M 1.6% 0:00.48 0.0%
9 oraclamd 1277M 1071M 2.0% 0:00.24 0.0%
7 sybidee 15G 15G 29% 0:57.20 0.0%
1 daemon 2584K 1872K 0.0% 0:00.00 0.0%
12 oraacent 3162M 2362M 4.3% 0:00.48 0.0%
10 oraprosl 1858M 1635M 3.0% 0:01.40 0.0%
10 orabanto 800M 704M 1.3% 0:01.33 0.0%
14 orabec 2779M 1836M 3.4% 0:20.30 0.0%
10 orabanfi 768M 672M 1.2% 0:02.51 0.0%
10 oraagis 1120M 775M 1.4% 1:41.26 0.0%
11 oracaam 2777M 2412M 4.4% 0:00.50 0.0%

Cela me permet de trouver immédiatement le user consomateur et de grapher ...
http://la-rache.com
[^] # Re: htop

Posté par Cyril F le 07 janvier 2008 à 11:14. En réponse au message CPU usage per user .... Évalué à 1.

Merci castorpilot,

Je ne connaissais pas htop, il est un peu plus sympa que top, c'est vrai.
Malheureusement, il ne me sort pas d'utilisation agrégée.
http://la-rache.com
[^] # Re: Update tracker

Posté par Cyril F le 03 janvier 2008 à 18:59. En réponse au message Update tracker. Évalué à 1.

Merci pour toutes ces infos.

Ici j'ai dû demander une dérogation à mon N+42 pour installer une Debian pour mes besoins d'admin système ... Pour mon poste de travail on m'a expliqué qu'on avait pas les compétences en interne pour géré la sécurité sur ce type de poste de travail ....
http://la-rache.com
[^] # Re: Update tracker

Posté par Cyril F le 02 janvier 2008 à 10:53. En réponse au message Update tracker. Évalué à 1.

Bonjour stillbsd,

Il y a essentiellement du Solaris ici (Finance ...), il y a juste une cinquantaine de RedHat ES3&5 que je n'arrive pas à remplacer par Debian pour des raisons de certifications ...

Je ne pense pas avoir rêvé ce logiciel, mais impossible de me remettre le nom, et aucune trace sur google ...

Merci pour Tentakel, je ne connaissais pas.

http://la-rache.com