Derniers journaux de nojhan :
- [01/12@14:48] Linux magazine n° 100
- [02/08@18:54] Nostalgie : quand le libre copiait le propriétaire
- [13/12@08:25] Jabber progresse
- [22/08@21:36] Galerie SVG
- [26/05@14:24] Open Metaheuristics version 0.3
- [11/04@13:08] Optimisez avec Open Metaheuristics 0.2.4
- [31/03@09:27] Recherche galerie désespérement
- [21/01@20:44] Recherche P2P un peu particulier
- [16/09@11:26] Partage de base de donnée en p2p via web-service
- [21/06@11:09] J'aimerais
- [16/06@18:39] « Geek » c'est fini !
- [02/05@15:30] Abus de position dominante et TCE
- [28/12@10:51] CeCILL : l'utilisation réseau est une distribution
- [24/11@14:06] Nouveau : un spam légal
- [20/11@23:18] Distribution VS utilisation, de l'interprétation de la licence CeCILL
- [02/09@21:53] Recherche killerapps (logiciels trop mortels en VF)
- [26/08@10:21] Mon gestionnaire de fenêtre idéal
- [29/06@12:05] Garantie de conformité du bien au contrat
- [23/06@08:42] AOL et les clauses abusives...
- [01/06@19:56] Pb Linux Aidé moi SVP URGENT
Journal : Linux, cluster, beowulf, allocation
Posté par Noj Han (Jabber id, page perso, ) le 04 janvier 2008Bref, j'ai un cluster pour faire du calcul scientifique.
Mon problème c'est que j'ai pleins de processus à lancer (au fur et à mesure de mes envies) et qu'il faut les répartir en fonction de la charge des machines.
Ma première idée fut de demander à mon adminsys local si on pouvait installer Kerrighed, histoire de m'éviter du travail idiot qui freinerait ma productivité. Pas fou, il m'a gentillement expliqué que s'il fallait tout réinstaller pour avoir un noyau spécifique, je pouvais toujours le faire moi-même, plutôt que de déléguer la basse besogne aux honnêtes gens. Bref, en l'état, je réparti mes processus à la main.
Donc, je me demande s'il existerait une espèce d'Allocation Manager pour répartir a priori des processus sur un cluster (type Beowulf très simple, donc, puisqu'on a même pas de master, juste un disque commun).
J'ai commencé à faire un script python qui récupère les infos sur les processus en cours sur un ensemble de machines, mais avant de continuer je voudrais être certains de ne pas réinventer la roue (je n'aime pas la mécanique).
Or, c'est vraiment le bordel sur le web quand on cherche ça, tellement ça part dans tout les sens avec tous ces types de clusters différents... une idée ?
> Lire le journal (10 commentaires, moyenne: 1).
Mauvais admin changer admin
Ca a l'air d'être une sacrée grosse faignasse ton admin, parce qu'installer Kerrighed, ça demande pas de tout réinstaller...
http://www.kerrighed.org/wiki/index.php/Installing_Kerrighed(...)
-
[^]Re: Mauvais user changer user
Posté par sobek () le 04/01/2008 à 15:42. (lien). Évalué à 1.Ca a l'air d'être une sacrée grosse faignasse ton admin, parce qu'installer Kerrighed, ça demande pas de tout réinstaller...
Mouais, sur le papier, ça a l'air simple, mais en pratique...
Étant admin et gérant des serveurs de calcul scientifiques, je dirais que pour le moment Kerrighed c'est bien pour les grappes expérimentales, mais de là à le mettre en prod (surtout avec des vrais utilisateurs (=pas informaticiens mais scientifiques) faisant des calculs scientifiques de la vrai vie)...
Perso, je ne l'installerai pas dans ce cadre (et pourtant je l'ai déjà testé), d'autant que ce n'est pas forcement adapté au besoin : il s'agit "juste" de répartir des jobs, pas de monter un super-calculateur SMP virtuel avec des dizaines de CPU et des centaines de Go de RAM.-
[^]Re: Mauvais user changer user
Posté par galactikboulay () le 04/01/2008 à 17:39. (lien). Évalué à 1.Que ce soit adapté au besoin ou pas, honnêtement j'en sais fichtre rien, je n'y connais rien dans le domaine. Ce qui me fait tiquer, c'est que l'admin botte en touche sous un prétexte foireux alors que visiblement il a même pas lu la FAQ du produit. Il ne parle pas de l'adéquation au besoin ou pas.
-
[^]Re: Mauvais user changer user
Posté par sobek () le 04/01/2008 à 19:31. (lien). Évalué à 1.Mais honnètement, même si ce n'est pas "obligatoire" d'après la FAQ, j'aurai vraiment tendance à partir d'une machine propre pour tester ce genre de chose,plutot que d'une machine dont je ne connais pas vraiment l'état...
Après, savoir s'il n'a pas pris le temps de bien expliquer ou s'il a juste voulu jouer son BOFH, je ne sais pas ;)
-
-
une idée à la con
J'ai pas tout compris, alors pas taper !!
Etat actuel :
Ton cluster n'est pas vraiment un cluster, juste des machines identiques
Tu lances tes processus à la main suivant la charge, que tu évalues avec les outils "classique" (ps, top... ???)
Pourquoi pas :
Faire un script simple en bash, csh, ksh... qui fait ce boulot à ta place, tu seras toujours à temps de le faire évoluer !
voilà, c'était ma super participation !
-
[^]Re: une idée à la con
Posté par boklm (page perso, ) le 04/01/2008 à 22:45. (lien). Évalué à 1.Il y a egalement OAR :
http://oar.imag.fr/
Grid...?
En gros, ce que tu cherches, ce sont des "scheduler" pour grappes de calcul, non ?
Alors pourquoi ne pas utiliser les outils de type SunGridEngine ou OpenPBS/Torque ?
Nous utilisons le premier pour répartir de l'ordre de 2millions de jobs par mois en moyenne vers un certain nombre de machines. Et cela comprend aussi des programmes interactif/graphique via tunnel ssh (juste que la gestion des signaux est un poil pénible dans ce cas).
Il faut juste définir un noeud comme étant maitre SGE, et un (des) autre(s) comme noeuds de soumissions, mais ce ne sont pas forcement des machines distinctes.
Condor ?
condor c'est le bien !
http://www.cs.wisc.edu/condor/
my 2 cents !
--
Slurm
Ce que tu cherches s'appelle un gestionnaire de ressource, et y'en a plein, comme précédemment cité.
Pour ma part, je proposerai Slurm, le gestionnaire développé au LLNL (Labo qui a la 1ere machine au Top 500 depuis des années, http://www.top500.org ).
Il a le mérite d'être facile à utiliser dans des configurations basiques et de pouvoir passer à l'échelle jusqu'à des milliers de noeuds. Il est libre et les développeurs sont assez ouvert.
https://computing.llnl.gov/linux/slurm/
Je l'utilise depuis un moment avec satisfaction.
-
[^]Re: Slurm
Posté par Degrémont Aurélien () le 04/01/2008 à 20:33. (lien). Évalué à 1.J'oubliais, t'amuses vraiment pas à réinventer la roue, y'a vraiment ce qu'il faut de disponible en libre, qui font ça très bien.
Ce qui m'étonne c'est que tu as l'air de faire du clustering sans vraiment en faire. C'est un ensemble de stations que tu utilises pour calculer ou vraiment un ensemble de machines dédiées ? Dans ce dernier cas, c'est étrange que tu n'ai pas une vraiment suite d'outils de clustering installé, partage de ressources, souche MPI, gestionnaire de jobs, gestionnaire de batch, etc...
Dis à ton admin de regarder du côté d'Oscar ou Rocks pour les trucs tout-en-1.

Les journaux sont destinés à des informations qui ne sont pas suffisamment intéressantes
pour être validées en dépêche (sinon n'hésitez pas à proposer votre information en
dépêche), qui sont sans rapport avec Linux ou le libre, ou simplement pour donner votre
avis. Si vous désirez poser une question, merci d'utiliser 

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.
Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.