Bonjour,
Il y a quelques mois, liZe signalait des problèmes de plantage avec une Dedibox et Dovecot… D'autres personnes signalaient le même type de plantages avec d'autres distributions de Linux et d'autres noyaux.
Je viens de vivre la même mésaventure et j'ai une hypothèse et surtout une solution qui marche à partager.
Je n'ai pas pu répondre sur le fil de liZe (http://linuxfr.org/forums/general-general/posts/crashs-etranges-de-serveur) car les commentaires y sont maintenant fermés… Enfin, voici les résultats de mes investigations envoyées ce soir au support Dedibox :
Bonsoir,
Concernant l'instabilité constatée, je reviens vers vous pour un retour d'information; espérant qu'il vous sera utile pour vos autres clients ou pour faire évoluer votre offre.
Historique :
- Ma Dedibox sous Debian 7 64 bits est utilisée comme serveur d'e-mails SMTP + IMAP. L'IMAP est servi par le logiciel Dovecot.
- Cette configuration est très instable et se fige brutalement presque tous les jours en usage modéré et en quelques minutes en usage intensif de l'IMAP. Or Dovecot est un logiciel de référence sous Linux pour POP et IMAP et est généralement considéré comme fiable.
- J'ai d'abord cru à un problème matériel et j'ai pris une seconde Dedibox que j'ai réinstallée à neuf. La situation est la même.
En affinant la recherche sur Google, j'ai découvert que je ne suis pas le seul client Dedibox à avoir ce problème : sur Dedibox, l'usage de Dovecot sous Linux 64 bits, quelque soit la distribution, génère la même instabilité (voir http://linuxfr.org/forums/general-general/posts/crashs-etranges-de-serveur ).
Toujours sur Google, j'ai élargi la question au processeur utilisé (U2250) avec le résultat suivant : un serveur équipé d'un U2250 présente exactement les mêmes symptômes, et après de nombreuses tentatives le changement de serveur a résolu le problème (voir http://www.linuxquestions.org/questions/slackware-14/root-server-crash-hunting-down-the-cause-of-the-crash-4175476201/ ).
Cela ressemble à un bug du processeur Via U2250 sur le jeu d'instruction 64 bits révélé par Dovecot.
Afin de confirmer et de régler le problème, j'ai changé le jeu d'instruction utilisé en installant Debian 7 en 32 bits. Depuis lors je n'ai plus connu de plantage, pas même en utilisation intensive de Dovecot.
Donc 3 solutions :
1) changer de matériel (cher)
2) quitter Dovecot (les autres serveurs IMAP sous Debian ne me conviennent pas, et on court le risque qu'un autre logiciel déclenche le même effet)
3) changer le jeu d'instructions et passer sous un Linux 32 bits (ma solution préférée dans ce contexte)
Cordialement.
# j'ai déplacé le post dans la rubrique 'astuces'
Posté par NeoX . Évalué à 2.
Merci pour ce retour,
c'est en effet suffisamment important pour etre signalé.
Peut-etre aussi le remonter en upstream à dovecot.
[^] # Re: j'ai déplacé le post dans la rubrique 'astuces'
Posté par illys . Évalué à 1.
Merci pour le classement plus pertinent.
Pour les plantage, je ne suis pas sûr que ce soit à l'équipe de Dovecot de faire quelque chose : s'il s'agit bien d'un comportement spécifique au processeur, le problème n'est pas dans l'algorithme de Dovecot mais dans le code binaire généré lors de la compilation…
Peut-être que c'est le comportement du compilateur (gcc ?) qu'il faut adapter.
A ma connaissance le noyau est aussi capable d'intercepter et de prévenir l'exécution de certains opcodes lorsqu'un bug processeur est connu.
En effet, un système ne doit pas exploser en vol sous la simple action d'une application. D'autant que ça peut être exploité comme une vulnérabilité par des attaquants.
Enfin bref, je ne sais pas trop à qui soumettre un bug dont je ne connais que l'expression sur un logiciel donné.
Pour l'instant je me suis donc contenté de signaler mon hypothèse et une façon de résoudre le problème sur les deux forums qui en parlaient… Histoire que ceux qui luttent contre ce problème aient une chance de trouver cette solution sur les moteurs de recherche.
# Il n’y a pas que Dovecot
Posté par Hobgoblins Master (Mastodon) . Évalué à 2.
J’ai exactement le même problème avec pydio (ex ajaxplorer), freeze de la dedibox, rien dans les logs, aucun accès possible donc reboot hard obligatoire, j’ai même essayé d’activer le watchdog de la carte mère pour qu’il reboote plus vite, si je tue le démon en espace utilisateur, la machine reboot « normalement » au bout du timeout, mais quand il s’agit d’un freeze, ça ne fonctionne pas, je dois rebooter depuis la console ou attendre que la supervision dedibox le fasse pour moi…
[^] # Re: Il n’y a pas que Dovecot
Posté par illys . Évalué à 1.
Est-ce que vous pouvez essayer de réinstaller l'OS en 32 bits et nous dire si ça règle le problème ?
# Instabilité Dedibox en 64 bits, suite !
Posté par illys . Évalué à 3.
En continuant encore à creuser un peu, j'ai trouvé ça :
1) La promo du U2250 sur le site de Via :
Les premiers mots sont : "**The first 64-bit**, superscalar processors in VIA's x86 platform portfolio".
Ce qui tend à confirmer le manque de maturité du jeu d'instructions 64 bits sur ce processeur.
A priori, inutile donc de déclarer des bugs aux équipes Dovecot, gcc ou noyau Linux.
Source : http://www.via.com.tw/en/products/processors/nano/
2) Maintenant que j'arrive à mettre des mots sur le coeur du problème, Google est redevenu mon ami et je me sens de moins en moins seul :
J'ai en particulier trouvé un fil sur les forums d'Online.net qui montre un large groupe d'utilisateurs qui se plaignent d'instabilité de leur Linux sur Dedibox. La solution du passage en 32 bits est évoquée et marche aussi pour eux. De plus sur ce fil, des administrateurs interviennent (visiblement employés par Online). Je cite le message de Poiuyt (un client) du 25 octobre 2013 :
(…) Vraisemblablement à la lecture de l'ensemble des bug reports de Coreboot ou de Redhat, le soucis se trouve dans le microcode du processeur VIA qui ne gère pas forcément très bien certaines instructions amd64 et particulièrement des instructions ou séquences qui touchent aux modifications de fréquence du CPU.
(…)
Plusieurs solutions au problème :
passer en OS 32 bits
utiliser un kernel qui ne pose pas de problème avec le CPU des Dedibox SC (genre PAS Debian 7 ou Ubuntu 12.04 ou supérieur, à savoir ce que les gens censés vont prendre pour faire un serveur stable et maintenu)
changer de fournisseur de serveur (…)
(…)
En bref, nous sommes sans doute des centaines à utiliser des Dedibox SC actuellement, donc les machines redémarrent (ou pas) sans arrêt parfois plusieurs fois par jour, il y a un moment ou l'escroquerie doit s'arrêter.
Arnaud, merci de répondre par un argument technique ou au mieux commercialement valable. Je me doute que Xavier est au courant et il conviendrait de faire quelque chose pour en finir.
Source : http://forum.online.net/index.php?/topic/3542-important-probl%C3%A8me-de-stabilit%C3%A9-sur-les-sc/page-4
Du coup je commence à trouver mon contact au support nettement moins sympa et disponible, je le trouve même d'une incompétence coupable :
1) j'ai perdu mes soirées pendant 2 semaines pour un problème qui doit toucher des centaines de Dedibox
2) lors de l'installation de Debian sur leur console, le 64 bits est recommandé
3) la solution est disponible sur leur forum depuis des mois
4) l'administrateur intervient quelques messages plus bas en demandant les numéros de ticket et en disant "Une nouvelle fois, le problème est connus et les solutions sont très simples."
5) depuis des mois, la majorité de leurs tickets sur des machines Linux doit être directement liée à ce problème !
Bref si on oublie le 64 bits, ça reste une très belle offre au niveau du rapport qualité-prix, mais le service humain est rendu par des clowns !
Excusez-moi si je vide mon sac, mais je préfère témoigner pour que ceux qui passeront derrière moi sachent à quoi s'en tenir et ne perdent pas leurs soirées et week-ends.
[^] # Re: Instabilité Dedibox en 64 bits, suite !
Posté par JJD . Évalué à 1.
Salut,
je souffre également de ces problèmes de stabilité avec une Dedibox SC sous Wheezy 64 bits.
J'ai un ticket ouvert depuis quelques mois et lors du dernier contact (au mois d'octobre), le support m'a indiqué une entrée de forum (http://forum.online.net/index.php?/topic/2344-dedibox-via-nano-et-debian) et a déclaré «Pour le moment nos techniciens matériels sont entrain de travailler sur ce défaut mais je n'ai pas de solutions " de secours" à vous apporter.»
J'ai également tester de désactiver la régulation en fréquence du processeur (en blacklistant les modules acpi_cpufreq, mperf et processor) sans résultat tangible : l'uptime du serveur n'a jamais dépassé les 3 à 4 jours.
Cependant, depuis le passage au dernier noyau dans les backports (3.12-0.bpo.1-amd64 en remplacement du 3.11-0.bpo.2-amd64 ou du 3.2.0-4-amd64), je n'ai plus de soucis : plus de 14 jours d'uptime ! C'est un record !
Il faut noter que les modules indiqués plus haut sont toujours blacklistés et que je n'ai rien trouvé dans les changelogs du noyau qui pourrait expliquer le problème.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.