jyes t'a très bien répondu, mais puisque tu m'as invoqué, je vais te répondre, avec un exemple et encore un peu de maths.
Prenons un problème extrêmement simple : tu as un jeu de données sous la forme de 20 couples (X,Y) avec X et Y réels et tu cherches un moyen de prédire Y quand tu connais X. On notera l'erreur de prédiction.
Le modèle le plus simple consiste à écrire et de déterminer le qui minimise la somme des carrés des . On prend généralement comme critère d'optimalité la somme des carrés des erreurs car ça évite de se trimballer des valeurs absolues, ce qui simplifie bien les calculs, et surtout, ça donne les meilleurs résultats empiriquement1. Dans ce modèle, on va aboutir à , où $\bar{x} est la moyenne des X. Autrement dit, je peux faire un modèle très simple où je prédis la moyenne des X quel que soit Y. Ça paraît débile, mais c'est un bon début ! En fait, si X et Y sont indépendantes, c'est même le meilleur modèle.
Mais bon, tu n'iras pas forcément très loin comme ça. Tu peux t'améliorer en prédisant que . Autrement dit, tu supposes une relation linéaire entre X et Y. Là encore, tu prends comme critère d'optimisation la somme des . Tu remarqueras que ta somme des carrés des erreurs est toujours inférieure ou égale à celle que tu avais avec seulement . Les sont appelés paramètres du modèle : il s'agit de valeurs calculées à partir des données pour optimiser un critère qui reflète à quel point le modèle s'ajuste à la réalité.
Et si on continuait ? Après tout, rien ne t'empêche d'écrire . En apparence, tu peux prendre un polynôme de degré quelconque. Tu colleras toujours mieux aux données, tu amélioreras toujours ta somme des carrés des erreurs. Il y a quand même un souci. Si tu recherches le polynôme de degré 21, il y a une infinité de 21-uplets qui sont tous optimaux. En effet, tu n'as que 20 points de données, et il y a une infinité de courbes de degré 21 qui passent par tous. Ton nombre de paramètres ne peut donc pas dépasser ton nombre d'observations.
Soit, me diras-tu, je vais me limiter au polynôme de degré 20. Certainement, celui-ci doit être le meilleur, puisqu'il passe par toutes les observations, et sa somme des carrés des erreurs est de 0.
Et c'est ainsi que tu tombes dans le piège du surapprentissage. Si je te fournis une 21ème observation, il y a de grandes chances que ton modèle me fasse une prédiction pire (en termes d'erreur) que le polynôme de degré 0. Pire encore : si je refais mon étude sur 20 autres personnes, tes 20 paramètres seront totalement différents et tes prédictions n'auront rien à voir ! Alors que le modèle linéaire, lui, sera vraisemblablement peu différent2.
Un modèle avec trop de paramètres est un modèle avec une bonne précision sur les données d'apprentissage (en machine learning) ou d'ajustement (c'est le même mot mais en langage de statisticien), mais qui se plantera sur ses prédictions autres. La solution à ce problème est d'avoir peu de paramètres par rapport au nombre de données.
Dans un modèle SIR, on a besoin de 2 paramètres en tout et pour tout et ils sont très faciles à estimer (en statisticien)/apprendre (en machine learning). Estimer revient à compter le nombre de nouveaux malades chaque jour, à diviser par le nombre de malades de la veille, et à minimiser la somme des carrés des erreurs du logarithme (on fait une moyenne pondérée, mais c'est l'idée). Estimer le taux de guérison revient à calculer l'inverse de la durée moyenne de la maladie. Même avec des données imparfaites, c'est extrêmement robuste. En fait, si la proportion de porteurs asymptomatiques est constante à chaque génération, c'est même indépendant des porteurs asymptomatiques (ce qui répond d'ailleurs à un commentaire de Bruno Michel).
En comparaison, pour des modèles plus complexes, il te faut estimer, au minimum, le nombre d'interactions par individu sur une journée, leur durée, leur importance (c'est pas la même interaction de faire 2h de réunion dans la même pièce ventilée et 10 minutes de judo), donc tu te retrouves avec un modèle qui dépend fortement de données très difficiles à mesurer de façon fiable.
De manière générale, récolter des données médicales coûte de l'argent et du temps. De l'argent, on peut en mettre quand on est face à une épidémie de grande ampleur. Mais le temps… C'est précisément ce qui manque.
Et il y a de très bonnes raisons théoriques pour ça. L'estimateur des moindres carrés est un cas particulier d'estimateur au maximum de vraisemblance quand les erreurs sont normales. Ça parlera à ceux qui travaillent dans le domaine ;). ↩
En fait, avec 20 personnes, même le modèle linéaire simple peut être relativement instable. Par contre, si on refait le même exemple avec 50 personnes, il n'y a plus photo. ↩
Ça, ce sont les sources. Le mouton que tu veux est dedans.
En plus on a cette histoire de numerus clausus qui a organisé la pénurie de médecins.
Honnêtement, le numerus clausus est un faux problème. Les études médicales, c'est super dur, point. La charge de travail d'un étudiant PACES n'est pas différente de celle d'un étudiante en médecine plus avancé, elle est même probablement inférieure. Si on supprimait le numerus clausus, on augmenterait un peu le nombre de médecins en formation, mais :
Ça ne ferait qu'aggraver la question des lieux de stage : la totalité des hôpitaux parisiens est saturée d'externes (étudiants stagiaires de la quatrième à la sixième année sur le papier, en pratique souvent dès la troisième année), avec parfois plus d'externes que de patients dans le service, ce qui amène à ne même pas avoir un lit attribué à chaque externe ;
On déplacerait les échecs en deuxième année et plus, ce qui n'est souhaitable pour personne. Les études médicales, encore une fois, sont difficiles, avec une masse considérable d'informations peu complexes mais très nombreuses à apprendre en un temps qui semble toujours trop court à l'étudiant mais qu'il est difficile de rallonger.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
Posté par Liorel .
En réponse au journal Des virus et des hommes.
Évalué à 10.
Dernière modification le 03 mars 2020 à 23:12.
Je tiens à préciser que le problème de l'hôpital en France n'est pas dû aux salaires
Il est complètement dû aux salaires. Avoir un poste de praticien hospitalier, c'est se battre pendant des mois contre une administration qui commencera par envisager toutes les autres possibilités, puis contre d'éventuels concurrents, pour au final enchaîner les CDD avant d'être titularisé et toucher moins que dans le privé. Plus personne ne veut faire ça, sauf ceux qui ont vraiment envie d'enseigner et qui n'ont pas d'autre choix que les postes hospitalo-universitaires. Moi-même, j'envisage de partir dans le privé parce que je me fais chier dans mon taf et que quitte à me faire chier, j'y serais payé 1,5 à 2 fois plus. Je suis très loin d'être un cas isolé.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
C'est assez cohérent avec 10% de personnes sensibles en moyenne. Parfois c'est plus, parfois c'est moins. J'avais aussi ce chiffre (10%) en tête (plus sous la forme "90% d'immunité", qui est équivalente) mais je ne l'ai pas cité par flemme de chercher une source.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
C'est l'occasion de revenir sur le portage asymptomatique. Le portage asymptomatique est défini comme le fait d'être porteur du virus, donc capable de le transmettre, sans présenter de symptômes. Il est préférable de parler de "porteur asymptomatique" plutôt que de "porteur sain" car il est difficile de considérer comme saine une personne porteuse d'un virus potentiellement mortel.
L'immense majorité des pathologies ont une phase de portage asymptomatique, voire des individus porteurs asymptomatiques permanents. La caricature serait la famille des virus de l'herpès : les HSV-1 et 2, qui donnent l'herpès classique, sont très majoritairement asymptomatiques, au point que HSV-1 infecte silencieusement 9 humains sur 10, y compris dans des sociétés occidentales hygiénistes. Les HHV-7 et 8, de la même famille, ne donnent, eux, aucun symptôme. Rien, nada, que dalle.
Face à un nouveau virus, il est donc raisonnable de penser qu'il y a des porteurs asymptomatiques : c'est tout simplement le cas le plus fréquent, et de loin. Reste à les trouver, et c'est le plus difficile : encore faut-il savoir où chercher ! Le Diamond Princess a ici fourni des données précieuses, quoi qu'obtenues dans des conditions tout à fait scandaleuses.
L'impact du portage asymptomatique est difficile à évaluer. Un porteur asymptomatique peut avoir trois évolutions différentes : soit il finit par guérir, soit il finit par déclarer la maladie, soit il reste indéfiniment porteur asymptomatique.
S'il ne déclare pas la maladie, il contribue individuellement à soulager le système de santé : du point de vue du modèle SIR, il reste dans la case I, mais en termes de nombre de cas mesurés, il passe sous le radar. Il ne nécessitera évidemment pas d'hospitalisation. Il deviendra par contre généralement résistant à terme, contribuant à la résistance globale de la population. Il doit donc être soustrait du nombre de cas mesuré.
En termes de transmission, les choses sont plus complexes. En effet, la contagiosité d'un individu dépend de 3 paramètres : sa charge virale, sa capacité à excréter le virus (le faire sortir de l'organisme) et les mesures comportementales de protection.
Un porteur asymptomatique n'a aucune raison de mettre en place plus de mesures de protection qu'un non-porteur et on n'a aucune raison de s'en protéger a priori… En tout cas pas plus que quiconque.
D'un autre côté, si on est asymptomatique, c'est généralement pour une bonne raison : un meilleur contrôle de l'infection par le système immunitaire, par exemple. Il n'est pas illégitime de s'attendre à ce qu'un porteur asymptomatique ait une charge virale moins élevée et soit moins à même de transmettre l'infection. Surtout que les porteurs asymptomatiques sont… asymptomatiques ! La toux, qui est un excellent vecteur pour le virus, n'est pas présente. Donc le porteur excrète moins de virus qu'un malade.
Au final, donc, l'impact des porteurs asymptomatiques dépend de l'efficacité des mesures de protection, de leur application même en présence de personnes non considérées comme contagieuses, et de la contagiosité des porteurs asymptomatiques qui n'a aucune raison d'être la même que celle des porteurs symptomatiques. Théoriquement, il faudrait considérer chacun comme porteur asymptomatique. En effet, il est probable qu'il existe une phase de contagiosité pré-symptomatique, donc la meilleure protection est de se laver les mains quoi qu'il arrive.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
Ce texte formule une comparaison un peu rapide avec la grippe. Dans la grippe, il existe un phénomène d'immunité croisée. Si tu attrapes la grippe en 2020, tu vas fabriquer une quantité considérable d'anticorps contre le virus inflenza-2020. Le virus influenza-2021 sera sans doute un peu différent, mais tes anticorps ne sont pas parfaitement spécifiques et ils sont très nombreux. En sorte que tu disposes d'une immunité partielle. Ceci ne fonctionne pas avec le vaccin parce que le vaccin te fait fabriquer moins d'anticorps : suffisamment pour lutter contre la grippe en cours, mais trop peu pour lutter contre un virus différent.
Quand la grippe arrive, elle arrive donc dans une population déjà largement résistante et elle atteint très rapidement son équilibre. Or il n'y a jamais eu aucun coronavirus circulant (connu) chez l'humain. Le virus arrive donc dans une population intégralement sensible. C'est ça qui fait peur : la première vague épidémique.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
Effectivement, il y a des cas décrits de recontamination, c'est-à-dire que des personnes considérées comme guéries se remettent à devenir positives au virus.
Pour le moment, on n'en sait pas assez pour trancher entre plusieurs hypothèses :
Le virus était passé en dormance (dans quelles cellules ?) et il s'est réactivé ;
Guérir n'est pas immunisant ;
Guérir n'est pas toujours immunisant ;
Ces personnes ont des caractéristiques particulières qui les empêchent de s'immuniser, mais le reste de la population s'immunise.
Ces cas sont effectivement reportés, mais pour le moment, il y en a trop peu pour avoir des données précises à leur sujet. Ça s'éclaircira sans doute dans les jours ou semaines à venir.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
combien sont "juste un peu en avance"? (De ce que j'ai suivi c'est quand même pas mal les personnes âgées qui trinquent, en plus de ta liste de personnes fragiles)
Surtout que ma liste recoupe pas mal les personnes âgées en fait (et les fumeurs. Arrêtez de fumer. Non, vraiment, vous vivrez plus vieux et vieillirez plus lentement).
La question sur le "un peu en avance" est très pertinente. Il a été proposé de mesurer la surmortalité liée à un événement non pas en nombre de morts, mais en années de vie perdues. Ce serait sans doute une mesure bien plus pertinente.
Et puis l'idée s'est fracassée contre le mur du réel. Le nombre total d'années de vie perdues, c'est une belle idée qui ne parle qu'à des matheux de l'épidémiologie, des types qui postent sur DLFP avec des bouts de code en dedans. En plus, c'est hyper dur à mesurer. Il faudrait quasiment reprendre chaque dossier médical et mesurer le nombre d'années qu'il restait à vivre à la personne. C'est infaisable en pratique. Calculer le nombre de morts, en comparaison, c'est très facile : on sort les certificats de décès où la cause notée est "Covid19" ou un truc similaire, en 3h de temps stagiaire c'est fait (le temps d'éplucher les cas litigieux et de lister toutes les regexp pertinentes).
Ça, ce sont les sources. Le mouton que tu veux est dedans.
En gros, il y a 4 façons d'être résistant à un virus :
Avoir attrapé le virus et y avoir survécu ;
Être vacciné ;
Avoir attrapé un cousin du virus et y avoir survécu ;
Être génétiquement résistant.
Les résistances génétiques sont rares mais efficaces. Les vaccins, quand ils existent, sont généralement très efficaces. Avoir attrapé le virus et y avoir survécu confère la résistance maximale, mais l'idée est justement de ne pas l'attraper… Quant à avoir attrapé un cousin du virus, c'est un phénomène loin d'être négligeable : il est probablement la principale raison qui fait que la grippe saisonnière touche finalement peu de monde chaque année : le virus a beau muter, il n'est pas si différent de celui de la saison d'avant. Mais on retombe dans le problème d'attraper le virus qu'on cherche à éviter.
Le problème ici, c'est qu'aucun coronavirus n'a jamais touché la population humaine à grande échelle. On n'a donc pas de vaccin, pas de moyen d'en fabriquer rapidement un et pas d'immunité liée à un virus apparenté. Reste l'immunité génétique, qui, comme on l'a vu, est rare. On démarre donc avec une population qu'on peut considérer comme sensible à 100%.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
Alors effectivement, pour le moment, le taux d'attaque est faible. Le taux d'attaque, c'est le nombre de personnes présentant la pathologie par rapport à la population générale. Mais c'est surtout parce que l'épidémie vient de commencer. Ce qu'on observe très concrètement, c'est que dès qu'on prend une personne en charge, le temps qu'on ait fini de l'isoler, elle en a contaminé 2 à 3 autres.
Pour le taux de mortalité, il est obtenu en divisant le nombre de décès par le nombre de cas confirmés virologiquement. Ça pose un souci de dénominateur : il est possible que des personnes pas ou peu symptomatiques passent sous le radar car même pas dépistées. On a quand même un bon cas d'école avec le Diamond Princess. Je te renvoie à cet article sur Slate (à ouvrir avec ublock origin), qui comprend, entre autres, une bonne explication de ce qu'est le Diamond Princess. L'avantage, puisqu'il faut en trouver un, c'est qu'on a des données exhaustives sur la population du bateau, et on sait qu'on y a trouvé environ 47% de porteurs sains.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
s'il y a des porteurs sain les mesures d isolement ne servent à rien car alors très peu de personnes non identifiées suffisent a répendre partout le virus à tous.
Les mesures d'isolement conservent un intérêt : prenons un cas extrême, , 50% de porteurs sains, mais tu arrives à isoler totalement tout patient symptomatique. Les porteurs sains transmettront effectivement le virus à 2 personnes en moyenne, mais comme les patients symptomatiques sont (par hypothèse) totalement isolés et ne transmettent pas le virus, on a : . Et tu arrives à stabiliser l'épidémie.
Bon, c'est un exemple extrême, mais ça montre que les porteurs sains ne font pas tout. De plus, il n'est pas inenvisageable de les dépister (la stratégie actuelle est de dépister toutes les personnes ayant été en contact avec une personne confirmée malade).
De mon humble avis seul quelques malchanceux mourront et encore a priori ceux déjà très fragile
La létalité est estimée entre 1 et 3%, selon les estimations. Dans une population avec une mauvaise prise en charge du grand âge et des pathologies associées, il ne reste plus que des jeunes à contaminer (les plus vieux n'ont pas attendu le SARS-CoV-2 pour décéder) et la létalité est faible, tandis que dans une population comme la population française, je m'attends à ce que ça tende plus vers la fourchette haute.
Quoi qu'il en soit, 2% de mortalité, c'est énorme, c'est 20 fois celle de la grippe. Ce qui est particulièrement problématique, c'est la combinaison létalité assez élevée + population intégralement sensible. De plus, ça ne touche pas que les personnes fragiles : certes, les plus fragiles sont à risque élevé, mais on observe aussi des décès chez des personnes bien portantes auparavant. Enfin, ceci est conditionné à la possibilité d'accès à des soins intensifs. Il y a quand même 20% de patients qui finissent en soins intensifs (et pas que des personnes fragiles. Il n'y a pas 20% de personnes fragiles dans la population). La définition des soins intensifs, c'est à peu prés : le service où tu vas quand tout le reste a échoué, et si tu n'y vas pas, tu meurs. Si ces services sont entièrement saturés, la mortalité explosera.
D'ailleurs s il y avait une vrai volonté de lutter contre l'épidémie la première chose serait de tester tous ceux qui ont la grippe car bon nombre de malade passent aujourd'hui pour des grippes.
C'est probablement ce qui finira par arriver. L'épidémie de grippe est sur une pente descendante en région parisienne, je m'attends à ce qu'elle suive la même pente partout en France dans une semaine ou deux (pour le coup, c'est vraiment du doigt mouillé). À ce moment-là, il n'y aura plus aucune chance de passer pour une grippe.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
Ça fait des années qu'il a été forké d'OpenOffice, pourtant, en dehors de DLFP, tout le monde ne connaît qu'OpenOffice et s'accorde donc à dire qu'en dehors de Microsoft Office il n'y a rien. OpenOffice était juste trop connu et connoté au moment du fork.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
quand bien même tout le monde est consentant, ça n'en reste pas légal vis a vis de l'Etat
Le mariage est un contrat. Personne d'autre que les contractants ne peut se plaindre s'il est violé. Pas l'État, pas toi, pas moi, pas les parisiens, pas la famille de la mariée. Personne en dehors des contractants, c'est-à-dire les époux. C'est le principe général des contrats.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
Alors attention, on a complètement dévié. On parlait d'un médecin urgentiste, pas un chirurgien.
Déjà, quand un médecin facture auprès d'un hôpital, ce sont ses honoraires perso. Ses frais supplémentaires sont couverts par l'hôpital.
En gros, les coûts liés à l'activité d'un médecin se décomposent comme suit :
Locaux (un hôpital est plus une machine de haute technologie géante qu'un bâtiment, c'est extrêmement cher à construire)
Médicaments et produits de santé (pas très cher en général)
Examens divers (radiologie, imagerie, biologie)
Frais de personnel annexe (temps de travail des infirmières, secrétaires, autres personnels de santé)
Honoraires du médecin
Les coûts liés à l'activité d'un chirurgien sont les mêmes plus tout ce qui est lié au fonctionnement du bloc opératoire (personnel de bloc, médecin anesthésiste, matériel de bloc, stérilisation).
Les 2200€ évoqués plus haut concernent uniquement les honoraires du médecin plus, éventuellement, le temps passé à réaliser lui-même certains examens d'imagerie et gestes techniques (notamment les échographies). Sur ce tarif, il y a très exactement 0€ liés au fonctionnement du bloc opératoire. Déjà parce que le mec n'est pas chirurgien, ensuite parce que même s'il était chirurgien, les frais de fonctionnement du bloc sont pris en charge sur une autre ligne budgétaire et ne lui sont à aucun moment versés.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
Le problème, ce n'est pas ceux qui en ont le moins. C'est ceux qui n'en ont pas du tout. L'entreprise a plus intérêt à avoir 100 employés qui bossent à 120% que 120 employés qui bossent à 100%, parce que derrière, ça fait moins de management. Ce qui est exactement encouragé par les heures sup défiscalisées. Le problème, c'est que ça n'aide pas à lutter contre le chômage, parce que dans le cas 1, il y a 20 personnes sur le carreau.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
Je me demandais justement si il y avait une charte pour écrire un journal.
En fait, il y a un critère : il faut avoir un karma strictement supérieur à zéro, comme indiqué dans la page sur le karma. En clair, ça veut dire qu'il faut, au cours de ta carrière sur linuxfr, avoir reçu au moins 10 pertinentages de plus que d'inutilages (les boutons "pertinent" et "inutile" en bas de chaque commentaire, journal et dépêche).
À part ça, il n'y a effectivement pas de ligne éditoriale, pas d'équipe de rédaction. L'équipe de modération se contente d'éradiquer le spam, de supprimer les violations évidentes de la charte, et de filer un coup de main sur les dépêches1. Linuxfr est ce qu'en font les utilisateurs.
C'est donc une bonne idée de faire ses premiers commentaires sous formes de textes bien construits, argumentés, clairs, sans insultes et sans attaques ad hominem. La communauté a tendance à y être assez sensible.
J'en profite pour la remercier (l'équipe de modération) du boulot fourni sur la dépêche sur Snowden. Une aide discrète mais qui m'a permis de rendre la dépêche plus claire sans la dénaturer. Merci ! ↩
Ça, ce sont les sources. Le mouton que tu veux est dedans.
C'est tout à fait exact. Un autre problème est que les capacités de production n'étant pas illimitées1, les labos ont tendance à orienter leur production vers les pays qui paient le mieux, créant des ruptures de stock dans les pays qui ont le mieux négocié les prix. C'est la principale raison des nombreuses ruptures d'approvisionnement observées ces dernières années en France (la plus médiatisée récemment étant la rupture en corticoïdes).
Notamment pour les médicaments brevetés puisque, par définition, un seul labo a le droit de produire le médicament. Cependant, on observe aussi des ruptures de stock sur des médicaments génériqués. ↩
Ça, ce sont les sources. Le mouton que tu veux est dedans.
L'un des plus éloquents hors du logiciel, c'est celui de Martin Shkreli, qui a acheté le brevet pour le seul médicament d'une maladie génétique rare, avant de multiplier le prix par 20 (aux US. En France, les tarifs sont négociés par l'assurance maladie et ce serait impossible). Et comme les patients avaient le choix entre payer et s'aggraver jusqu'au décès…
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Les chiffres et la réalité...
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 10.
jyes t'a très bien répondu, mais puisque tu m'as invoqué, je vais te répondre, avec un exemple et encore un peu de maths.
Prenons un problème extrêmement simple : tu as un jeu de données sous la forme de 20 couples (X,Y) avec X et Y réels et tu cherches un moyen de prédire Y quand tu connais X. On notera
l'erreur de prédiction.
Le modèle le plus simple consiste à écrire
et de déterminer le
qui minimise la somme des carrés des
. On prend généralement comme critère d'optimalité la somme des carrés des erreurs car ça évite de se trimballer des valeurs absolues, ce qui simplifie bien les calculs, et surtout, ça donne les meilleurs résultats empiriquement1. Dans ce modèle, on va aboutir à
, où $\bar{x} est la moyenne des X. Autrement dit, je peux faire un modèle très simple où je prédis la moyenne des X quel que soit Y. Ça paraît débile, mais c'est un bon début ! En fait, si X et Y sont indépendantes, c'est même le meilleur modèle.
Mais bon, tu n'iras pas forcément très loin comme ça. Tu peux t'améliorer en prédisant que
. Autrement dit, tu supposes une relation linéaire entre X et Y. Là encore, tu prends comme critère d'optimisation la somme des
. Tu remarqueras que ta somme des carrés des erreurs est toujours inférieure ou égale à celle que tu avais avec seulement
. Les
sont appelés paramètres du modèle : il s'agit de valeurs calculées à partir des données pour optimiser un critère qui reflète à quel point le modèle s'ajuste à la réalité.
Et si on continuait ? Après tout, rien ne t'empêche d'écrire
. En apparence, tu peux prendre un polynôme de degré quelconque. Tu colleras toujours mieux aux données, tu amélioreras toujours ta somme des carrés des erreurs. Il y a quand même un souci. Si tu recherches le polynôme de degré 21, il y a une infinité de 21-uplets
qui sont tous optimaux. En effet, tu n'as que 20 points de données, et il y a une infinité de courbes de degré 21 qui passent par tous. Ton nombre de paramètres ne peut donc pas dépasser ton nombre d'observations.
Soit, me diras-tu, je vais me limiter au polynôme de degré 20. Certainement, celui-ci doit être le meilleur, puisqu'il passe par toutes les observations, et sa somme des carrés des erreurs est de 0.
Et c'est ainsi que tu tombes dans le piège du surapprentissage. Si je te fournis une 21ème observation, il y a de grandes chances que ton modèle me fasse une prédiction pire (en termes d'erreur) que le polynôme de degré 0. Pire encore : si je refais mon étude sur 20 autres personnes, tes 20 paramètres seront totalement différents et tes prédictions n'auront rien à voir ! Alors que le modèle linéaire, lui, sera vraisemblablement peu différent2.
Un modèle avec trop de paramètres est un modèle avec une bonne précision sur les données d'apprentissage (en machine learning) ou d'ajustement (c'est le même mot mais en langage de statisticien), mais qui se plantera sur ses prédictions autres. La solution à ce problème est d'avoir peu de paramètres par rapport au nombre de données.
Dans un modèle SIR, on a besoin de 2 paramètres en tout et pour tout et ils sont très faciles à estimer (en statisticien)/apprendre (en machine learning). Estimer
revient à compter le nombre de nouveaux malades chaque jour, à diviser par le nombre de malades de la veille, et à minimiser la somme des carrés des erreurs du logarithme (on fait une moyenne pondérée, mais c'est l'idée). Estimer le taux de guérison revient à calculer l'inverse de la durée moyenne de la maladie. Même avec des données imparfaites, c'est extrêmement robuste. En fait, si la proportion de porteurs asymptomatiques est constante à chaque génération, c'est même indépendant des porteurs asymptomatiques (ce qui répond d'ailleurs à un commentaire de Bruno Michel).
En comparaison, pour des modèles plus complexes, il te faut estimer, au minimum, le nombre d'interactions par individu sur une journée, leur durée, leur importance (c'est pas la même interaction de faire 2h de réunion dans la même pièce ventilée et 10 minutes de judo), donc tu te retrouves avec un modèle qui dépend fortement de données très difficiles à mesurer de façon fiable.
De manière générale, récolter des données médicales coûte de l'argent et du temps. De l'argent, on peut en mettre quand on est face à une épidémie de grande ampleur. Mais le temps… C'est précisément ce qui manque.
Et il y a de très bonnes raisons théoriques pour ça. L'estimateur des moindres carrés est un cas particulier d'estimateur au maximum de vraisemblance quand les erreurs sont normales. Ça parlera à ceux qui travaillent dans le domaine ;). ↩
En fait, avec 20 personnes, même le modèle linéaire simple peut être relativement instable. Par contre, si on refait le même exemple avec 50 personnes, il n'y a plus photo. ↩
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: petite question
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 5.
Honnêtement, le numerus clausus est un faux problème. Les études médicales, c'est super dur, point. La charge de travail d'un étudiant PACES n'est pas différente de celle d'un étudiante en médecine plus avancé, elle est même probablement inférieure. Si on supprimait le numerus clausus, on augmenterait un peu le nombre de médecins en formation, mais :
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: petite question
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 10. Dernière modification le 03 mars 2020 à 23:12.
Il est complètement dû aux salaires. Avoir un poste de praticien hospitalier, c'est se battre pendant des mois contre une administration qui commencera par envisager toutes les autres possibilités, puis contre d'éventuels concurrents, pour au final enchaîner les CDD avant d'être titularisé et toucher moins que dans le privé. Plus personne ne veut faire ça, sauf ceux qui ont vraiment envie d'enseigner et qui n'ont pas d'autre choix que les postes hospitalo-universitaires. Moi-même, j'envisage de partir dans le privé parce que je me fais chier dans mon taf et que quitte à me faire chier, j'y serais payé 1,5 à 2 fois plus. Je suis très loin d'être un cas isolé.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Les biologistes sont encore plus mauvais que les informaticiens pour trouver des noms !
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 5.
Randall Munroe t'a obligeamment fourni le XKCD qui va bien ;)
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Du ramdam pour une grippe un peu violente
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 3.
Je renvoie le lecteur non connaisseur à mon commentaire un peu plus bas où j'explique la même chose avec des mots un peu différents.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Du ramdam pour une grippe un peu violente
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 6.
C'est assez cohérent avec 10% de personnes sensibles en moyenne. Parfois c'est plus, parfois c'est moins. J'avais aussi ce chiffre (10%) en tête (plus sous la forme "90% d'immunité", qui est équivalente) mais je ne l'ai pas cité par flemme de chercher une source.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Erreur ?
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 10.
C'est l'occasion de revenir sur le portage asymptomatique. Le portage asymptomatique est défini comme le fait d'être porteur du virus, donc capable de le transmettre, sans présenter de symptômes. Il est préférable de parler de "porteur asymptomatique" plutôt que de "porteur sain" car il est difficile de considérer comme saine une personne porteuse d'un virus potentiellement mortel.
L'immense majorité des pathologies ont une phase de portage asymptomatique, voire des individus porteurs asymptomatiques permanents. La caricature serait la famille des virus de l'herpès : les HSV-1 et 2, qui donnent l'herpès classique, sont très majoritairement asymptomatiques, au point que HSV-1 infecte silencieusement 9 humains sur 10, y compris dans des sociétés occidentales hygiénistes. Les HHV-7 et 8, de la même famille, ne donnent, eux, aucun symptôme. Rien, nada, que dalle.
Face à un nouveau virus, il est donc raisonnable de penser qu'il y a des porteurs asymptomatiques : c'est tout simplement le cas le plus fréquent, et de loin. Reste à les trouver, et c'est le plus difficile : encore faut-il savoir où chercher ! Le Diamond Princess a ici fourni des données précieuses, quoi qu'obtenues dans des conditions tout à fait scandaleuses.
L'impact du portage asymptomatique est difficile à évaluer. Un porteur asymptomatique peut avoir trois évolutions différentes : soit il finit par guérir, soit il finit par déclarer la maladie, soit il reste indéfiniment porteur asymptomatique.
S'il ne déclare pas la maladie, il contribue individuellement à soulager le système de santé : du point de vue du modèle SIR, il reste dans la case I, mais en termes de nombre de cas mesurés, il passe sous le radar. Il ne nécessitera évidemment pas d'hospitalisation. Il deviendra par contre généralement résistant à terme, contribuant à la résistance globale de la population. Il doit donc être soustrait du nombre de cas mesuré.
En termes de transmission, les choses sont plus complexes. En effet, la contagiosité d'un individu dépend de 3 paramètres : sa charge virale, sa capacité à excréter le virus (le faire sortir de l'organisme) et les mesures comportementales de protection.
Un porteur asymptomatique n'a aucune raison de mettre en place plus de mesures de protection qu'un non-porteur et on n'a aucune raison de s'en protéger a priori… En tout cas pas plus que quiconque.
D'un autre côté, si on est asymptomatique, c'est généralement pour une bonne raison : un meilleur contrôle de l'infection par le système immunitaire, par exemple. Il n'est pas illégitime de s'attendre à ce qu'un porteur asymptomatique ait une charge virale moins élevée et soit moins à même de transmettre l'infection. Surtout que les porteurs asymptomatiques sont… asymptomatiques ! La toux, qui est un excellent vecteur pour le virus, n'est pas présente. Donc le porteur excrète moins de virus qu'un malade.
Au final, donc, l'impact des porteurs asymptomatiques dépend de l'efficacité des mesures de protection, de leur application même en présence de personnes non considérées comme contagieuses, et de la contagiosité des porteurs asymptomatiques qui n'a aucune raison d'être la même que celle des porteurs symptomatiques. Théoriquement, il faudrait considérer chacun comme porteur asymptomatique. En effet, il est probable qu'il existe une phase de contagiosité pré-symptomatique, donc la meilleure protection est de se laver les mains quoi qu'il arrive.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Comparaisons
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 10.
Ce texte formule une comparaison un peu rapide avec la grippe. Dans la grippe, il existe un phénomène d'immunité croisée. Si tu attrapes la grippe en 2020, tu vas fabriquer une quantité considérable d'anticorps contre le virus inflenza-2020. Le virus influenza-2021 sera sans doute un peu différent, mais tes anticorps ne sont pas parfaitement spécifiques et ils sont très nombreux. En sorte que tu disposes d'une immunité partielle. Ceci ne fonctionne pas avec le vaccin parce que le vaccin te fait fabriquer moins d'anticorps : suffisamment pour lutter contre la grippe en cours, mais trop peu pour lutter contre un virus différent.
Quand la grippe arrive, elle arrive donc dans une population déjà largement résistante et elle atteint très rapidement son équilibre. Or il n'y a jamais eu aucun coronavirus circulant (connu) chez l'humain. Le virus arrive donc dans une population intégralement sensible. C'est ça qui fait peur : la première vague épidémique.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Létalité
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 10.
Effectivement, il y a des cas décrits de recontamination, c'est-à-dire que des personnes considérées comme guéries se remettent à devenir positives au virus.
Pour le moment, on n'en sait pas assez pour trancher entre plusieurs hypothèses :
Ces cas sont effectivement reportés, mais pour le moment, il y en a trop peu pour avoir des données précises à leur sujet. Ça s'éclaircira sans doute dans les jours ou semaines à venir.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Comparaisons
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 10.
Surtout que ma liste recoupe pas mal les personnes âgées en fait (et les fumeurs. Arrêtez de fumer. Non, vraiment, vous vivrez plus vieux et vieillirez plus lentement).
La question sur le "un peu en avance" est très pertinente. Il a été proposé de mesurer la surmortalité liée à un événement non pas en nombre de morts, mais en années de vie perdues. Ce serait sans doute une mesure bien plus pertinente.
Et puis l'idée s'est fracassée contre le mur du réel. Le nombre total d'années de vie perdues, c'est une belle idée qui ne parle qu'à des matheux de l'épidémiologie, des types qui postent sur DLFP avec des bouts de code en
dedans. En plus, c'est hyper dur à mesurer. Il faudrait quasiment reprendre chaque dossier médical et mesurer le nombre d'années qu'il restait à vivre à la personne. C'est infaisable en pratique. Calculer le nombre de morts, en comparaison, c'est très facile : on sort les certificats de décès où la cause notée est "Covid19" ou un truc similaire, en 3h de temps stagiaire c'est fait (le temps d'éplucher les cas litigieux et de lister toutes les regexp pertinentes).
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Létalité
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 9.
C'est effectivement ça.
En gros, il y a 4 façons d'être résistant à un virus :
Les résistances génétiques sont rares mais efficaces. Les vaccins, quand ils existent, sont généralement très efficaces. Avoir attrapé le virus et y avoir survécu confère la résistance maximale, mais l'idée est justement de ne pas l'attraper… Quant à avoir attrapé un cousin du virus, c'est un phénomène loin d'être négligeable : il est probablement la principale raison qui fait que la grippe saisonnière touche finalement peu de monde chaque année : le virus a beau muter, il n'est pas si différent de celui de la saison d'avant. Mais on retombe dans le problème d'attraper le virus qu'on cherche à éviter.
Le problème ici, c'est qu'aucun coronavirus n'a jamais touché la population humaine à grande échelle. On n'a donc pas de vaccin, pas de moyen d'en fabriquer rapidement un et pas d'immunité liée à un virus apparenté. Reste l'immunité génétique, qui, comme on l'a vu, est rare. On démarre donc avec une population qu'on peut considérer comme sensible à 100%.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Létalité
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 10.
Alors effectivement, pour le moment, le taux d'attaque est faible. Le taux d'attaque, c'est le nombre de personnes présentant la pathologie par rapport à la population générale. Mais c'est surtout parce que l'épidémie vient de commencer. Ce qu'on observe très concrètement, c'est que dès qu'on prend une personne en charge, le temps qu'on ait fini de l'isoler, elle en a contaminé 2 à 3 autres.
Pour le taux de mortalité, il est obtenu en divisant le nombre de décès par le nombre de cas confirmés virologiquement. Ça pose un souci de dénominateur : il est possible que des personnes pas ou peu symptomatiques passent sous le radar car même pas dépistées. On a quand même un bon cas d'école avec le Diamond Princess. Je te renvoie à cet article sur Slate (à ouvrir avec ublock origin), qui comprend, entre autres, une bonne explication de ce qu'est le Diamond Princess. L'avantage, puisqu'il faut en trouver un, c'est qu'on a des données exhaustives sur la population du bateau, et on sait qu'on y a trouvé environ 47% de porteurs sains.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Du ramdam pour une grippe un peu violente
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 10.
Les mesures d'isolement conservent un intérêt : prenons un cas extrême,
, 50% de porteurs sains, mais tu arrives à isoler totalement tout patient symptomatique. Les porteurs sains transmettront effectivement le virus à 2 personnes en moyenne, mais comme les patients symptomatiques sont (par hypothèse) totalement isolés et ne transmettent pas le virus, on a :
. Et tu arrives à stabiliser l'épidémie.
Bon, c'est un exemple extrême, mais ça montre que les porteurs sains ne font pas tout. De plus, il n'est pas inenvisageable de les dépister (la stratégie actuelle est de dépister toutes les personnes ayant été en contact avec une personne confirmée malade).
La létalité est estimée entre 1 et 3%, selon les estimations. Dans une population avec une mauvaise prise en charge du grand âge et des pathologies associées, il ne reste plus que des jeunes à contaminer (les plus vieux n'ont pas attendu le SARS-CoV-2 pour décéder) et la létalité est faible, tandis que dans une population comme la population française, je m'attends à ce que ça tende plus vers la fourchette haute.
Quoi qu'il en soit, 2% de mortalité, c'est énorme, c'est 20 fois celle de la grippe. Ce qui est particulièrement problématique, c'est la combinaison létalité assez élevée + population intégralement sensible. De plus, ça ne touche pas que les personnes fragiles : certes, les plus fragiles sont à risque élevé, mais on observe aussi des décès chez des personnes bien portantes auparavant. Enfin, ceci est conditionné à la possibilité d'accès à des soins intensifs. Il y a quand même 20% de patients qui finissent en soins intensifs (et pas que des personnes fragiles. Il n'y a pas 20% de personnes fragiles dans la population). La définition des soins intensifs, c'est à peu prés : le service où tu vas quand tout le reste a échoué, et si tu n'y vas pas, tu meurs. Si ces services sont entièrement saturés, la mortalité explosera.
C'est probablement ce qui finira par arriver. L'épidémie de grippe est sur une pente descendante en région parisienne, je m'attends à ce qu'elle suive la même pente partout en France dans une semaine ou deux (pour le coup, c'est vraiment du doigt mouillé). À ce moment-là, il n'y aura plus aucune chance de passer pour une grippe.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: 2 typos
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 3.
Ouep, je veux bien, merci :)
Ça, ce sont les sources. Le mouton que tu veux est dedans.
# 2 typos
Posté par Liorel . En réponse au journal Des virus et des hommes. Évalué à 3.
Si un modérateur peut corriger, merci :)
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Ce nom
Posté par Liorel . En réponse à la dépêche WikHaiePédia. Évalué à 10.
Peut-être qu'elle parlait du pare-feu ?
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Ce nom
Posté par Liorel . En réponse à la dépêche WikHaiePédia. Évalué à 5.
Pour prendre un exemple : LibreOffice.
Ça fait des années qu'il a été forké d'OpenOffice, pourtant, en dehors de DLFP, tout le monde ne connaît qu'OpenOffice et s'accorde donc à dire qu'en dehors de Microsoft Office il n'y a rien. OpenOffice était juste trop connu et connoté au moment du fork.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Bof bof...
Posté par Liorel . En réponse au journal Benjamin Griveaux et Facebook : De la bonne utilisation des réseaux sociaux…. Évalué à 10.
Le mariage est un contrat. Personne d'autre que les contractants ne peut se plaindre s'il est violé. Pas l'État, pas toi, pas moi, pas les parisiens, pas la famille de la mariée. Personne en dehors des contractants, c'est-à-dire les époux. C'est le principe général des contrats.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Je pensais que tu allais aborder ce genre de problématique
Posté par Liorel . En réponse au journal Facturer comme un chirurgien. Évalué à 3.
Alors attention, on a complètement dévié. On parlait d'un médecin urgentiste, pas un chirurgien.
Déjà, quand un médecin facture auprès d'un hôpital, ce sont ses honoraires perso. Ses frais supplémentaires sont couverts par l'hôpital.
En gros, les coûts liés à l'activité d'un médecin se décomposent comme suit :
Les coûts liés à l'activité d'un chirurgien sont les mêmes plus tout ce qui est lié au fonctionnement du bloc opératoire (personnel de bloc, médecin anesthésiste, matériel de bloc, stérilisation).
Les 2200€ évoqués plus haut concernent uniquement les honoraires du médecin plus, éventuellement, le temps passé à réaliser lui-même certains examens d'imagerie et gestes techniques (notamment les échographies). Sur ce tarif, il y a très exactement 0€ liés au fonctionnement du bloc opératoire. Déjà parce que le mec n'est pas chirurgien, ensuite parce que même s'il était chirurgien, les frais de fonctionnement du bloc sont pris en charge sur une autre ligne budgétaire et ne lui sont à aucun moment versés.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: J'aurai aimé...
Posté par Liorel . En réponse au journal Appel des travailleuses et travailleurs du numérique pour une autre réforme des retraites. Évalué à 7.
C'est con, t'as loupé l'opportunité de faire une blague geek en citant 42 règles différentes, et à bon escient en plus.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: J'aurai aimé...
Posté par Liorel . En réponse au journal Appel des travailleuses et travailleurs du numérique pour une autre réforme des retraites. Évalué à 10.
Le problème, ce n'est pas ceux qui en ont le moins. C'est ceux qui n'en ont pas du tout. L'entreprise a plus intérêt à avoir 100 employés qui bossent à 120% que 120 employés qui bossent à 100%, parce que derrière, ça fait moins de management. Ce qui est exactement encouragé par les heures sup défiscalisées. Le problème, c'est que ça n'aide pas à lutter contre le chômage, parce que dans le cas 1, il y a 20 personnes sur le carreau.
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: inscris depuis peu sur Linuxfr.org...
Posté par Liorel . En réponse au journal Écriture inclusive, féministes et Wikipédia. Évalué à 10.
En fait, il y a un critère : il faut avoir un karma strictement supérieur à zéro, comme indiqué dans la page sur le karma. En clair, ça veut dire qu'il faut, au cours de ta carrière sur linuxfr, avoir reçu au moins 10 pertinentages de plus que d'inutilages (les boutons "pertinent" et "inutile" en bas de chaque commentaire, journal et dépêche).
À part ça, il n'y a effectivement pas de ligne éditoriale, pas d'équipe de rédaction. L'équipe de modération se contente d'éradiquer le spam, de supprimer les violations évidentes de la charte, et de filer un coup de main sur les dépêches1. Linuxfr est ce qu'en font les utilisateurs.
C'est donc une bonne idée de faire ses premiers commentaires sous formes de textes bien construits, argumentés, clairs, sans insultes et sans attaques ad hominem. La communauté a tendance à y être assez sensible.
J'en profite pour la remercier (l'équipe de modération) du boulot fourni sur la dépêche sur Snowden. Une aide discrète mais qui m'a permis de rendre la dépêche plus claire sans la dénaturer. Merci ! ↩
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Brevets et arnaque
Posté par Liorel . En réponse à la dépêche Une victoire de l’éthique dans une guerre économique. Évalué à 6. Dernière modification le 21 novembre 2019 à 14:43.
C'est tout à fait exact. Un autre problème est que les capacités de production n'étant pas illimitées1, les labos ont tendance à orienter leur production vers les pays qui paient le mieux, créant des ruptures de stock dans les pays qui ont le mieux négocié les prix. C'est la principale raison des nombreuses ruptures d'approvisionnement observées ces dernières années en France (la plus médiatisée récemment étant la rupture en corticoïdes).
Notamment pour les médicaments brevetés puisque, par définition, un seul labo a le droit de produire le médicament. Cependant, on observe aussi des ruptures de stock sur des médicaments génériqués. ↩
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Un mot
Posté par Liorel . En réponse à la dépêche Une victoire de l’éthique dans une guerre économique. Évalué à 5.
Je crains que ce soit le second degré qui t'ait échappé ;)
Ça, ce sont les sources. Le mouton que tu veux est dedans.
[^] # Re: Brevets et arnaque
Posté par Liorel . En réponse à la dépêche Une victoire de l’éthique dans une guerre économique. Évalué à 5.
L'un des plus éloquents hors du logiciel, c'est celui de Martin Shkreli, qui a acheté le brevet pour le seul médicament d'une maladie génétique rare, avant de multiplier le prix par 20 (aux US. En France, les tarifs sont négociés par l'assurance maladie et ce serait impossible). Et comme les patients avaient le choix entre payer et s'aggraver jusqu'au décès…
Ça, ce sont les sources. Le mouton que tu veux est dedans.