Thomas a écrit 103 commentaires

  • [^] # Re: Metriques

    Posté par  (site web personnel) . En réponse au journal Data Warehouse. Évalué à -1.

    Comme dit au dessus, si, les perfs comptent. Un traitement "temps-reel" n'implique pas les mêmes contraintes que du batch offline.

    Ca depend ensuite de ce qu'on veut faire precisement, des évolutions previsibles, de la complexité à priori des traitements etc. Ex: si la taille de la base doit augmenter rapidement, il faut pouvoir faire grossir l'infrastructure sans tout chambouler.

    Donc comme d'hab, je dirai : tenter les solutions classiques et éprouvées, genre pas de trucs exotiques à la noSQL, et si ça bloque vraiment, envisager les Hadoop/Spark etc. Ce qui permet aussi de quantifier les besoins humains.

    Mes deux centimes

  • # Metriques

    Posté par  (site web personnel) . En réponse au journal Data Warehouse. Évalué à 3.

    Quelle quantité de données à stocker ?
    Quelles fonctionnalités attendues ?
    Quelles perfs ?
    Quelle infra ?

  • # Mouais

    Posté par  (site web personnel) . En réponse à la dépêche Prédire la note d’un journal sur LinuxFr.org. Évalué à 4.

    Bon, j'ai lu.
    Pas jusqu'au bout, pas le temps.

    En effet, il y a parfois confusion test/train, ce qui donne des scores de fou … normal.

    De deux, je suis pas sur de la qualité du dataset de base. Faudrait voir s'il y a une qcq cohérence entre le contenu et la note. Fitter du bruit, ca doit donner du bruit. Ca manque cruellement de découverte/qualification des données d'entrées, padawan.

    Mais bel effort :)

    Et SGD != SVM.

  • # test/train

    Posté par  (site web personnel) . En réponse à la dépêche Prédire la note d’un journal sur LinuxFr.org. Évalué à 5.

    Salut

    C'est sympa scikit-learn, n'est-ce pas ?!

    Pas le temps de creuser, mais j'ai une remarque: tu différencies bien tes dataset d'entraînement et de test ? Ca fausse tous les scores, sinon. La routine test_train_split (ou ~) sera ton amie.

    Si le sujet du machine learning t'intéresse, je me permets de t'indiquer ce site : http://oceandata.io (le mien). Jouer avec les données, c'est mon gagne-pain.

  • [^] # Re: Code des programmes Brainfuck

    Posté par  (site web personnel) . En réponse au journal Kotlin + Brainfuck : efficacité, compacité, optimisation. Évalué à 3.

    C'est beau.

  • # Disruptons !

    Posté par  (site web personnel) . En réponse au journal [HS] Des disruptifs à la pointe... Dans le mélange des genres. Évalué à -4.

    Disrupter Paypal est-il vraiment pertinent ? Sur quels points ?

  • # BS marketing

    Posté par  (site web personnel) . En réponse à la dépêche Séminaire de réarmement intellectuel et technique sur le "Big Data". Évalué à 4.

    Petit à petit, se dessine une société où toute forme de médiation humaine peut être estimée moins performante qu’un algorithme ayant la prétention de nous connaître mieux que nous-mêmes, du fait qu’il recueille en permanence des données, la plupart du temps à notre insu, par nos usages quotidiens du numérique.

    On croirait lire le discours des agences de "transformation digitale" pronant la "révolution numérique". Ce discours n'est pas fondamentalement faux, mais il n'en reste pas moins extrêmement exagéré et, quelque part, mensonger.

    Caser des algos de machine learning et du "predictif" quand c'est pertinent, oui. Mais en faire une solution miracle, non. Ce genre de discours est nuisible.

  • [^] # Re: Dans la disruption

    Posté par  (site web personnel) . En réponse au journal L’Outil et la Technique. Évalué à 2.

    Bah ouais.
    Ca peut paraitre idiot.
    Mais ouais.

    De ce que j'ai pu en tirer de compréhensible. Mais va le lire, tu comprendras pourquoi j'ai dit ca.

  • # Dans la disruption

    Posté par  (site web personnel) . En réponse au journal L’Outil et la Technique. Évalué à 6.

    Merci pour ce journal.

    J'ai lu recemment plus de la moitié de son dernier livre Dans la disruption. Le sujet est très actuel : il envisage et theorise les phénomènes disruptifs qu'on nous sur-vend en permanence en ce moment.

    L'idée générale, pour ce que j'ai réussi à en tirer, est qu'une massive perte de valeurs accompagne la "data economy", "l'intelligence computationnelle et algorithmique" (ce sont ses expressions, ou pas loin, je n'ai pas le bouquin sous les yeux). Mouais. Ca pue le "c'était mieux à vent" et le catastrophisme facile.

    L'énorme reproche que je lui fais, c'est qu'il jargonne moultement. Ses idées me semblent valables, pour ce que je peux en juger (faiblement, donc), mais son style et sa formulation sont pour moi rédhibitoires. Pour faire court : je n'ai vraiment pas compris ce que je lisais, 95% du temps. Un livre pour les philosophes ; donc une pensée pour moi perdue. Ou alors je suis trop con. Une rencontre ratée, cependant. Dommage …

  • # chiffrer.info

    Posté par  (site web personnel) . En réponse au journal un vrai coffre fort numérique. Évalué à 4.

    Je profite de ce journal pour soumettre à votre sagacité ce petit presqu'HS de qualitai : chiffrer.info.

    Peut-être connaissiez-vous déjà.

  • [^] # Re: Coder ses propres algo

    Posté par  (site web personnel) . En réponse au journal #data et libre : une belle histoire ?. Évalué à 3.

    Yep.

    Je pensais surtout a mes clients qui bossent dans le marketing / CRM et autres decideurs pressés: ils ne vont pas demander à leurs équipes de coder un outil de segmentation.

    Perso, je saurais faire. Mais ce serait surement bancal, probablement truffé de bugs et forcément non-optimal. Et ca me prendrait du temps. Par contre, comprendre le fonctionnement est utile et plaisant, je trouve.

  • [^] # Re: IA

    Posté par  (site web personnel) . En réponse au journal #data et libre : une belle histoire ?. Évalué à 2.

    Peut-etre.

    Les gens a qui je parle n'ont a peu pres aucune idee précise de ce qu'est l'IA. Ils s'en foutent ou ne voient pas en quoi ca pourrait les concerner.

    Ce qu'ils veulent, c'est de l'intelligence dans les traitements. Mais cette "intelligence" se resume souvent (au final) à des stats, du data mining ou des applications directes de machine learning (classification, prediction).

    Après, j'ai du trop lire Asimov, Gibson ou Banks pour pouvoir parler d'IA sereinement.

  • [^] # Re: Tu fais tes graphiques avec quoi ?

    Posté par  (site web personnel) . En réponse au journal #data et libre : une belle histoire ?. Évalué à 2.

    Cool, un transfuge de R !

    Je ne connais pas ggplot2.
    Je ne connais pas R non plus. Parait que c'est bien, mais je n'ai jamais vu l'intérêt que j'aurais à m'y mettre.

    Je ne me sers que de matplotlib, je ne connais vraiment rien d'autre en python pour tracer des trucs. Cela dit, je ne vais pas bcp plus loin que le 2D, ca me suffit. Et quand je sèche, je me balade dans leur galerie web.

    Data scientist, c'est pas forcément facile à vendre. Le terme est parfois connu, mais la définition est large … ca peut recouvrir les maths, les stats, le nosql, la manipulation (handling) de données, le machine learning. Je me force à ne pas parler technique (osef, au final) et à insister sur la valeur.

    On verra avec le temps !

  • [^] # Re: Outils libre et business

    Posté par  (site web personnel) . En réponse au journal #data et libre : une belle histoire ?. Évalué à 1.

    Clairement, si certains outils libres sont bien positionnés sur ce segment de marché, c'est parce que certaines licences sont tellement permissives que des entreprises peuvent reprendre le code tel quel, en rajouter par dessus, et vendre le tout un certain prix (et aussi pourquoi pas l'intégration).

    AMHA ce qui joue vraiment c'est que ce qui a de la valeur c'est la donnée et pas l'exécutable.

    Disons qu'il faut les deux :
    - d'une part l'outil, et savoir l'utiliser,
    - d'autre part la donnée et sa compréhension métier.

    Il faut aussi ajouter l'accompagnement et la recul sur la pertinence des résultats.
    Un mix, quoi.

  • [^] # Re: Scam?

    Posté par  (site web personnel) . En réponse au journal Douche froide pour la fusion. Évalué à 2.

    Disons que le truc de Lockheed Martin est sexy.

  • # Magic happens.

    Posté par  (site web personnel) . En réponse au journal Douche froide pour la fusion. Évalué à 6.

    Merci pour l'info.
    Rapport "scientifique" ici.

    Ca sent quand même le fake. Quelques extraits de la conclusion du rapport :

    If nuclear transitions are prevalent in the burning process it is expected that radiation is emitted. It is remarkable that neither neutrons, charged particles nor gammas are observed from the E-cat reactor.
    Furthermore, the spent fuel was found inactive right after the E-Cat run was stopped. All imaginable nuclear reactions in the reactor should be followed by some radiation, and at least some of that radiation should penetrate the reactor wall and be possible to detect.

    Although we have good knowledge of the composition of the fuel we presently lack detailed information on the internal components of the reactor, and of the methods by which the reaction is primed. Since we are presently not in possession of this information, we think that any attempt to explain the E-Cat heating process would be too much hampered by the lack of this information, and thus we refrain from such discussions.

    In summary, the performance of the E-Cat reactor is remarkable. We have a device giving heat energy compatible with nuclear transformations, but it operates at low energy and gives neither nuclear radioactive waste nor emits radiation. From basic general knowledge in nuclear physics this should not be possible.

    En résumé : ils observent une production de chaleur, une modification (probable) de ce qu'il y avait à l'intérieur du bouzin, et ils ne voient aucune radiation.

    Bof. Tant que le dispositif n'est pas analysé en détail (pas vu où), je dis "fake".

  • [^] # Re: sf

    Posté par  (site web personnel) . En réponse au journal Sélection des candidats pour le prix Hugo 2014 & Rosny aîné 2014. Évalué à 3.

    Iain M Banks : "cycle" de la Culture.
    Greg Egan : quasi tout ses bouquins. Commencer par les recueils de nouvelles.

  • # Mesures ? ...

    Posté par  (site web personnel) . En réponse au journal [journal bookmark] Et hop, c'est fait. Évalué à 8.

    J'y connais rien dans ce domaine.

    Seulement :

    «Le temps de vol théorique à la vitesse de la lumière est de l’ordre de 2,4 millisecondes. La longueur du trajet de 730 km est connue à 20 cm près. Les neutrinos font le trajet 60 nanosecondes plus vite que la vitesse de la lumière dans le vide. Cette mesure est précise à 10 nanosecondes près, si l’on additionne toutes les incertitudes connues sur les 15 000 événements analysés - correspondant à autant de neutrinos détectés», résume Dominique Duchesneau [Libé]

    Ils ont foutu un GPS au cul des neutrinos, et avec leur Swatch electronique, ils mesurent un temps de 2.4ms au 730km avec +/-10 ns de precision.

    Flag d'exces de vitesse italien constaté par de la flicaille suisse : faut-il s'étonner :-) ?

    En tout cas, la précision de la mesure est juste folle.
    Et Usain Bolt est vraiment un lourdeau ...

  • [^] # Re: Pas n'importe quoi non plus

    Posté par  (site web personnel) . En réponse au journal Énergie nucléaire et bon sens. Évalué à 2.

    Comment récupérer l'énergie.

    J'avais écouté une émission à la radio où justement ils disaient que ce problème était réglé.

    Non, il n'est pas réglé.

    Quel matériaux mettre ?

    Ils disaient dans la meme emission que c'etait une des missions d'ITER.

    ITER permettra de tester des materiaux sous conditions de temperature proche du reacteur. L'impact des flux de neutrons ne sera pas vraiment testé, une autre installation s'en occupera (IFMIF, google est ton ami).

  • [^] # Re: Pas n'importe quoi non plus

    Posté par  (site web personnel) . En réponse au journal Énergie nucléaire et bon sens. Évalué à 4.

    ITER va se finir comme SuperPhénix en trous noir à fric qui aurait pu être mis ailleurs

    On peut toujours mettre la thune ailleurs. C'est une question de choix ensuite. ITER sera le seul tokamak capable de créer des plasmas où il sera possible d'étudier précisemment les conditions d'operation d'un reacteur à fusion. Il faut le faire si on veut un jour s'engager sur le reacteur prototype. La question ne se pose pas autrement.

    vrai recherche universitaire amont sur la fusion

    Ca fait deux fois que tu parles de ca. Qu'est-ce que tu entends par là ? Qu'est-ce qui te faire croire qu'il faut encore de la recherche sur des tokamaks (ou autres configurations magnetiques) de labo, ie de taille ridicule ? Les chercheurs ont fait de la recherche sur ce genre de machines pendant, allez, 30 ans, puis ils se sont mis à faire de grosses machines. Pourquoi ont-ils eu tort ?

  • [^] # Re: Pas n'importe quoi non plus

    Posté par  (site web personnel) . En réponse au journal Énergie nucléaire et bon sens. Évalué à 8.

    SuperPhenix est un échec car à la base il y a une erreur grave, vouloir refroidir au sodium liquide. Le sodium est une bombe en puissance.

    C'est aussi un super caloporteur. Je vais pas rentrer dans la thermodynamique ici, mais il faut bien se rendre compte que pour evacuer / transporter de fortes quantitées de chaleur sous fort flux, l'eau (même pressurisée) c'est parfois juste pas suffisant. Le sodium, ca fait boum avec l'eau, mais ca a pas mal de qualités. Voir Forum_International_Génération_IV par exemple.

    Sinon, il faudrait aussi arrêter ITER qui est une pompe à fric dont on ne sais même pas si dans 50 ans cela marchera. Il faut remettre la fusion et l'argent dans les laboratoire de recherche universitaire...

    1/ ITER est une expérience, rien de plus, rien de moins. 20 milliards sur 20 ans, repartis entre 11 partenaires, c'est pas tant que ca. Avant de cracher sur ce genre de projet, il faut bien se rendre compte des coûts engendrés et des bénéfices qu'on en tirera.

    2/ La fusion marchera quand la société en aura besoin. On manque d'argent, pas d'idées.

    3/ Il se trouve que la recherche en fusion par confinement magnetique des 40 dernières années a montré (pour faire court) que les perfs vont avec le carré de la taille de la machine. Manque de bol, les technos accessibles vont avec le cube de la taille. Donc pour progresser sur cette voie (celle des tokamaks), il faut raquer. La recherche universitaire est partie prenante des manips actuelles.

    Bref, il y a du ménage à faire au CEA et remettre le CEA sur des projets à plus court terme ou les dirigeants rendent des comptes.

    Le CEA, c'est juste le CEA : dans le domaine de l'energie, ils bossent sur les Gen IV et la fusion (magnetique et inertielle), mais aussi sur le solaire, l'eolien surement etc. Des fois, ils chient, mais ils ne sont pas responsable de tout.

  • [^] # Comme disait Léo ...

    Posté par  (site web personnel) . En réponse au journal RÉVOLUTION ESPAGNOLE : Que se passe-t-il ?. Évalué à 0.

    Pour l'anarchiste à qui tu donnes
    Les deux couleurs de ton pays,
    Le rouge pour naître à Barcelone,
    Le noir pour mourir à Paris

    Thank you Satan

  • # Clairement

    Posté par  (site web personnel) . En réponse au journal Journal Todd / Mélenchon. Évalué à 6.

    Très intéressant en effet. Ils envoient du lourd tous les deux.

    Je regrette un peu l'attitude de Schneidermann à vouloir automatiquement les opposer, tout en insistant (et rediffusant) une interview de Todd qui traite Mélenchon de gugusse. A part ça, la discussion est intéressante et j'ai le sentiment que Mélenchon s'en sort très bien.

  • [^] # Re: Fusion ?

    Posté par  (site web personnel) . En réponse au journal fusion ou fission autour du nucléaire ?. Évalué à 2.

    Ok, merci, c'est un peu plus clair.

    De tous les problèmes qu'on prévoit pour les réacteurs industriels, ce genre de considérations (=relevant seulement de l'ingénierie) ne sont pas prioritaires. Disons que les gars se concentrent principalement sur les points de physique (plasma, matériaux, couplage de puissance), de cycle énergétique, d'entretien et de durée de vie.

  • [^] # Re: Fusion ?

    Posté par  (site web personnel) . En réponse au journal fusion ou fission autour du nucléaire ?. Évalué à 2.

    Je ne sais pas ce que c'est ce joint torique, j'en ai jamais entendu parler.