Le projet R

Posté par  (site web personnel) . Modéré par Pascal Terjan.
Étiquettes :
0
20
oct.
2002
GNU
Le logiciel R est un clone libre de S-Plus, et constitue un système complet et très puissant pour la gestion et l'analyse statistique de données. Le développement est très actif, et la version 1.6 du logiciel vient de sortir récemment.

Il s'agit d'un projet pas forcément très grand public, mais qui est sans doute appelé à prendre de l'envergure, notamment quand on connaît le prix des licences de logiciels de type SAS ou SPSS.

A suivre, donc...

Aller plus loin

  • # Re: Le projet R

    Posté par  . Évalué à 1.

    Ouais, et puis quand on connait la « qualité » de SAS, on se dit que ça ne peut pas être pire. Qu'est-ce que c'est instable SAS.

    Tiens, si je me remettais à faire des analyses factorielles moi, pour repérer des profils dans mes logs de serveurs web ? :)
    • [^] # Re: Le projet R

      Posté par  (site web personnel) . Évalué à 1.

      sas, c'est bien le logiciel qu'on subit en cours de maths ?
      • [^] # Re: Le projet R

        Posté par  . Évalué à 1.

        Maths ou stats. Plutôt stats en général. Pour faire des analyses factorielles, tout ça.
        C'est une daube sous Win (existe sous Unix aussi) qui fait des graphiques pourris en mode texte (mode postscript moche optionnel) et vautre le système ou fait un core-dump toute les deux minutes. En plus, la syntaxe est très conne (chaque commande a presque sa grammaire perso) et la moindre petite erreur oblige a tout recommencer ...

        Bref, j'ai peut-être pas eu de bol, je suis peut-être tombé un mauvais jour, mais je garde un très mauvais souvenir de ce bidule, surtout quand on m'en a dit le prix payé.
        • [^] # Re: Le projet R

          Posté par  (site web personnel) . Évalué à 1.

          Ouais, c'est bien ce dont je me rappelais. On avait droit a la version unix et graphique nous.
          • [^] # Calmos les 3l33t!!!!

            Posté par  . Évalué à 1.

            SAS, ok c'est pas sexy!!!!
            Mais je crois que vous confondez les versions Windows 'a la Excel(tm)' avec la merveille qu'est le système SAS. A l'INSEE ou j'ai fait mes études ou en entreprise, vos remarques sur la gui, les graphiques ou l'instabilité risquent de bien faire rire.
            Franchement, on dirait Jean-Kevin : 'Apache (resp. Linux, AIX, Solaris, ou encore Oracle) c'est nul : à peine 2 pages servies et je l'ai fait planter tout de suite!! Et quand on imprime c'est pas beau'.

            Plus sérieusement, SAS est à la donnée traitée ce que Oracle est à la donnée stockée(tm), et ce serait cool que le libre rentre vraiment sur ce marché comme Apache, PostgreSQL ont pu le faire sur d'autres.
            Malheuresement, il faut bien voir qu'aujourd'hui R n'est qu'un logiciel de calcul et que les autres projets importants comme GNUe ne sont pas encore prêts à entrer sur le marché de la gestion d'entreprise (CRM...).
            Reste que R est un bon langage de stat avec plein d'extensions disponibles et que en plus il ya des bindings Python :
            http://www.omegahat.org/RSPython/(...)
            http://rpy.sourceforge.net/(...)

            Mais le plus important : c'est libre, crédible et supporté dans pas mal de FACs.

            Tant que j'y suis, je rajoute ça :
            http://gretl.sourceforge.net/(...)
            C'est plus simple, je trouve.
            • [^] # Mais pas du tout

              Posté par  . Évalué à 1.

              Attends là, d'accord, je suis sans doute un Jean Kevin mais, une appli de stat présentée comme « pro » par nos profs, qui plante 5 fois en 2 heures sur des pauv' calcul sur des stocks de données ridicules (genre 50 valeurs) et qui prétend être professionnelle moi je dis NON !
              À ajouter à ça la grammaire des programmes, beurk ! On dirait du goto++, c'est infame ! Oser comparer Apache à ça, c'est dégradant pour Apache.

              Sinon, j'ai commencé à tenter de refaire mes TPs de SAS avec R et même si R demande un peu plus de code à écrire, c'est beaucoup plus agréable à utiliser, je trouve.

              Je vais regarder gretl, ça a l'air sympa.
              (j'y crois pas, à cause de tout ça je me replonge dans les stats :)
              • [^] # Soyons clairs

                Posté par  . Évalué à 1.

                On ne va pas jeter Oracle à la poubelle parce qu'on dit qu'en 1989, pour concurrencer Microsoft Access, ils auraient commis une bouse infâme, qui, dit-on, plantait blablabla...
                SAS Institute ( http://www.sas.com/(...) ) est une boîte canadienne énorme qui fournit des solutions de traitement de données ultra-pousées, ultra-chiadées. Leurs solutions tournet sous pas mal de matos (à mon époque l'ENSAE, école de l'INSEE, avait un IBM 3270) et même si en voulant concurrencer SPSS ils ont fait des softs "bureautiques" sous windows qui ont pas toujours été nickel, leur softs, de La Redoute (gros traitements marketing) aux instituts de sondages, sont la référence absolue en matière de stat et d'économétrie (quite à se faire un peu^W^W totalement détrousser à la caisse).

                une appli de stat présentée comme « pro » par nos profs, qui plante 5 fois en 2 heures sur des pauv' calcul sur des stocks de données ridicules (genre 50 valeurs) et qui prétend être professionnelle moi je dis NON !

                ATTENTION! Tu jean-kevinises encore!!!!
                OK pour 50 données, je sais pas. Quand on paye ces machins énormes et indigestes, avec la bécane qui va avec, c'est qu'on en a généralement 50k ou plus.
                A une époque (vers 89-92), ils avaient un soft win3.1 à 20kF qui était pas génial, c'est un peu le défaut de la boîte : à 20kF ils ont l'impression de te le donner et ne font peut-être pas les efforts qui iraient décemment avec la facture.

                Mais on ne peut pas jeter SAS pour autant. La syntaxe si décriée, la présentation minimale, la facture de base et le tarif des options ne montrent qu'une chose : c'est un produit phare de l'informatique profesionnelle, au même titre que le sont les unix propriétaires, Oracle ou SAP.
                • [^] # Re: Soyons clairs

                  Posté par  . Évalué à 1.

                  (...) avait un IBM 3270 (...)

                  Heu... Non, le 3270 c'est le format des flux entre les terminaux passifs et le host (comme le 5250). Ce devait être plutôt un 3090 ou un 9370, tout à fait adaptés à ce genre de traitements.

                  Bon, ça ne rajoute rien au débat, mais juste histoire d'être précis!
                • [^] # Re: Soyons clairs

                  Posté par  . Évalué à 1.

                  (...) avait un IBM 3270 (...)

                  Heu... Non, le 3270 c'est le format des flux entre les terminaux passifs et le host (comme le 5250). Ce devait être plutôt un 3090 ou un 9370, tout à fait adaptés à ce genre de traitements.

                  Bon, ça ne rajoute rien au débat, mais juste histoire d'être précis!
  • # Re: Le projet R

    Posté par  . Évalué à 1.

    Hummm, il semblerait que dans mon école Windows-only, on va distribuer des licences SAS aux étudiants, est-ce que (dans la mesure ou on va pas me regarder comme un extraterrestre en demandant un CD Unix) la version Unix tourne sous Linux ?
    • [^] # Re: Le projet R

      Posté par  . Évalué à 1.

      "est-ce que [...] la version Unix tourne sous Linux ? "

      Non, mais il existe une version Linux a part entière, depuis peu d'ailleurs.

      Pour en revenir a R, je trouve que c'est vraiment une application très mûre et
      très complète, une vraie "killer app". il existe beaucoup de packages adaptés
      à des sujets très divers (de l'économie à la génétique), il est possible de récupérer
      des données depuis des BDD etc... Sans parler de l'aide en ligne vraiment bien faite.

      Bref, que du bonheur :)

      Tu devrais peut-être en parler à ton école, en plus il existe une version windows.
  • # C'est beau, mais ça sert à rien! (ou presque)

    Posté par  . Évalué à 1.

    La comparaison avec SAS, c'est du bluff, et c'est bien le problème de R, comme de pas mal de briques du libre, néanmoins bourrées de qualités.
    SAS Institute, c'étatit une espèce de start'up de matheux, qui ne faisait rèver que les matheux, et 20 ans plus tard c'est devenu une boîte d'outils marketing et busines intelligence.
    R dans tout ça, ce n'est que le moteur central, le langage et les routines de calcul, ça ne sert qu'à des TP de fac ou à rédiger des thèses.
    Le drame de R, c'est qu'aucun outil valable, GNUe, GNU Ledger, outils de stats réseau ,admin système ou autre, ne l'utilise. A part des bindings python et un plugin gnumeric, R n'a aucune occasion de sortir des fac et des labos. Pas de gui kde ou gnome, pas d'outils spécialisés comme on en trouve autour d'autres lib matheuses : on est loin du GIMP de l'analyse de données, du apache des sociétés d'assurance ou de la killer app de l'analyse économétrique du desktop.

    Il y a près de 15 an, S aurait pu révolutionner la façonde faire ces calculs, mais a syntaxe et son achitecture en avance n'ont rien amené de concrêt, comme cela a été le cas pour NEXTSTEP/ObjectiveC(merde, un troll!!) ou les bases de données objet.

    ET si ce succès technique cachait en fait un échec, celui qui a amené à l'arrêt de S et la faible diffusion de S-PLUS?


    Rêvons ensemble (je ne connais qu'un peu de python) : Kde Job Oriented Data Explorer
    Une app. kde (ou gnome si on préfère), qui fonctionne avec le moteur R pour les calculs, propose un éditeur de traitements 'UML-like' façon ViSTA (http://forrest.psych.unc.edu/vista(...) ) permettant de préparer le traitement des données et de suivre le déroulement. Prévoir des imports (ODBC, office), des sorties vers des formats standards (OOo, koffice,PS), des traitements par machine distante (adapter R au cluster en même temps) et un format de description des traitments (XML?) permettant aux utilisateurs de trouver des arbres de traitements déjà prêts à la façon des modèles de présentation ou des plugins DIA/KIVIO.
    Voilà, fini de rèver, ça existe pas!!!
    • [^] # Re: C'est beau, mais ça sert à rien! (ou presque)

      Posté par  . Évalué à 1.

      Hop ! Au boulot !
      C'est vrai que le libre fait plus de moteurs que d'applis métier pour l'instant, mais finalement c'est logique, le transfert de compétences métier est ce qui coûte vraiment cher.

      Cela dit, j'ai pas les compétences en statistiques pour faire de l'analyse des mes logs apache (par exemple).

      Y'a des bons bouquins pratiques d'analyse statistique « for dummies » ?

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.