R-project bouge, R version 2.2.0 sort

Posté par . Modéré par Jaimé Ragnagna.
Tags :
0
8
oct.
2005
Presse
R est un environnement utilisant un langage pour l'analyse mathématique et statistique sur ordinateur, et produit également des graphiques de très grande qualité. Il est extrêmement modulaire ce qui a grandement facilité la création de modules spécifiques par des tiers. On trouve ainsi des dizaines de modules spécifiques pour l'analyse d'un type de problème précis.

R implémente notamment en open-source le langage S (des laboratoires Bell maintenant Lucent Technologies), dont les programmes tournent quasiment sans modification avec R, ce qui en fait un outil de choix pour les recherches mettant en oeuvre les statistiques : bioinformatique, analyse de marchés financiers, analyse de données spatiales...

Le projet R est encore bien peu connu du public probablement à cause de son coté austère et ciblé. C'est pourquoi les sorties se font discrètes. Hier c'est la version 2.2.0 qui a été publiée, avec son lot de changements concernant principalement le confort d'utilisation.

R peut certes sembler rebutant pour l'étudiant souhaitant faire quelques calculs statistiques, mais - une fois pris en main - il se révèle très efficace. Ce projet montre bien qu'une conception bien définie et modulaire d'un projet est source de participation extérieure, denrée hélas plus rare que ce qu'il n'y parait dans le développement libre :)

Aller plus loin

  • # HS

    Posté par . Évalué à 7.

    <mode mauvaise humeur>
    Qu'est ce que ça me gonfles tout ces projets qui utilisent soit une lettre ou un nom commun comme nom ...
    Aprés pour faire des recherches, ça ne fait que compliquer la vie ... et ça manque d'originalité :)
    </mode mauvaise humeur>

    Bon me rattrapper, je dirai que les captures d'ecrans sont plutôt impressionnants. Est ce qu'il peut remplacer matlab pour certaines pratiques ?
    • [^] # Re: HS

      Posté par . Évalué à 3.

      Dans le HS aussi, et donc rien à voir avec le tient, on m'a parlé vendredi de ce logiciel...
      enfin, une prof, qui a dit plus ou moins : "Donc, on n'utilisera pas SAS (NdMoi : enfin, quelque chose comme ça) qui est le plus puissant, mais R pour faire les TP". Failli demander : gratuit, ou libre et gratuit, mais je me suis abstenu, pour pas gonfler les autres avec des questions HS, en me promettant de chercher dès que j'y penserais... formidable, DLFP, même plus besoin de penser, ni de chercher...
      [ / ma vie ]
      • [^] # Re: HS

        Posté par . Évalué à 3.

        Attention tout de même : dire que "SAS est le plus puissant", c'est vraiment s'avancer. En fait, ça dépend des cas. Mais avec moins de 1 million d'observations, R est souvent supérieur.
    • [^] # Re: HS

      Posté par . Évalué à 4.

      Je n'ai pas exploré les deux logiciels à fond (je dirais même que je les ai effleurés...) mais R semble être une solution meilleure pour les statisticiens. Par exemple comment extraire des données, à partir d'énormes tableaux de chiffres. Ça se fait en trois lignes à l'aide d'outils de classification, comme l'analyse en composantes principales ou l'analyse factorielle. (hop là je ressors des termes de vieux cours que j'ai suivis...)
    • [^] # Re: HS

      Posté par . Évalué à 5.

      Oui, il peut remplacer matlab, mais surtout pour les operations statistiques. Matlab a toute une serie de toolbox disponibles pour faire de l'analyse numerique, etc, et ce n'est pas le point fort de R.

      Zorglub
      • [^] # Re: HS

        Posté par . Évalué à 7.

        R n'a jamais été développé pour remplacer matlab. Le nom "R" viens du fait que le logiciel veut être l'équivalent d'un autre langage stats "S".

        C'est donc un logiciel orienté statistiques et production de graphiques de qualité scientifique. J'ai déjà rencontré des gens faire de la modélisation avec R, mais c'est un peu comme si quelqu'un esayait de faire du dessin vectoriel avec gimp...
        • [^] # Re: HS

          Posté par . Évalué à 0.

          Ca tombe bien, c'est plus ou moins ce que j'ai ecrit en dessus...

          Zorglub
    • [^] # Re: HS

      Posté par . Évalué à 4.

      Ouais, en tout cas une recherche google avec comme seul mot-clef "r" donne la page de ce soft en premier résultat (sur google.com) et en troisième (sur google.fr). Donc ...
    • [^] # Re: HS

      Posté par . Évalué à 1.


      Aprés pour faire des recherches, ça ne fait que compliquer la vie ...


      Surtout avec X ;-)

      --->[]
      • [^] # Re: HS

        Posté par . Évalué à 2.

        Et que penser de Latex alors? faites un "latex augmenter retrait" sur google, pour voir :-) En fait, c'est fou ce qu'un nombre de termes anodins peuvent avoir une signification cachée...
  • # Bindings python

    Posté par . Évalué à 10.

    Comme c'est pas flagrant dans les liens donnés, voilà les deux bindings python pour R:

    - RSPython : permet d'appeler python depuis R, et R depuis python
    http://www.omegahat.org/RSPython/(...)

    - RPy : s'inspire de RSPython mais n'implémente que la partie "R depuis python"
    http://rpy.sourceforge.net/(...)

    A noter que rpy prend tout son sens lorsqu'il est couplé avec un truc du genre numarray.
    http://www.stsci.edu/resources/software_hardware/numarray(...)

    Il me semble que découvrir R via python est plus facile vu que python est quand même (il me semble) plus connu que R...
    (A ma connaissance, pas de bindings Ruby).

    Voilà-voilà.
  • # Un peu dans le même genre il y a GDL

    Posté par . Évalué à 9.

    Bravo à tous les contributeurs pour cette nouvelle version. J'avais jeté un œil l'année dernière et ça m'avait déjà paru très intéressant.

    <pub éhontée>Sinon, je tiens aussi à signaler l'existence du projet GDL (http://gnudatalanguage.sourceforge.net/(...) ) qui est un clone libre (GPL) du ô combien onéreux et propriétaire IDL® (Interactive Data Language) et qui commence à devenir bien utilisable. C'est un langage de traitement de données et de visualisation, vectoriel, largement utilisé dans la recherche et l'industrie
    Comme pour R, les participations extérieures sont très bienvenues, que ce soit pour corriger une typo, implanter des fonctions, faire des paquets pour une distribution ou quoique ce soit d'autre. Le fondateur et coordinateur du projet est d'ailleurs fort sympathique et très patient pour guider les premiers pas.</pub éhontée>
  • # Question un peu HS...

    Posté par . Évalué à 5.

    Voilà je sais ça pas forcement ça place ici mais bon je pose la question quand même...

    Je viens de commencer à apprendre à utiliser le logiciel SAS (je suis en 3ème année de MIAGE pour faire simple) et je voulais savoir si R pouvait remplacer SAS (enfin je voudrais savoir si le langage était similaire surtout...) ou s'il existait un logiciel similaire gratuit (libre ça serai le pied mais gratuit ça serait bien) tournant sous Linux et ayant un langage proche...
    • [^] # Re: Question un peu HS...

      Posté par . Évalué à 5.

      R peut remplacer SAS, dans le sens ou la majorite des fonctions de SAS ont un equivalent dans R.

      Par contre, le langage n'a rien du tout en commun.

      Zorglub
    • [^] # Re: Question un peu HS...

      Posté par (page perso) . Évalué à 6.

      R est un langage de statistique et SAS... ben c'est SAS quoi !

      Pour faire simple disons que pour faire des statistiques le remplacement est possible, mais il faut avoir deux trois choses à l'esprit :
      - SAS sait travailler sur de très gros volumes, ce que R ne saura jamais faire (la plupart (totalité ?) de ses fonctions chargeant l'ensemble des données en RAM pour effectuer les calculs).
      - Il est beaucoup plus simple de développer quelques chose avec R qu'avec SAS. Dans certain labo où SAS est "obligatoire" on teste les nouveau modèles avec R (la manipulation de données étant confiée à une SGBD, ou un langage de haut niveau du type perl/python) puis on implémente sous SAS celui qui va bien.
      - Les résultats peuvent différer sur certaines méthodes car certaines techniques statistiques ne sont pas implémentée de manière identique (par exemple les générateurs de nombres aléatoires).
      - SAS est fortement implenté dans les entreprises (et R assez peu) aussi en tant qu'étudiant MIAGE, il est très conseillé de bien savoir faire du SAS !
  • # R et PostGreSQL

    Posté par . Évalué à 5.

    A noter aussi que l'on peut utiliser R depuis PostGreSQL, je l'ai testé avec succès pour faire des graphiques.
    Ça se fait avec PL/R (exemples sur le site).

    SELECT mon_graph('SELECT x, y FROM mesures','/tmp/mon_graphique.ps');

    Je vais voir pour faire plus facilement des anova et autres tests de moyennes.

    Ce serait super de faire un truc du genre
    SELECT test_t(
    'SELECT masse FROM mesures WHERE serie=1',
    'SELECT masse FROM mesures WHERE serie=2'
    );

    et d'obtenir directement le résultat.

    Voila, si ça peut donner des idées.
  • # D'autres informations

    Posté par (page perso) . Évalué à 10.

    Je suis utilisateur de R depuis la version 0.6.0 et je l'ai vu évoluer avec le plus grand plaisir !

    Je me permet d'ajouter quelques informations complémentaires.

    Tout d'abord, comme on peut le voir sur le site r-project R dispose à l'instar de Perl de son CRAN [1] (Comprehensice R Archive Network) et d'une communauté riche en statisticiens (beaucoup d'universitaires en fait).
    Le terme cran est d'ailleurs le bon mot clé à employer pour des recherches web où dans les paquetages de distribution (sous Debian, par exemple, un petit "apt-cache search cran" donnera l'ensemble des paquetages disponibles).

    L'écriture de scripts R est facilité par une coloration syntaxique sous vim ou emacs (grâce à ESS : Emacs Speaks Statistics) et une interface utilisateur conviviale existe pour les débutants [2] (ainsi que une intégration possible dans Gnumeric ou Excel - D'ailleurs si quelqu'un sait comment faire de même sous OpenOffice Calc, je suis très interressé !).

    Je voudrais enfin préciser, surtout pour les étudiants, que si l'effet du "je fais mon mémoire en LaTeX et non en Word" permet souvent de maximiser la note de présentation, il en va de même pour le "je fais mes graphiques avec R et non un tableur". D'autant plus que ce n'ai pas si difficile que ça de s'y mettre (voir [3] et [4]).

    Liens :
    [1] - CRAN (mirroir de l'Université de Lyon)
    http://cran.univ-lyon1.fr/(...)
    [2] - R commander : une interface utilisateur plus conviviale pour les novices
    http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/(...)
    [3] - Exemple de "belles" statistiques obtenues grâce à R
    http://zoonek2.free.fr/UNIX/48_R/all.html(...)
    [4] - Des fiches de TD sur l'emploi de R (Université de Lyon)
    http://pbil.univ-lyon1.fr/R/enseignement.html(...)
    • [^] # Re: D'autres informations

      Posté par (page perso) . Évalué à 3.

      et il y a quelques interfaces graphiques de disponibles
      vous pouvez déjà essayer
      R --gui=tk
      pour en lancer une simpliste... (à part le menu qui se rajoute, ça reste un terminal élaboré en ligne de commande :-( ) et ne pas hésiter à regarder sur le site les autres environnement graphiques proposés
      • [^] # Re: D'autres informations

        Posté par . Évalué à 5.

        RKWard est une interface beaucoup plus évoluée que R-gnome. Voir rkward.sf.net et post plus bas !
  • # Quelle différence avec...

    Posté par (page perso) . Évalué à 4.

    Bonjour,

    dans le domaine du calcul numérique on trouve plusieurs noms (plus ou moins libre)

    - Octave
    - Scilab
    - R

    (ce n'est que quelques exemples)


    Quelles sont les différences entre ces logiciels ?

    Merci
    • [^] # Re: Quelle différence avec...

      Posté par . Évalué à 3.

      A vue de nez, parce que je connais pas bien R:

      octave: clone lire de matlab qui essaie d'être compatible (je dirais compatible à 90%, mais sans les toolbox, forcément)

      scilab: calcul vectoriel, donc, concurrent de matlab, développé par l'inria au départ (oui, je l'aime bien, il est assez puissant pour tous mes besoins). on note l'existence d'un convertisseur matlab vers scilab, mais je ne l'ai jamais testé

      R: calcul statistique!
    • [^] # Re: Quelle différence avec...

      Posté par (page perso) . Évalué à 6.

      Pour le plus ou moins libre, il suffit de dire qu'Octave et R sont libres et que Scilab est propriétaire (cf sa licence), même si l'INRIA prétend le contraire.
      • [^] # Re: Quelle différence avec...

        Posté par . Évalué à 2.

        même si c'est une licence maison elle m'a l'air plutot respectueuse de l'idée de la GPL. on a le droit de distribuer le logiciel, d ele modifier et de redistribuer gratuitement ou en faisant payer notre code modifier ou non.

        ca ma l'air bien!
        • [^] # Re: Quelle différence avec...

          Posté par . Évalué à 2.

          Tu parles bien de la licence de scilab ? D'après http://www.gnu.org/philosophy/license-list.html(...) il est indiqué : « This is not a free software license because it does not allow commercial distribution of a modified version. »
          • [^] # Re: Quelle différence avec...

            Posté par . Évalué à 1.

            je viens de retourner sur leur site pour essayer de comprendre. en fait c'est bizzare. en lisant la licence francaise j'ai l'impression que la vente/distribution est autorisé mais pas son inclusion dans un autre logiciel propriétaire. la FAQ va a peu près dans ce sens apparament.

            bon ben pour moi un myth s'effondre (en partie). ils pourraient en faire une version sous licence Cecill.
            • [^] # Re: Quelle différence avec...

              Posté par . Évalué à 2.

              La FAQ (anglaise) dit :
              use freely Scilab for commercial use if you do not use it as a derived software (ie a modified Scilab) or a composite software (ie Scilab included in another software).

              Donc tu peux effectivement le vendre, mais sans l'inclure dans autre chose, ni en le modifiant.
  • # R sous KDE : RKWard

    Posté par . Évalué à 4.

    Bonjour à tous !

    Je me permets de signaler que le projet RKWard propose une interface graphique à R sous KDE, avec coloration syntaxique, aide intégrée en HTML, système de plugins facile à utiliser, édition des tables visuelle, installation simplifiée de paquets.

    La version 0.3.3 va sortir sous peu : prenez la version CVS, qui est la future 0.3.3. La version 0.3.2 est disponible sur le site, mais vous manqueriez de nombreuses améliorations.

    Le site web est en cours de maintenances, avec un nouveau site qui arrive.

    Et n'oubliez pas : si RKWard vous est utile, n'ésitez pas à venir participer !

    http://rkward.sf.net(...)

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.