Sortie de R version 3.0.0

Posté par  . Édité par alpentux, Nÿco, claudex et Sylvestre Ledru. Modéré par Pierre Jarillon. Licence CC By‑SA.
Étiquettes :
32
4
avr.
2013
Science

Le projet R annonce la sortie de la version 3.0.0 du logiciel statistique du même nom (pre-release le 7 mars 2013, sortie officielle le 3 avril).

R désigne à la fois un langage de programmation et son interpréteur. Historiquement, R est un dialecte dérivé du langage S, implémenté dans le logiciel propriétaire S-PLUS. L'aventure R a débuté en 1993, mais c'est à partir des années 2000 qu'il a pris une importance majeure dans le paysage des langages destinés aux applications statistiques. R rivalise aujourd'hui avec ses concurrents SAS (Statistical Analysis System), SPSS (Statistical Package for the Social Sciences), ou STATA ; il est devenu incontournable dans certaines disciplines, notamment la biologie.

Le changement de version majeur (2.15.3 vers 3.0) ne signale pas une transition importante (voir le changelog), mais marque une évolution progressive (la version 2.0 date de 2004). La mise à jour requiert cependant une réinstallation complète.

R fonctionne de manière modulaire, avec un cœur relativement réduit, sur lequel peuvent se greffer des bibliothèques de fonctions fournies sous forme de « paquets ». R doit certainement une partie de son succès à l'activité de sa communauté, puisque plus de 4700 paquets activement maintenus sont disponibles au téléchargement sur le site officiel, sans compter les projets indépendants, comme bioconductor.

R est avant tout destiné au traitement et à l'analyse des données : tests statistiques, data mining, et production de graphiques de qualité (destinés à la publication). Le langage est de plus en plus utilisé pour produire des scripts portables, ou pour réaliser des simulations numériques (MCMC, typiquement). Réputé inefficace en tant que langage interprété, la possibilité de coder les fonctions critiques en C tout en utilisant la syntaxe « haut-niveau » de R ouvre une niche écologique significative pour le développement d'applications statistiques.

Forum général.cherche-logiciel Analyse statistiques de logs web

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
1
5
avr.
2013

Bonjour, un petit site confidentiel que j'administre vient de manger plus d'un millions de hits dans les 48h suivant la publications de certains articles, et devrait passer la barre du 1.5 million dans la soirée sachant qu'hier soir j'avais une fréquentation de 5 articles lus chaque 10 secondes (je ne parle pas des hits) et que ce soir ça continue avec 3 articles chaque 10 secondes (40 hits dans la même durée)…

Comme ledit site ne comptait que 3/4 pages (…)

Statistiques 2012 du site LinuxFr.org

Posté par  (site web personnel) . Édité par Florent Zara et Bruno Michel. Modéré par patrick_g. Licence CC By‑SA.
Étiquettes :
37
2
jan.
2013
LinuxFr.org

Ce début d'année est propice à un petit regard en arrière sur les douze derniers mois d'activité de LinuxFr.org ; bref l'occasion d'étudier l'évolution en termes de trafic web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d'utilisation des fonctionnalités du site, etc. Qu'est-ce qui a changé et comment durant 2012 ?

Le site rend accessible un grand nombre de statistiques (faites-vous plaisir si vous souhaitez vous plonger dedans, c'est fait pour) ; cette dépêche résume les variations constatées en 2012.

Toute l'équipe du site vous souhaite une bonne année 2013 libre, ouverte et net ! Happy hacking. Happy GNU year!

Journal Quelques chiffres

Posté par  . Licence CC By‑SA.
21
22
oct.
2012

Je me suis amusé (bon, j'ai d'autres passe-temps aussi) à établir un bref état des lieux concernant les distributions alternatives, et pour m'y aider, je me suis servi du moteur de recherche du site distrowatch (j'ai pas trouvé mieux pour faire cette note).

Voici donc quelques chiffres sur le recensement des distributions qui sont/ont été disponibles sur le site: cela donne un aperçu de ce qui se fait en dehors des systèmes propriétaires:

  • 732 distributions au total (tout état confondu)

Suivi — Statistiques Nouvelles stats pour la partie modération

#664 Posté par  (site web personnel, Mastodon) . État de l’entrée : corrigée. Assigné à Benoît Sibaud.
Étiquettes :
2
10
nov.
2011

Sur la page de statistiques de modération, dans la section "temps de modération", pourrait-on ajouter les deux entrées suivantes afin d'avoir une idée de l'impact des news soumises très en avance (genre sur le noyau de patrick_g) sur le temps de modération ?

Merci :)

Remise en ligne d'anciennes dépêches de 1999 et 2000

Posté par  (site web personnel) . Édité par Nÿco, Florent Zara, Bruno Michel et Nils Ratusznik. Modéré par claudex. Licence CC By‑SA.
42
2
mai
2012
LinuxFr.org

Il y a longtemps, lors d'une mise à jour du site (le passage au CMS daCode le 9 septembre 2000), les premières dépêches ne furent pas réimportées (cas de la tâche repoussée aux calendes grecques, ad kalendas graecas).

Les archéologues numériques du futur en étaient déjà désespérés par rétro-anticipation. Fort heureusement, il y a quelques mois, nous sommes retombés par hasard sur une archive de la liste de diffusion qui annonce quotidiennement les nouvelles dépêches.

Comme c'était pénible à faire, inutile et donc totalement indispensable, nous - Bruno et moi - les avons réimportées : 3 413 dépêches couvrant la période du 20 mai 1999 au 6 septembre 2000 (mise à jour : ainsi que 6 autres du 2 mars 1999 grâce à webarchive). Leurs éventuels commentaires sont par contre perdus.

Pour les consulter, aller voir les dépêches et demander à voir les dernières (lien « Dernier » en bas pour la pagination). Quelques titres choisis assez arbitrairement pour vous remettre dans l'époque : RedHat 6.0, Mandrake 7.0 (devenue Mandriva), Carte à puce: Roland Moreno (décédé il y a quelques jours) offre un million de francs, SSF le SSH français, PHP 4.0, le bug du 29 février 2000 (ça n'arriverait plus des choses comme ça…), le noyau 2.2.14, Blender 2.0, RSA dans le domaine public, WindowMaker 0.62.1, etc.

Sortie d'OpenTURNS 1.0

Posté par  . Édité par Benoît Sibaud et baud123. Modéré par patrick_g. Licence CC By‑SA.
Étiquettes :
21
19
avr.
2012
Science

OpenTURNS est une bibliothèque C++ libre dédiée aux statistiques et à la fiabilité, utilisable en langage Python et distribuée dans Debian.

Avec la version 1.0, elle propose la modélisation des processus stochastiques, et une meilleure compatibilité avec Python et le module Numpy.

Une petite démo en python pour voir ?

Avec ces quelques lignes je peux réaliser un lissage à noyaux sur un échantillon, réutiliser la distribution obtenue pour simuler une variable aléatoire X, que je donne à manger à une fonction réalisant un couplage pour obtenir une autre variable aléatoire Y, pour enfin évaluer la probabilité de défaillance P(Y>0.1) par un simple MonteCarlo.

from openturns import *
data = NumericalSample.ImportFromCSVFile("meteo.csv")
distribution = KernelSmoothing(Epanechnikov()).build(data)
X = RandomVector(distribution)
model = NumericalMathFunction("ageing")
Y = RandomVector(model, X)
algorithm = MonteCarlo(Event(Y, Greater(), 0.1))
algorithm.setMaximumOuterSampling(int(1e6))
algorithm.run()
print "P(Y>0.1)=", algorithm.getResult().getEventProbability()

Journal Une alternative au TIOBE

Posté par  (site web personnel, Mastodon) .
Étiquettes :
12
2
avr.
2012

Ça faisait longtemps que j'avais pas fait un petit journal bookmark.
Beaucoup d'entre vous connaissent déjà certainement le site de TIOBE Software qui fournit des statistiques sur l'utilisation des langages informatiques, je souhaite faire partager cette alternative.
Quel intérêt me direz-vous ? L'intérêt est que le code source de lang-index est libre et donc que l'algo de création de l'index vérifiable par tout un chacun.

Antepedia, base de données des projets Open Source

20
7
mar.
2012
Communauté

Le moteur de recherche de Google dédié au code Open Source, Code Search, a été arrêté le 12 janvier dernier. Il existe un certain nombre d'alternatives, comme Koders, krugle ou encore Search[code], mais une nouvelle base de données commence à se faire connaître et n'a pas encore été abordée dans les colonnes de LinuxFr.org : Antepedia.

Antepedia se revendique comme la plus grande base de données de composants Open Source. Elle annonce actuellement plus de 221 millions de fichiers référencés provenant de 940 000 projets et être en constante augmentation. En comparaison, Ohloh, une autre base de projets (dont la finalité n'est pas similaire) rachetée récemment par Black Duck Software, un compétiteur, revendique plus de 500 000 projets « seulement ».

Logo Antepedia

NdM : Un grand merci à olivierweb, Lebas Sébastien, Nÿco et Yves Bourguignon pour leur participation à la rédaction de cette dépêche.

Conférence JDL jeudi 15 mars 2012 : R pour tous ?

Posté par  (site web personnel) . Édité par baud123, claudex et Benoît Sibaud. Modéré par baud123. Licence CC By‑SA.
7
6
mar.
2012
Communauté

Ce jeudi 15 mars 2012 à 19h se déroulera la septième séance montoise des Jeudis du Libre de Belgique.

Le sujet de cette séance : R pour tous ? Comment l’Open Source a transformé un logiciel statistique pointu en un outil d’analyse largement utilisable par (quasiment) tout le monde

Thématique : Traitement des données

Public : étudiants et chercheurs (tout domaine) – Analystes-programmeurs

L’animateur conférencier : Prof. Philippe Grosjean (UMONS, Ecologie numérique des Milieux aquatiques)

Lieu de cette séance : Catégorie technique (ISIMs) de la Haute Ecole de la communauté française en Hainaut, Avenue V. Maistriau, 8a, Salle Académique, 2e bâtiment (cf. le plan sur le site de l’ISIMs)

La participation sera gratuite et ne nécessitera que votre inscription nominative, de préférence préalable, ou à l’entrée de la séance. Merci d’indiquer votre intention (même incertaine) en vous inscrivant via la page http://jdl-mons-2012-mars.eventbrite.com/

Cette séance sera suivie d’un verre de l’amitié, offert par la catégorie technique de la Haute Ecole de la communauté française en Hainaut (HEH).

Si vous êtes intéressé(e) par ce cycle mensuel, n’hésitez pas à consulter l’agenda et à vous inscrire sur la liste de diffusion afin de recevoir systématiquement les annonces, ou à nous contacter.

Pour rappel, les Jeudis du Libre se veulent des rencontres autour de thématiques des Logiciels Libres. Les rencontres montoises se déroulent chaque troisième jeudi du mois, et sont organisées dans des locaux et en collaboration avec des Hautes Écoles et Facultés Universitaires du Pôle Hainuyer d’enseignement supérieur impliquées dans les formations d’informaticiens (UMONS, HECFH et Condorcet), et avec le concours de l’A.S.B.L. LoLiGrUB, active dans la promotion des logiciels libres.

Journal Le traffic sur Internet en ce moment même.

Posté par  (site web personnel) .
Étiquettes :
16
13
jan.
2012

"Internet Traffic Report" nous donne des chiffres bien étranges pour le trafic mondial sur internet depuis quelques temps. Jugez plutôt :

Index de traffic global (30 derniers jours)

Index de temps de réponse (30 derniers jours)

Index des paquets perdus (30 derniers jours)

  • Défaillances massives ?
  • SOPA qui attaque depuis le futur ?
  • Megaupload et Youtube en grêve générale ?
  • Le p2p se meurt sous les coups de Deep packet inspection ?

Mais que se passe t il ?

La famille des *GPL relativement moins présente parmi les licences libres

Posté par  (site web personnel) . Édité par Benoît Sibaud, Florent Zara et baud123. Modéré par baud123. Licence CC By‑SA.
23
6
jan.
2012
Communauté

L'utilisation de la licence GPL/LGPL/AGPL serait en déclin relatif par rapport aux autres licences libres (MIT, BSD, Apache, etc.). Le 451 CAOS Theory blog (du 451 Group) en a fait le constat via un article de Matthew Aslett « On the continuing decline of the GPL » (Sur le déclin continu de la GPL). Cet article est illustré par un graphe simple, en seconde partie de cette dépêche.

En résumé, la « famille » GPL serait passée relativement de 70 % à 50 % en proportion (par une croissance absolue de 15 % alors que le logiciel libre en général aurait progressé de 117 %).

Attention, ce ne sont que des chiffres, donc à prendre avec des pincettes. Il faut analyser et challenger les méthodes de collecte avant d'expliquer et d'en tirer des conclusions trop hâtives. Une lecture attentive de cet article et le suivi des liens permet effectivement de relativiser.

Journal [BookMark] 2012 sera synonyme de Linux \o/

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
11
6
jan.
2012

Ça y'est cette année c'est la bonne, 2010, 2011, 2012 sera l'année de Linux sur desktop pour le GRAND publique!

Anéfé, Netmarketshare, une des nombreuses société de statistique sur les technologies de l'internet à sorti ces chiffres pour l'année 2011.
Les plus perspicaces d'entre vous, aurons directement remarqué que dès septembre 2011, où linusc était bloqué autour des 1,00%,
la part de marché grimpe de manière Fulgurante pour atteindre un colossal 1.41% !

Oui oui, linux (…)