Sortie de GNU PSPP 0.8.0

Posté par  . Édité par NeoX. Modéré par tuiu pol. Licence CC By‑SA.
Étiquettes :
27
30
juil.
2013
GNU

GNU PSPP est un logiciel d'analyses statistiques d'échantillons de données. Il s'agit d'un remplaçant du logiciel privateur SPSS. Un des objectifs de PSPP est d'être compatible avec le langage SPSS, les fonctionnalités actuellement incluses sont :

  • une mise en forme de haute qualité ;
  • une interface graphique simple à utiliser
  • une interface en ligne de commande qui permet aux utilisateurs occasionnels de rapidement faire des analyses ;
  • une sélection complète de commandes de traitement, analyse et visualisation des données ;
  • une portabilité vers un très large panel de plateformes.

La version 0.8.0 est sortie le 23 juillet, apportant son lot de nouveautés qui sont décrites dans la seconde partie de la dépêche.

Statistiques 2022 du site LinuxFr.org

Posté par  (site web personnel) . Édité par nud, Florent Zara et Xavier Teyssier. Modéré par patrick_g. Licence CC By‑SA.
Étiquettes :
24
3
jan.
2023
LinuxFr.org

2022 a été une année calme, plate, atone, apaisée et pondérée, et il ne s’est rien passé d’important. C’est évidemment faux, mais bon il faut bien une introduction à cette dépêche. Quid de l’activité du site LinuxFr.org en 2022 ? Quels changements en termes de trafic Web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d’utilisation des fonctionnalités du site, de contribution au code, etc. Bref, qu’est‐ce qui a changé et de quelle manière durant 2022 ?

Le site rend accessible un grand nombre de statistiques (faites‑vous plaisir si vous souhaitez vous plonger dedans, c’est fait pour) ; cette dépêche résume les variations constatées en 2022.

Décès de Leland Wilkinson, « parrain » du paquet ggplot2 de R

Posté par  (Mastodon) . Édité par Ysabeau 🧶, vmagnin et Benoît Sibaud. Modéré par Julien Jorge. Licence CC By‑SA.
23
20
déc.
2021
Communauté

Leland Wilkinson était un chercheur américain ayant contribué à la discipline de la visualisation des données. Il est l’auteur du livre Grammar of Graphics en 1999, et a notamment aidé un des cocréateurs du paquet ggplot2 de R à en faire son implémentation. Son décès a été annoncé le 13 décembre 2021 sur le blog spécialisé Flowing Data.

La famille des *GPL relativement moins présente parmi les licences libres

Posté par  (site web personnel) . Édité par Benoît Sibaud, Florent Zara et baud123. Modéré par baud123. Licence CC By‑SA.
23
6
jan.
2012
Communauté

L'utilisation de la licence GPL/LGPL/AGPL serait en déclin relatif par rapport aux autres licences libres (MIT, BSD, Apache, etc.). Le 451 CAOS Theory blog (du 451 Group) en a fait le constat via un article de Matthew Aslett « On the continuing decline of the GPL » (Sur le déclin continu de la GPL). Cet article est illustré par un graphe simple, en seconde partie de cette dépêche.

En résumé, la « famille » GPL serait passée relativement de 70 % à 50 % en proportion (par une croissance absolue de 15 % alors que le logiciel libre en général aurait progressé de 117 %).

Attention, ce ne sont que des chiffres, donc à prendre avec des pincettes. Il faut analyser et challenger les méthodes de collecte avant d'expliquer et d'en tirer des conclusions trop hâtives. Une lecture attentive de cet article et le suivi des liens permet effectivement de relativiser.

Statistiques 2023 du site LinuxFr.org

Posté par  (site web personnel) . Édité par Ysabeau 🧶. Modéré par Ysabeau 🧶. Licence CC By‑SA.
Étiquettes :
23
2
jan.
2024
LinuxFr.org

2023 a été une année de taille moyenne, par rapport à 2024. Cela n’a évidemment pas grande pertinence, mais bon il faut bien une introduction à cette dépêche. Quid de l’activité du site LinuxFr.org en 2023 ? Quels changements en termes de trafic Web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d’utilisation des fonctionnalités du site, de contribution au code, etc. Bref, qu’est‐ce qui a changé et de quelle manière durant 2023 ?

Le site rend accessible un grand nombre de statistiques (faites‑vous plaisir si vous souhaitez vous plonger dedans, c’est fait pour) ; cette dépêche résume les variations constatées en 2023.

Statistiques / fiabilité : sortie d’OpenTURNS 0.14.0

Posté par  . Modéré par patrick_g. Licence CC By‑SA.
22
22
juin
2011
Science

OpenTURNS est une bibliothèque libre dédiée aux statistiques et à la fiabilité, utilisable en langage Python et distribuée dans Debian.

Elle peut être considérée comme une alternative plus moderne au language R (des algorithmes très récents sont mis en œuvre pour le calcul de certains quantiles, par exemple), même si la partie « statistiques » n’est limitée qu’à une gestion de la partie « fiabilité », et orientée objet. Sur la partie purement statistique, on retrouve donc les outils classiques : estimation de distribution, corrélations, analyse de sensibilité, tests statistiques, estimation par noyau, … Mais en introduisant la notion originale de copules qui permettent de modéliser la dépendance.

Pour la partie fiabilité, là aussi, on retrouve des algorithmes classiques, propagation par carré latin, séquences quasi‐aléatoires, simulations directionnelles, FORM / SORM (First / Second Order Reliability Method), calcul de facteurs d’importance, des surfaces de réponses par chaos polynomial, … Cette fois‐ci, l’aspect novateur réside dans le fait que la bibliothèque fait le plus possible de calculs analytiques en imposant un modèle de données basé sur les distributions et non les échantillons, comme le font certains autres outils (NumPy, R).

Dans sa version 0.14.0, elle propose de nouvelles lois de distribution, une interface Python plus souple, une simplification du mécanisme de couplage à des codes externes, la différentiation automatique des formules analytiques, du multithreading et une infrastructure [[CMake]].

e-venement v2.6 "Breizh Hydromel", la billetterie informatique qui fait bien plus que ça...

Posté par  (site web personnel) . Édité par ZeroHeure, NeoX, Benoît Sibaud et claudex. Modéré par claudex. Licence CC By‑SA.
22
19
nov.
2013
Culture

Depuis juin dernier, les changements sont majeurs autour d'e-venement… Nouvelles méthodes de travail et de gestion de projet, refonte des outils de communication, ouverture d'un site web communautaire, arrivée de fonctionnalités révolutionnaires (données accessibles depuis n'importe quel terminal dont les téléphones, gestion de réservation de ressources, …) mais en douceur…

Pour rappel, e-venement est un logiciel libre (GNU/GPL) de billetterie informatique, de gestion des relations aux publics (CRM), de gestion événementiel et de réservation de ressources, d'aide à la comptabilité, et de statistiques orienté vers les structures organisatrices d'événement (spectacle vivant en particulier), vers les musées, les cinémas, les équipements sportifs, les équipements de loisirs. C'est une application web développée en PHP sur Symfony et Doctrine, s'appuyant sur Apache, PostgreSQL et beaucoup d'autres outils et bibliothèques sous licences libres. E-venement est développé par Libre Informatique.

Plus de détails sur les nouveautés en seconde partie de dépêche.

Sortie d'OpenTURNS 1.0

Posté par  . Édité par Benoît Sibaud et baud123. Modéré par patrick_g. Licence CC By‑SA.
Étiquettes :
21
19
avr.
2012
Science

OpenTURNS est une bibliothèque C++ libre dédiée aux statistiques et à la fiabilité, utilisable en langage Python et distribuée dans Debian.

Avec la version 1.0, elle propose la modélisation des processus stochastiques, et une meilleure compatibilité avec Python et le module Numpy.

Une petite démo en python pour voir ?

Avec ces quelques lignes je peux réaliser un lissage à noyaux sur un échantillon, réutiliser la distribution obtenue pour simuler une variable aléatoire X, que je donne à manger à une fonction réalisant un couplage pour obtenir une autre variable aléatoire Y, pour enfin évaluer la probabilité de défaillance P(Y>0.1) par un simple MonteCarlo.

from openturns import *
data = NumericalSample.ImportFromCSVFile("meteo.csv")
distribution = KernelSmoothing(Epanechnikov()).build(data)
X = RandomVector(distribution)
model = NumericalMathFunction("ageing")
Y = RandomVector(model, X)
algorithm = MonteCarlo(Event(Y, Greater(), 0.1))
algorithm.setMaximumOuterSampling(int(1e6))
algorithm.run()
print "P(Y>0.1)=", algorithm.getResult().getEventProbability()

Journal DLFP journalyser 2.0 : pas de veille techologique le weekend

Posté par  (courriel, site web personnel) . Licence CC By‑SA.
21
9
nov.
2013

Depuis bien longtemps, la question que tout le monde se pose a été « quelle est le meilleur jour pour poster un journal ? ». Grâce à la Technologie, cette question n'en n'est plus une.

En reprenant le vieux journals.pl [0] qui sert à tout, un poil de shell/awk et les journaux compris entre le 14/10/02 et 11/11/12 que j'avais déjà récupérés l'autre fois, on obtient un truc ainsi :

$ ./journals.pl  journals/* | while read score comments time url ;do echo
(…)

Journal Quelques chiffres

Posté par  . Licence CC By‑SA.
21
22
oct.
2012

Je me suis amusé (bon, j'ai d'autres passe-temps aussi) à établir un bref état des lieux concernant les distributions alternatives, et pour m'y aider, je me suis servi du moteur de recherche du site distrowatch (j'ai pas trouvé mieux pour faire cette note).

Voici donc quelques chiffres sur le recensement des distributions qui sont/ont été disponibles sur le site: cela donne un aperçu de ce qui se fait en dehors des systèmes propriétaires:

  • 732 distributions au total (tout état confondu)

Journal Repostat, générer des statistiques sur un dépôt Git

Posté par  (site web personnel, Mastodon) . Licence CC By‑SA.
Étiquettes :
21
7
déc.
2020

Bonjour Nal,

Je l'avais mentionné dans une dépêche à propos de Haiku, mais cet outil mérite au moins son propre journal.

Donc au départ, il y a Gitstats. C'était un outil simple en Python pour générer quelques pages HTML montrant l'activité d'un projet Git: nombre de commits par mois, contributeurs les plus actifs, etc. C'est du Python2, tout est en vrac dans un seul fichier, ça génère du vieux HTML, et surtout, ça n'est plus maintenu depuis 5 ans.

(…)

Antepedia, base de données des projets Open Source

20
7
mar.
2012
Communauté

Le moteur de recherche de Google dédié au code Open Source, Code Search, a été arrêté le 12 janvier dernier. Il existe un certain nombre d'alternatives, comme Koders, krugle ou encore Search[code], mais une nouvelle base de données commence à se faire connaître et n'a pas encore été abordée dans les colonnes de LinuxFr.org : Antepedia.

Antepedia se revendique comme la plus grande base de données de composants Open Source. Elle annonce actuellement plus de 221 millions de fichiers référencés provenant de 940 000 projets et être en constante augmentation. En comparaison, Ohloh, une autre base de projets (dont la finalité n'est pas similaire) rachetée récemment par Black Duck Software, un compétiteur, revendique plus de 500 000 projets « seulement ».

Logo Antepedia

NdM : Un grand merci à olivierweb, Lebas Sébastien, Nÿco et Yves Bourguignon pour leur participation à la rédaction de cette dépêche.

Journal Préparation de figures avec R : automatiser l'ajout d'annotations manuelles

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
17
18
sept.
2021

R est un outil libre destiné aux statistiques utilisé pour l'analyse de données et la production de figures scientifiques. Une bonne reproductibilité des résultats peut être obtenue en utilisant des scripts R et un logiciel de gestion de version comme Git. Néanmoins, il est parfois pratique d'ajouter quelques annotations à la main sur une figure, ce qui va à l'encontre de la reproductibilité désirée.

Ce journal présente une approche permettant d'incorporer ces annotations manuelles dans une figure de manière (…)

Journal Le traffic sur Internet en ce moment même.

Posté par  .
Étiquettes :
16
13
jan.
2012

"Internet Traffic Report" nous donne des chiffres bien étranges pour le trafic mondial sur internet depuis quelques temps. Jugez plutôt :

Index de traffic global (30 derniers jours)

Index de temps de réponse (30 derniers jours)

Index des paquets perdus (30 derniers jours)

  • Défaillances massives ?
  • SOPA qui attaque depuis le futur ?
  • Megaupload et Youtube en grêve générale ?
  • Le p2p se meurt sous les coups de Deep packet inspection ?

Mais que se passe t il ?