Prédire la note d’un journal sur LinuxFr.org

126
9
juin
2017
LinuxFr.org

Cette dépêche traite de l’exploration de données sur des données issues de LinuxFr.org.

Ayant découvert récemment scikit-learn, une bibliothèque Python d’apprentissage statistique (machine learning). Je voulais partager ici un début d’analyse sur des contenus issus de LinuxFr.org.

Avertissement : je ne suis pas programmeur, ni statisticien. Je ne maîtrise pas encore tous les arcanes de scikit-learn et de nombreux éléments théoriques m’échappent encore. Je pense néanmoins que les éléments présentés ici pourront en intéresser plus d’un(e).

Tous les scripts sont codés en Python et l’analyse à proprement parler a été réalisée à l’aide d’un notebook Jupyter. Un dépôt contenant les données et les scripts est disponible sur GitLab.

Journal Dans la série ; les LL m'impressionnent : la fouilles de données

Posté par . Licence CC by-sa
34
19
mai
2011

La manipulation des données via tableurs, tout le monde connait. Le data mining ou fouille de données beaucoup moins.

La page data mining de wikipédia

Lorsque l'on dispose de jeux de données importants en terme de taille et difficilement lisibles, l'utilisation des tableurs n'est plus appropriée. Les logiciels de fouilles de données entrent alors en action. Ils existent des solutions propriétaires performantes mais assez peu nombreuses (Clémentine SPSS, Statitica, SAS...). Des solutions libres très performantes existent également mais elles n'ont (...)

Journal Watson, Jeopardy et le test de Turing

Posté par (page perso) .
35
17
jan.
2011
Vous connaissez tous le jeu Jeopardy qui passe sur les télévisions de plusieurs pays. En gros les candidats gagnent de l'argent en répondant à des questions. Mouaif pas très nouveau tout ça.
Le seul truc un peu original c'est qu'en fait l'interrogateur donne la réponse et que c'est au candidat de reconstituer la question.
Exemple: Si l'interrogateur vous dit "LinuxFR" vous devez répondre "Quel est le site francophone qui rassemble le plus de trolleurs"....ou un truc de ce style.

C'est (...)