Suivi — API OAuth Export du site

#2027 Posté par  (site web personnel) . État de l’entrée : ouverte. Licence CC By‑SA.
Étiquettes : aucune
0
6
mar.
2022

Demande reçue par courriel (reformulée) et évoquée en AG 2019/2020 :

Dans le cadre d'une analyse sur les contenus du site de récupérer l'ensemble des données de LinuxFr.org ? (Posts, Journaux, Commentaires, Profils publics…) et si oui, quel serait le meilleur moyen.

Certaines personnes font des choses intéressantes avec l'API de Hacker News qui est décrite ici: https://github.com/HackerNews/API et qui permet d'accéder à tous les
contenus postés (posts, commentaires, etc.) ainsi qu'à la partie publique des profils utilisateurs.

Concrètement, réaliser un export (concernant les données privées, elles pourraient être retirées avant export) et ensuite se servir de l'API LinuxFr.org pour mettre à jour le contenu. Cependant, l'API LinuxFR décrite ici https://linuxfr.org/developpeur est plutôt focalisée sur les actions (créer du contenu) plutôt que la consultation.

Donc deux questions :

  1. Est-il possible de lui mettre à dispo un export expurgé des données non publiques ?
  2. l'API permet-elle plus de choses en consultation ?

Pistes de réponses :

  • légalement parlant, on doit prendre en compte
    • les données personnelles : nom / adresses même si elles ont été fournies et prévues pour l'affichage sur le site
    • le droit d'auteur : les éventuelles licences applicables sur contenus et commentaires (et comme il faut les noms des auteurs / contributeurs, on en revient aussi au point précédent)
    • le droit sui generis des bases de données ? (c'est plutôt dans le cas où quelqu'un collecterait à notre insu notre base de données…)
    • l'usage prévu/annoncé des données gérées par le site
  • techniquement : ça reste à coder…
  • veut-on le faire ? (ie. ce n'est pas parce que c'est légal et techniquement possible qu'on veut le faire)

Envoyer un commentaire

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.