Je ne prends pas souvent ma plume de journaliste, mais cette fois-ci je m'attaque à un sujet sacrément trapu : une proposition de définition d'un service ouvert (rien que ça…).
Il est très courant de voir dans les communautés de logiciels libres des gens amalgamant les notions de logiciel libre avec un service. Par exemple en considérant qu'un service qui fonctionne avec du logiciel libre c'est « bien ». Hors le fait qu'un service fonctionne avec du logiciel libre n'apporte aucune liberté ni garantie à l'utilisateur.
C'est pour ça qu'au fil du temps, je me suis mis à chercher les critères de qualité d'un service.
Note : ma définition est largement incomplète et je ne doute pas que vous saurez me le faire savoir. Il s'agit, au mieux, d'une ébauche, au pire, juste d'une pensée se voulant constructive.
La définition
Un service
Un service est une application que l'on utilise activement sans pour autant qu'elle soit exécutée sur une machine à laquelle l'utilisateur a accès. Ainsi il est à noter que par exemple si j'installe une application A en auto-hébergé chez moi, il ne s'agira pas d'un service pour moi, mais que ce sera un service pour l'ami a qui je propose l'accès mais qui est à 800km de chez moi.
Cette distinction est importante car à partir du moment où l'on a un accès à la machine qui exécute le code, c'est la notion de logiciel libre qui va primer (il n'y a pas de différence fondamentale entre la machine actuellement sur mes genoux et mon serveur privé chez OVH). En effet la différence importante entre un service et un logiciel consiste au fait que l'on ne maîtrise pas l'exécution d'un service.
Un service ouvert
Un service ouvert est un service qui ne va pas enfermer les données de l'utilisateur. Puisqu'il est impossible d'avoir la moindre garantie ni le moindre contrôle sur un service, la chose la plus importante consiste à garder un certain contrôle sur vos données. AMHA il y a plusieurs niveaux de libération des données :
- Pas de libération. Le service est une vitrine et il est impossible ou extrêmement difficile d'en extraire vos données.
- Niveau 1 : le service fonctionne grâce à un logiciel installable chez vous et il vous donne accès à la version brute de ses données. Cette libération est utile mais extrêmement limité car elle contraint à garder toujours le même logiciel.
- Niveau 2 : le service fournit les données dans un format lisible. Il permet l'export des données dans un format XML, JSON, YAML, … dont la structure est facile à manipuler pour un développeur. Ce niveau facilite l'utilisation d'un logiciel tiers mais demande un travail potentiellement conséquent pour effectuer la migration.
- Niveau 3 : le service fournit les données dans un format commun. C'est un format commun avec une panoplie d'autre logiciels, voir un standard de fait. L'import est très simple.
- Niveau 3' : le service fournit les données dans un format standard défini par un organisme reconnu.
Limites
Cette définition n'aborde qu'une facette des services : la libération des données. Il reste des points toujours impossibles de maîtriser (la garantie que les données ne sont pas revendues sous leur forme originelle ou non par exemple).
J'espère que cette définition en aura fait réfléchir et que vous aurez pleins de remarques pertinentes dessus.
# SaaS
Posté par BAud (site web personnel) . Évalué à 5. Dernière modification le 18 février 2016 à 00:09.
Tu parles de SaaS : tu n'achètes que le service, ça a un coût :-)
C'est généralement de la boîte noire et contrairement à du logiciel propriétaire (que tu peux décompiler sur ton poste et faire de la rétro-ingénierie à des fins d'interopérabilité, en ce qui reste vaste, tant que tu restes dans la légalité, en Europe notamment, heureusement).
Franchement, relire ou revoir les conf' de Benjamin Bayart aident à comprendre l'autonomie minimale nécessaire pour survivre :
Il y a le PaaS/DIY dont j'ai parlé auparavant pour lequel le logiciel libre, les formats ouverts et l'accès facilitent les choses, ce que le SaaS complique par nature (pas tout le temps, mais par défaut c'est boîte noire, pas boîte grise et quand c'est boîte blanche il reste toujours un truc de plus qui était resté en boîte grise…).
Cela bat en brèche tes niveaux dont je suis peu convaincu… désolé.
[^] # Re: SaaS
Posté par barmic . Évalué à 4.
Oui je le dis clairement. Il est question des github, trello, pastebin, gmail,… C'est ce qui est largement le plus utilisé.
OSEF ce que je veux c'est pouvoir utiliser mes données que ce soit avec le même logiciel ou un autre. Ça n'a rien de subtile. Ça veut dire que ce n'est pas si grave si le logiciel du service n'est pas en AGPL (parce que même en AGPL je n'ai aucun contrôle dessus), mais aussi que si le service est fourni par un système hadoop très sophistiqué je peux espérer m'en servir avec quelque chose de plus simple. Quand on parle de service la licence est un leurre.
Non c'est impossible. Ce que tu peux vérifier c'est qu'à un moment donné tu as accès à tes données et que tu peux les manipuler.
Ce n'est pas au pire c'est la seule chose que tu peux avoir.
Ça ne veux tout et rien dire. Je te file du XML c'est un format ouvert. C'est pas pour ça que c'est bien. Pourtant beaucoup de gens gueule contre les docx etc.
Je suis tout à fait d'accord. Je pense juste pas le sujet :)
Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)
# Coincidence
Posté par El Titi . Évalué à 3. Dernière modification le 18 février 2016 à 00:38.
Amusant que tu postes ce journal après ta réponse à une remarque:
http://linuxfr.org/news/weboob-une-version-1-1-pour-son-sixieme-anniversaire#comment-1644006.
Je permets de corriger une erreur de grammaire qui ne semble pas fortuite puisque tu l'as commise 2 fois
je ne doute pas que vous saur~~ais~~ez me le faire savoir
et que vous aur~~ait~~ez pleins de remarques
Sinon sur le fond:
Pour les données, il y a un aspect que ton analyse ne couvre pas, c'est le crowdsourcing.
Récupérer tes données n'enlèvera pas le fait qu'une partie de la valeur de celles-ci peut aussi provenir du fait qu'elles sont enrichies par le croisement de tes données avec celle des autres (exemple suggestions de tag sur delicious).
L'autre aspect le relie aux logiciels libre car l'ouverture des données doit venir en sus.
Un service ouvert outre tes données se doit aussi de fournir l'infrastructure logicielle qui permet d'héberger tes données sous une forme "libre" (type AGPL par exemple)
C'est le niveau 4
Selon "ma" conception (et elle n'engage que moi), un service ouvert idéal, le niveau 5, serait un service qui peut être distribué (données réparties ou répliquées) et hébergé sur plateforme libre
3 composantes donc:
Données accessibles + LL + collaboratif
Yacy en serait un bon exemple:
http://yacy.net/fr/
Ceci représente une vraie liberté:
Celle de ne pas dépendre d'un fournisseur de service unique
Ok, vu le succès rencontré, l'exemple n'est peut-être pas le bon mais l'idée est bien là.
[^] # Re: Coincidence
Posté par Benoît Sibaud (site web personnel) . Évalué à 3.
Corrigé, merci.
# données
Posté par raspbeguy (site web personnel, Mastodon) . Évalué à 1.
Je ne suis pas tout à fait d'accord avec ta définition de service libre. En effet, je ne pense pas qu'une telle définition puisse concerner uniquement les données. À moins que je me trompe sur ta définition de "récupérer ses données"…
Selon ta définition, Dropbox est un service ouvert car l'utilisateur peut (c'est même l'unique fonctionnalité du service) récupérer ses données dans le format qu'il lui a donné.
De même, le pouvoir de récupérer ses données (au sens où je le comprends) ne garantis pas la liberté de l'utilisateur. Autre exemple, Facebook, qui propose à ses utilisateurs de récupérer une archive de ses données. Comme tu le dis toi même, ça n'empêche pas le service de les revendre au plus offrant…
D'autre part je ne comprends pas la différence entre ton niveau 2 et ton niveau 3. D'aucuns considèrent que le format XML est un format commun, et c'est bien le cas.
À mon avis, le fait de "récupérer ses données" ne doit pas rentrer en compte, car la quasi totalité des services informatiques est basée sur l'interaction de ces données avec les utilisateurs qui les fournissent. Je pense qu'il faudrait à la place mettre en avant des notions de transparence de fonctionnement du service ou encore le "zero-knowledge", par exemple un service qui accepte un chiffrement de bout en bout des données pour assurer que lui même ne puisse pas les lire et les exploiter.
Finalement, je pense que la notion de logiciel libre n'est pas à bannir pour un service. Pour moi, un service ouvert est également un service qui met à disposition son code source pour essaimer (comme se plaît à raison à le dire Framasoft) les services.
Un gentil du net
[^] # Re: données
Posté par Nitchevo (site web personnel) . Évalué à 3.
C'est sans doute une bonne idée, mais, contrairement à un logiciel que tu compiles, installes, sur une machine que tu contrôle, tu n'auras jamais l'assurance que le code du service est bien celui que l'on te montre et donc que le service fonctionne bien comme tu le crois.
Cela signifie qu'accepter d'utiliser un service web implique que tu fasses confiance au fournisseur du service et donc que celui-ci puisse trahir cette confiance.
[^] # Re: données
Posté par Nicolas Boulay (site web personnel) . Évalué à 2.
Les députés parlent souvent du concept de loyauté des plateformes. Un peu comme les banques qui ont interdictions de revendre les données qu'ils ont sur leurs clients (genre paiement des cartes de paiement).
"La première sécurité est la liberté"
[^] # Re: données
Posté par Zenitram (site web personnel) . Évalué à -2. Dernière modification le 18 février 2016 à 13:30.
Tu as la garantie, hors confiance, que Debian ou tout autre distro te fournit un binaire correspond au source? Non (car c'est non reproductible, pour le moment, même si Debian travaille sur la reproductibilité). Ben la c'est pareil, il faut avoir confiance.
Aucune différence avec ce que tu utilises déjà en libre.
Quelle différence?
tu peux faire pareil avec le service, du moment où tu as le source (AGPL par exemple).
[^] # Re: données
Posté par barmic . Évalué à 4.
C'est un détail, tu peut utiliser une distribution source comme gentoo.
Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)
[^] # Re: données
Posté par raspbeguy (site web personnel, Mastodon) . Évalué à 3.
Pour le zero-knowledge, tu peu t'en assurer, vu que c'est toi qui chiffres ton contenu avant de l'envoyer. C'est le principe du chiffrement end-to-end. Après ça peut réduire les fonctionnalités possibles pour le service en question…
Un gentil du net
[^] # Re: données
Posté par ckiller . Évalué à 4.
Je me permet d'ajouter une incise à ta réflexion.
La notion de données personnelles mérite d'être plus correctement défini. Ou s’arrête la notion de données personnelles ?
Est-ce que cela se limite aux données brutes des utilisateurs qui ont été volontairement apportées au service (photo, message…). Doit-on inclure l'ensemble des données personnelles récoltées et utilisées parfois plus insidieusement (les heures et lieux de connexion, les historiques de navigation, les j'aime…).
Nous savons aussi que ces services ont de puissants algorithmes de classification et d’analyse – que les profils sont analysés sous des dizaines d’angles – que l’ensemble de ces données sont enrichies par le résultat de ces algorithmes. Ces algorithmes et les moyens de mises en œuvre sont le capital et qui font la valeur de ces entreprises et surement pas le service initial.
Mais il n'empêche pas que les résultats restent associés à ton profil, donc restent des données personnelles. Et à ce titre, doivent-ils être transmis à l’utilisateur lorsque celui-ci veut quitter le service ?
L’usage qui me semble le plus fréquent — c'est le meilleur des cas — est que le service te recrache dans un gros zip qui contient tes photos et messages. Mais que cela est la partie visible de l’iceberg ; et ne représente qu’un sous-ensemble de ce que sont des données personnelles et nominatives.
[^] # Re: données
Posté par raspbeguy (site web personnel, Mastodon) . Évalué à 0.
J'approuve. Pour un service qui fait du big data, il est impossible de recracher toutes les métadonnées générées, les associations/liens dans la BDD, les statistiques de profilage, la liste des lots contenant ces informations achetés par des entreprises de big data…
Un gentil du net
[^] # Re: données
Posté par ckiller . Évalué à 3.
Il y a une différence entre fournir un XML avec un schéma propriétaire et fournir un XML connu et partagé par d'autres acteurs du marché. Le cout de récupération et de transfert des données est bien plus faible dans le second cas.
[^] # Re: données
Posté par barmic . Évalué à 4.
Très bon exemple ! C'est un service qui ne t'enferme pas. Tu peux choisir de passer à autre chose sans la moindre difficulté.
Quelle liberté ? Quand il s'agit d'un service la seule liberté qu'il est possible de garantir c'est celle de partir quand bon lui semble.
Que tu ne peux que difficilement réutiliser.
Parce que les formats se définissent eux même sur plusieurs niveaux. Il faut définir l'encodage de caractère, le format des dates, un format de fichier type XML/JSON/… et puis il faut spécifier ce dernier pour le besoin que tu as. Pour créer le standard ODT, ils ne se sont pas contenté d'affirmer que c'est du XML, ils ont décrit comment ils utilisent XML.
Pour moi c'est de la poudre aux yeux. Tu n'a aucun moyen de vérifier que le code fourni et le code qui tourne sur leur serveur est le même.
Pour moi on est passé d'un monde où la valeur est dans le logiciel à un monde où elle est dans les données.
J'aime beaucoup tes exemple qui montrent un grand défaut de beaucoup de logiciels libres : l’absence de volonté de libérer les données. On considère que tu données l'accès à la base est suffisant hors c'est faux. Tout ceux qui ont utilisé plusieurs logiciels de gestion de photos doivent comprendre de quoi je parle.
Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)
# Une autre définition ?
Posté par Ytterbium . Évalué à 1. Dernière modification le 18 février 2016 à 15:54.
Pour moi, un service libre est un service dont on peut choisir l'hébergeur et en changer. Ainsi, si on ne fait plus confiance à son hébergeur, si celui-ci ferme le service ou toute autre raison, il y a la possibilité de migrer totalement le service.
Cela implique évidement de pouvoir récupérer ses données dans un format exploitable, mais aussi que le logiciel utilisé par le service soit libre, pour que n'importe que n'importe qui, y compris soi-même puisse devenir un hébergeur.
On pourrait peut-être presque modifier les 4 libertés :
[^] # Re: Une autre définition ?
Posté par barmic . Évalué à 3.
Pour reprendre l'exemple du dessus. Tu peux très bien récupérer toutes tes données de ton compte Dropbox et héberger ton owncloud. C'est une utile, mais ça n'est pas nécessaire de l'autre coté, je peux monter une service à partir d'un cluster hadoop/spark/whatever qui t'empêchera de monter le même service soit par manque de compétence soit parce que ça va te demander une infrastructure trop chère.
Ce qui me semble important c'est de comprendre que dès que tu as un service, tu n'a plus rien aucune garantie de quoi que ce soit (tes données ? elles étaient exportables hier, mais elles ne le sont plus dommage). Tout ce que tu peux faire c'est t'assurer de pouvoir encore manipuler tes données (et d'en faire une sauvegarde régulière).
Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)
[^] # Re: Une autre définition ?
Posté par raspbeguy (site web personnel, Mastodon) . Évalué à 0.
Bon, une fois pour toute, peux-tu nous donner ta définitions de données personnelles ?
Parce qu'en fait, s'il s'agit des données brutes (celles qui sont volontairement importées par l'utilisateur), tu peux avoir au moins la garantie que le service ne pourra pas en faire usage (cf. chiffrement end-2-end).
D'autre part, je vois mal la liberté que ça donne de pouvoir exporter ses données. Bon ok, j'ai un zip avec toutes les infos/photos/fichiers que j'ai volontairement donné au service (des trucs que j'ai déjà quelque part sur un ordi à moi dans 3 cas sur 5). Et après ? Le service les a encore, je n'empêche rien, mes données peuvent encore être exploitées par le méchant big data.
Pourquoi se focaliser sur cet aspect qui me semble très peu représentatif des libertés possible d'un utilisateur ?
Un gentil du net
[^] # Re: Une autre définition ?
Posté par barmic . Évalué à 3.
Non, c'est extrêmement pertinent, mais je ne peux pas y répondre. Je n'y ai pas assez réfléchis. Ça concerne évidement les données manuellement poussées sur le service. Pour les méta données de tes connexions, je ne sais pas trop. Ça n'est la plupart du temps pas fonctionnel. Ça n'entre pas dans tes usages du service. Les données construites à partir de tes méta données plus celle des autres (tout ce qui vient de la BI) sont déjà bien plus fonctionnelles (tu t'en sert quand tu utilise le service : c'est par exemple ce qui vient des moteurs de recommandation), mais ce ne sont plus des données personnelles (c'est une partie de ce qui fait la valeur ajoutée du service).
La liberté d'aller ailleurs.
Utilise trello, le calendrier de google, un webmail, instagram,… Non les données que tu pousse ne sont pas forcément passé par tes disques durs :)
Parce que tout le reste c'est du leurre. Je n'ai probablement pas était assez clair. Quand tu utilise un service tu n'a aucun contrôle sur rien. Il faut l'admettre une bonne fois pour toute. Tu peux décrire toutes les licences que tu veux faire des pieds et des mains, mais non quoi qu'il arrive tu n'a plus de liberté. L'unique chose que tu peux à peu près maîtriser c'est ta capacité à pouvoir te tirer du service en question. Mon journal est probablement mal écris parce que je ne le fais pas ressortir, mais encore une fois, quand tu utilise un service tu ne contrôle plus rien quelque soit la licence ou le service.
Par contre ce qu'il faut comprendre c'est que si tu es contre les services, que tu t'autohéberge un owncloud et que tu l'utilise avec des amis pour eux, il s'agit encore d'un service. Que le prestataire soit Amazon, Facebook ou toi, ne change pas le fait que ce soit un service (de leur point de vu).
Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)
[^] # Re: Une autre définition ?
Posté par raspbeguy (site web personnel, Mastodon) . Évalué à 0.
Je pense qu'il faut déjà bien cadrer cette notion avant d'émettre une théorie basée sur ça :)
Ces données sont pourtant les plus prisées par les sociétés de profilages.
Ce n'est pas le fait de pouvoir reprendre tes données qui te donne la liberté d'aller ailleurs. Enfin si, mais en général, comme j'avais dit précédemment, un service "trou noir" dans lequel tu mets des données sans jamais pouvoir les consulter, c'est antinomique.
Euh, en réalité c'est les fonctionnalités utilisateur le leurre. C'est devenu maintenant le prétexte des société derrière ces services pour s'en prendre aux données et profilage des utilisateurs-marchandises. Mais je ne pense rien apprendre à personne.
Enfin, je ne comprends pas ce que tu veux dire, j'ai l'impression qu'on est dans un dialogue de sourd. Ce que je veux te faire comprendre c'est que, outre la liberté d'aller voir ailleurs, sur certains services, tu as la possibilité d'avoir d'autres certitudes. Bon, pas énormément certes, mais (je me répète) parfois celle de l'intraitabilité de tes données par chiffrement. Les exemples sont légion : Signal, Telegram, Seafile, ZeroBin…
Cependant, je comprends un peu mieux ou tu veux en venir. Pour toi, si j'ai bien compris, un service ouvert est un service qui permet de changer facilement de crèmerie. C'est peut être moi qui avais mal lu ou mal compris. Mais ma remarque principale reste valable : à mon sens ce n'est pas le principal facteur à prendre en compte.
Un gentil du net
[^] # Re: Une autre définition ?
Posté par barmic . Évalué à 3.
Tout à fait d'accord !
Oui mais tu n'y peut rien. Le fait de te les rendre accessible ne va pas influencer le fait que tu puisse aller ailleurs. La question n'est pas de mettre des battons dans les roues des prestataires de services. Je ne cherche pas à décrire la morale que doit suivre un service, juste quel est ton niveau de liberté à toi utilisateur.
Il y a un paquet de service pour les quels extraire ses données est très difficile, si ce n'est impossible (encore une fois essaie trello).
Non ou du moins pas de manière générique. Pour l'exemple que tu donne, ça ne fonctionne que pour des services de communication pur. C'est impossible pour tout le reste. Mais oui le chiffrement pourrait être une notion annexe (un bonus).
Pour moi c'est presque le seul que tu peux prendre en compte. Il y a la possibilité de chiffrement de bout en bout, éventuellement. Si tu en vois d'autres n'hésite pas, mais je veux surtout battre en brèche l'idée que le LL change quelque chose à la donne.
Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.