Des nouvelles de MusicBrainz

Posté par jahrynx le 16 juin 2005 à 02:09. Modéré par jerome.

Étiquettes : aucune

juin

2005

MusicBrainz est une base de données sur les albums de musique permettant de récupérer les informations (auteur, titre...) relatives à un CD ou un morceau (un peu comme FreeDB ou CDDB). Cette base de données est alimentée et modérée par une communauté d'utilisateurs afin d'avoir des données précises et moins d'erreurs que FreeDB par exemple. Le système de vote permettant la validation des modifications limite par exemple le nombre de doublons que l'on peut trouver dans FreeDB.

Il faut noter que les informations contenues dans la base sont pour le coeur des données dans le domaine public et sous licence CC (by-nc-sa) pour le reste.

C'est aussi un client libre (Windows et Mac uniquement pour l'instant mais le prochain sera multiplateforme) et des bibliothèques permettant à d'autres logiciel (dont AmaroK et Juk par exemple) d'interroger le serveur et de récupérer les infos.

L'idée innovante est que l'on peut récupérer les informations en interrogeant sur une des métadonnées mais aussi grâce à une "signature" qui est attribuée à chaque morceau après l'analyse de la musique elle même. Les nouveautés :

- D'abord, concernant l'organisation, la fondation MetaBrainz a été créée en avril dans le but de mieux gérer les finances, les débouchés et l'organisation du projet. C'est un grand pas dans l'évolution et la viabilité du projet.

- Au niveau de la base de données, on a pu voir une innovation très importante avec la sortie des "relations avancées" (voir le lien) qui permettent de définir des liens entre les artistes (liens de parentés ou collaboration par exemple) ou les morceaux (reprises...) ainsi que les liens vers les pages internet (Wikipedia, ou Discogs entre autre) relatives aux artistes. C'est une évolution très intéressante dans la mesure ou sa conception semble suffisamment souple pour évoluer et permet de rajouter de nombreuses informations sur une structure bien définie. pour plus d'information je vous invite à suivre le lien...

- Au niveau du client, pour l'instant, il n'existe pas de version stable sous Linux. Mais, comme je le disais un nouveau client Picard (en Python) est en développement. Une version bêta est déjà disponible et elle tourne partiellement. Le changement principal est que le "tagging" des musiques sera orienté album plutôt que morceaux comme actuellement et comme la plupart des taggers de mp3.

Je rajouterais d'un point de vue personnel que c'est un projet libre que je trouve particulièrement intéressant car il concerne à la fois l'informatique libre et l'information libre. J'irais même jusqu'à dire qu'il est complémentaire d'un projet comme Wikipédia en ce qu'il concerne de l'information bien structuré tandis que Wikipédia concerne de la connaissance partiellement structuré. De même qu'il est important de ne pas se reposer sur des encyclopédie propriétaire, il me semble qu'il est particulièrement dangereux de se reposer sur Amazon ou AllMusic lorsque l'on a besoin d'information structuré. À quand un projet similaire pour les livres ?

Aller plus loin

Site officiel (54 clics)
Présentation (19 clics)
Site de la fondation (41 clics)
Les innovations du serveur (16 clics)
Le futur client (32 clics)
Les licences de la base de données (24 clics)

# Typo

Posté par Paleo le 16 juin 2005 à 04:29. Évalué à 1.

En fait, amaroK s'écrit amaroK et non Amarok :)
# Rien pour linux?

Posté par Jean-Marc Spaggiari le 16 juin 2005 à 04:52. Évalué à -2.

Il est juste dommage de trouver en premiere page des outils pour windows, ou pour Mac OS mais rien pour Linux... :(
- [^] # Re: Rien pour linux?
  
  Posté par Aurélien Bompard (site web personnel) le 16 juin 2005 à 07:55. Évalué à 2.
  
  Deux programmes sous Linux utilisent déjà MusicBrainz : Juk et AmaroK (au moins).
  - [^] # Re: Rien pour linux?
    
    Posté par yoho le 16 juin 2005 à 08:13. Évalué à 3.
    
    Oui, mais ils ne permettent pas de :
    - contribuer à la base musicbrainz (ça va venir pour amaroK, c'est en projet)
    - de tagger en masse ses mp3 / ogg (et ça n'existera pas sur amaroK ou juk d'après moi, il faut attendre Picard)
    - [^] # Re: Rien pour linux?
      
      Posté par Mat (site web personnel) le 16 juin 2005 à 09:53. Évalué à 2.
      
      qmbtagger existe aussi :
      http://qmbtagger.sourceforge.net/(...)
      
      Il permet de renommer en masse lui, et il fonctionne sur les formats mp3, ogg et flac.
      
      Et il est en qt, c'est sweet.
      - [^] # Re: Rien pour linux?
        
        Posté par fredoh le 16 juin 2005 à 10:32. Évalué à 2.
        
        dans le même genre, mon préféré est Kremane
        
        http://www.krename.net/(...)
        
        Ce message peut paraître hors sujet car ce programme ne gère pas MusicBrainz, mais il est assez complet et, je pense, mérite d'être signalé
        
        [^] # Re: Rien pour linux?
        
        Posté par qdm le 16 juin 2005 à 11:55. Évalué à 3.
        
        Ouaip. Juk peut aussi tagger plusieurs fichiers d'un seul coup, mais sans passer par la case MusicBrainz en effet. Mais vu que le taux de reconnaissance sur signature de MusicBrainz est à vue de nez de 20% (Dans 20% des cas la signature a une seule corresponance, la bonne, et dans 70% des autres cas il y a plusieurs propositions), il vaut mieux vérifier les résultats toutes les pistes. Mais on peut quand même demander une identification en masse à MusicBrainz.
        
        [^] # Re: Rien pour linux?
        
        Posté par Frédéric COIFFIER le 16 juin 2005 à 17:01. Évalué à 2.
        
        Personnellement, pour tagger tout ce qui est MP3/Ogg, j'utilise Easytag (mais en version instable car en Gtk 2.x).
        C'est bien l'un des rares softs en Gtk que j'utilise mais je n'ai jamais trouvé d'équivalent pour Qt/KDE.
        
        http://easytag.sourceforge.net/(...)
        
        (celui-là non plus ne gère pas MusicBrainz et c'est bien dommage)
        
        [^] # Re: Rien pour linux?
        
        Posté par BohwaZ (site web personnel, Mastodon) le 16 juin 2005 à 18:27. Évalué à -1.
        
        Même mieux ya easyTAG: http://easytag.sourceforge.net/(...)
        
        D'une efficacité déconcertante!
        « Je vois bien à quels excès peut conduire une démocratie d'opinion débridée, je le vis tous les jours. » (Nicolas Sarkozy)
        
        [^] # Re: Rien pour linux?
        
        Posté par Mathieu Pillard le 17 juin 2005 à 11:35. Évalué à 5.
        
        Pour ceux qui veulent un truc pour tagger simple et efficace (ce qui, avouons le, n'est pas le fort de easytag, dont l'interface est un peu... fouillie), ya Tagtool: http://pwp.netcabo.pt/paol/tagtool/(...)
        
        C'est du GTK2, ca permet de renommer/tagguer automatiquement, eventuellement en masse, l'ui est tres simple, bref, c'est le bonheur.
  - [^] # Re: Rien pour linux?
    
    Posté par Glorbouille le 16 juin 2005 à 17:24. Évalué à 3.
    
    et Zinf ?
    - [^] # Re: Rien pour linux?
      
      Posté par sweafty le 17 juin 2005 à 08:33. Évalué à 2.
      
      Oui Zinf, d'autant plus que ce soft est (me semble-t-il) principalement développé par Robert Kaye, nom très connu chez MusicBrainz :)
# /

Posté par M le 16 juin 2005 à 07:31. Évalué à 10.

Comme dis dans le jornal ( https://linuxfr.org/comments/589003.html#589003(...) ), y a une partie non libre : celle qui permet de generer l'identifiant.

Sachant que sans cette partie, plus rien ne fonctionne, je trouve qu'il est urgent de trouver une alternative pour que cette solution soit credible pour le libre.
- [^] # Re: /
  
  Posté par Nelis le 16 juin 2005 à 14:10. Évalué à 3.
  
  D'ailleurs sur leur site ils ne parlent nulle part d'essayer de trouver une solution pour remplacer cette partie ... Ils disent simplement qu'ils utilisent ce service comme une boite noire mais pourquoi ne pas essayer d'implémenter ce service eux même avec une licence libre.
  - [^] # Re: /
    
    Posté par jahrynx le 16 juin 2005 à 14:42. Évalué à 4.
    
    Sans doute car la valeur ajouté de relatable et de son serveur de TRM n'est pas dans les algorithme mais dans le contenu. Ce qu'ils ont faits, c'est dévelloper la technologie TRM et mettre en place des partenariats (avec Emusic au départ et ils viennent d'en faire un avec AllMusic) Et c'est cela qui leur a permi d'avoir une base de donnée de TRM en correspondance avec les chansons. Si c'est le cas, je les comprends aussi (relatable) de pas avoir envie de libérer les données et se débarasser de leur gagne-pain.
    
    Du coté de MB, ils ont peut-etre pas les moyens de recréer from scratch toute une base pertinente.
    
    Bon, c'est ce que j'ai compris, mais je me trompe peut etre aussi.
    - [^] # Re: /
      
      Posté par Nelis le 16 juin 2005 à 15:04. Évalué à 5.
      
      Ok, je me trompe peut-être aussi mais voici ce que j'ai compris :
      
      - Il existe un algo qui à partir de certaines données sur un morceau musical génère un UID.
      - L'algo qui transforme ces données en UID est connu (mais sans doute non implémenté sous licence libre)
      - L'analyse du morceau qui va générer les données sources est lui, déjà implémenté par le client MusicBrainz (sous licence libre)
      
      Si c'est juste, je ne vois pas le problème : on implémente l'algo qui transforme les données sources en UID, on remplace le service relatable par celui-ci, et au fur et à mesure la DB de notre service s'enrichit automatiquement (lors de la réception d'un set de donnée, on regarde si un similaire n'a pas déjà été traité, sinon on lui applique l'algo).
      
      Il y a surement un truc qui m'échappe parce que là, je ne vois pas ce qui empêche de déveloper un service similaire ...
      - [^] # Re: /
        
        Posté par Christophe Fergeau le 20 juin 2005 à 08:47. Évalué à 1.
        
        J'avais cherche des algos de TRM a une epoque, et si l'algo utilise par musicbrainz est decrit dans un article accessible publiquement, c'est loin d'etre explicite sur le site de musicbrainz. et tu trouves encore moins de lien direct vers des explications sur l'algo. Et si l'algo est decrit qque part. tu vas ensuite te heurter a des pbs de brevets, il me semble que musicbrainz disait a une epoque sur son site que la partie trm pouvait etre couverte par des brevets et tout ca.
- [^] # Re: /
  
  Posté par jahrynx le 16 juin 2005 à 14:33. Évalué à 3.
  
  > Sachant que sans cette partie, plus rien ne fonctionne
  
  je trouve que tu tire des conclusions un peu rapides. effectivement, cette partie non libre me gene aussi mais meme s'ils perdaient leur license pour leur serveur de TRM (le client est libre, je le souligne) il ne perdrait qu'une fonctionnalité. Certe, cette fonctionnalité peut sembler la plus original par rapport aux alternatives existentes, mais ce n'est pas ce qui constitue pour moi le point fort de MusicBrainz.
  
  Ce qui constitue leur point fort c'est leur base de donnée et leur communauté qui permet d'avoir des infos de qualités, cela restera toujours libre. Après on peut perdre la reconnaissance automatique des morceaux mais on aura toujours la possibilité d'interroger la base normalement et cela continuera de constituer une alternative puissante aux autres solution propriétaires avec un contenu sous copyright.
# Pour les livres

Posté par chtitux (site web personnel) le 16 juin 2005 à 13:19. Évalué à 5.

À quand un projet pour les livres ?

Il existe déjà un projet pour les livres tombés dans le domaine publics.
Il en existe même plusieurs.

- Gnutenberg : http://www.gutenberg.org/(...)
Il contient certains livres d'auteurs connus de textess tombgés dans le domaine public. La plupart des textes sont en anglais, il y en a en frnçais (surtout les ½uvres originales, de Victor Hugo par exemple)

- Wikibooks : http://fr.wikibooks.org/wiki/Accueil(...)
Un projet de WikiMedia, la même fondation qui gère Wikipédia et ses cons½urs. Wikilivres est un ensemble de textes pédagogiques au contenu libre et gratuit.

- Wikisource : http://wikisource.org/wiki/Main_Page:Fran%C3%A7ais(...)
Encore un projet de WikiMedia, qui se rapproche plus de Gutenberg : Wikisource est un site hébergeant des textes dans le domaine public ou sous licence GFDL.

Voila :), donc pour les livres, il y des sources existantes. Par contre, si on veux chercher le titre d'un livre, il suffit de taper deux ou 3 lignes bien typiques et google ou autre retrouvent souvent le titre en question. Un petit passage sr Wikipédia peut permettre d'en savoir davantage
- [^] # Re: Pour les livres
  
  Posté par jahrynx le 16 juin 2005 à 14:24. Évalué à 7.
  
  Oui ce sont des projets fondamentaux sauf qu'on ne parle pas de la même chose.
  
  Je parle de catalogues qui ne donnent que des références, pas de bases de textes librement accessible. Et dans les catalogues y'a quoi ?
  
  - Amazon et consorts, proprio. Bon d'accord Amazon permet l'accès grace aux webservices, mais ils ne te donnent pas accès aux dumps de leur BD... Tu ne peux pas non plus participer à leur enrichissement ou alors en leur faisant cadeaux de valeur ajoutés qu'ils garde précieusement (si tu faits des commentaires sur les livres par exemple)
  
  - Les catalogues de bibliotheques Nationales, ou les grands catalogues partagés du type Sudoc (que les universitaires présent ici doivent connaitre) Là encore, tu epux y accéder grace au protocole Z3950, mais tu n'as pas accès à des dumps (ou alors ils sont bien cachés) et tu ne peux pas plus participer à l'enrichissement.
  
  Mais finalement tu n'as pas de grands projets libres avec des données libres et réutilisable...
  
  Au passage, il y a le meme problème pour les films. Il n'y a que allocine et imdb. résultat, tout le monde s'appuie sur des bases d'infos bien proprio mais rien de communautaire. Si tu veux faire du data minig sur ce genre de données, tu ne peux pas ou alors il faut négocier et tu ne fera pas forécement ce que tu veux.
# compatibilité

Posté par Gaétan RYCKEBOER le 17 juin 2005 à 09:16. Évalué à 2.

Question stupide.

C'est encore une nouvelle base à renseigner fromscratch, ou bien ça peremt d'utiliser une base déjà existante, telle que freedb ?

genre si on ne trouve pas les metadonnées, on va chercher celles de freedb, et on renseigne partiellement la base MusicBrainz ?

Si c'est au client de le faire, ça ne sera pas fait. Mais le serveur, lui, pourrait utiliser ce paliatif pour inciter les utilisateurs à venir, sachant que -- au pire -- tu as les données freedb. Au mieux, tu as tous les plus...
- [^] # Re: compatibilité
  
  Posté par Franck Hanot le 17 juin 2005 à 10:36. Évalué à 2.
  
  Je ne connais pas exactement le statut de freedb mais cette base a été créée en réaction à la "fermeture" de cddb, j'en déduis que les données sont libres de droits. Je pense donc que MusicBrainz peut s'alimenter à partir de cette base.
  Mais il reste que le "plus" de MusicBrainz est la validation et ça fait donc une sacré base à valider...
  Peut-être est-il possible de mettre en place une procédure plus directe et simplifiée dédiée à l'import des données depuis freedb. Peut-etre est-ce déjà fait d'ailleurs parce que 3.3 millions de titre ce n'est pas rien.
  - [^] # Re: compatibilité
    
    Posté par jahrynx le 17 juin 2005 à 11:47. Évalué à 3.
    
    En fait, il y a un systeme d'import de FreeDB, si tu ne trouve pas l'album dans MB, tu va le chercher dans FreeDB, et tu rentre son identifiant, après il est importé et tu n'a plus qu'a corriger :)
    
    Ils ont quand meme pensé à bien faire les choses...
- [^] # Re: compatibilité
  
  Posté par Zenitram (site web personnel) le 17 juin 2005 à 11:17. Évalué à 6.
  
  Pourquoi partir d'une base qui a montré ses limites?
  FreeDB pose plein de problèmes :
  - Doublons
  - Fautes d'orthographe non corrigées
  MusicBrainz a une politique très stricte sur le nommage (Majuscules etc...) et la vérification, ce qui n'est pas le cas de FreeDB.
  
  Ce serait une erreur de partir d'une base qui ne remplit pas les conditions d'une autre base qu'on veut monter...
# pas si libre que ça...

Posté par khildram le 28 juin 2005 à 11:54. Évalué à 1.

Je pense que musicbrainz n'est pas si libre que ça, en effet lorsque l'on regarde bien ce qui est indiqué sur leur site on constate :

-> l'algorithme de TRM est propriétaire, de plus en faisant un tour sur le site de relatable (http://relatable.com/)(...) on se rend compte que cet algorithme de TRM est patent pending... NON AUX BREVETS LOGICIELS! Un projet qui utilise un binaire "prété" par une entreprise qui désire le breveter ne me paraît pas très "libre".

-> Cet algorithme de TRM (qui est le seul avantage de Musicbrainz par rapport à un freedb) n'est pas si efficace que ça, en effet sur mes mp3, 37% ont subi des 'TRM collison' (5904 sur 15957), ce qui signifie que deux morceaux différents ont des identificateurs identiques! => Soit la base n'est pas bonne, soit l'algorithme n'est vraiment pas efficace.

-> j'ai testé un mp3 d'une même chanson à 128kbps, 192kbps 192kbps avec et sans TAG ID3 et, il semble que music brainz ne sache classer automatiquement que lorsque les tags ID3 sont présents, dans le cas contraire on est obligé de le faire à la main, ce qui est un comble pour un outil d'automatisation...

-> Le serveur est GPL; ok mais seulement MusicBrainz fait tourner le serveur; quel est l'intérêt pour un user lambda d'avoir le seveur sur sa machine s'il doit avoir une copie de la base pour le faire tourner?

-> Le client est LGPL qui n'est pas vraiment une bonne license puisqu'elle autorise à des applications propriétaires d'utiliser ce code. Qui dit que les clients officiels fournis seront toujours Libres, qui dit qu'il sera toujours possible de développer des clients libres compatibles?

-> La base de données est sous license CC. En effet il est impossible de breveter des faits donc c'est ce qui s'est imposé aux yeux de Musicbrainz comme meilleure license (Point 4 du white paper)

-> Le tagger windows est basé sur MS IE et sa légendaire sécurité sans failles...

-> La foundation a un white paper qui définit ses orientations et cela contient un tas d'informations qui ne présagent rien de bon...
http://musicbrainz.org/papers/mb_nonprofit.html,(...) En résumé :
. cette foundation ne pourra être viable que si elle trouve des accords commerciaux avec partenaires/sponsors.
. cette même foundation prendra les actions nécessaires pour satisfaire ses partenaires/sponsors
. la communauté bénévole des utilisateurs/modérateurs du tagger se charge de mettre à jour les données.
. la foundation se charge de rémunérer le 1er membre fondateur Robet Kaye (non profit signifie juste que tout l'argent gagné doit être réinvesti, comme pour les associations loi 1901 en France).

Bref le fondateur de ce projet à trouvé le bon filon : exploiter le travail fourni par les gentils utilisateurs qui pensent voient en ce projet un aspect libre ; Mais pour pouvoir ensuite vendre des services à d'autres entreprises...
Enfin si vous utilisez le client n'oubliez pas de faire un don à la foundation...

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.