Des nouvelles de MusicBrainz

Posté par . Modéré par jerome.
Tags : aucun
0
16
juin
2005
MP3
MusicBrainz est une base de données sur les albums de musique permettant de récupérer les informations (auteur, titre...) relatives à un CD ou un morceau (un peu comme FreeDB ou CDDB). Cette base de données est alimentée et modérée par une communauté d'utilisateurs afin d'avoir des données précises et moins d'erreurs que FreeDB par exemple. Le système de vote permettant la validation des modifications limite par exemple le nombre de doublons que l'on peut trouver dans FreeDB.

Il faut noter que les informations contenues dans la base sont pour le coeur des données dans le domaine public et sous licence CC (by-nc-sa) pour le reste.

C'est aussi un client libre (Windows et Mac uniquement pour l'instant mais le prochain sera multiplateforme) et des bibliothèques permettant à d'autres logiciel (dont AmaroK et Juk par exemple) d'interroger le serveur et de récupérer les infos.

L'idée innovante est que l'on peut récupérer les informations en interrogeant sur une des métadonnées mais aussi grâce à une "signature" qui est attribuée à chaque morceau après l'analyse de la musique elle même. Les nouveautés :

- D'abord, concernant l'organisation, la fondation MetaBrainz a été créée en avril dans le but de mieux gérer les finances, les débouchés et l'organisation du projet. C'est un grand pas dans l'évolution et la viabilité du projet.

- Au niveau de la base de données, on a pu voir une innovation très importante avec la sortie des "relations avancées" (voir le lien) qui permettent de définir des liens entre les artistes (liens de parentés ou collaboration par exemple) ou les morceaux (reprises...) ainsi que les liens vers les pages internet (Wikipedia, ou Discogs entre autre) relatives aux artistes. C'est une évolution très intéressante dans la mesure ou sa conception semble suffisamment souple pour évoluer et permet de rajouter de nombreuses informations sur une structure bien définie. pour plus d'information je vous invite à suivre le lien...

- Au niveau du client, pour l'instant, il n'existe pas de version stable sous Linux. Mais, comme je le disais un nouveau client Picard (en Python) est en développement. Une version bêta est déjà disponible et elle tourne partiellement. Le changement principal est que le "tagging" des musiques sera orienté album plutôt que morceaux comme actuellement et comme la plupart des taggers de mp3.

Je rajouterais d'un point de vue personnel que c'est un projet libre que je trouve particulièrement intéressant car il concerne à la fois l'informatique libre et l'information libre. J'irais même jusqu'à dire qu'il est complémentaire d'un projet comme Wikipédia en ce qu'il concerne de l'information bien structuré tandis que Wikipédia concerne de la connaissance partiellement structuré. De même qu'il est important de ne pas se reposer sur des encyclopédie propriétaire, il me semble qu'il est particulièrement dangereux de se reposer sur Amazon ou AllMusic lorsque l'on a besoin d'information structuré. À quand un projet similaire pour les livres ?

Aller plus loin

  • # Typo

    Posté par . Évalué à 1.

    En fait, amaroK s'écrit amaroK et non Amarok :)
  • # Rien pour linux?

    Posté par . Évalué à -2.

    Il est juste dommage de trouver en premiere page des outils pour windows, ou pour Mac OS mais rien pour Linux... :(
    • [^] # Re: Rien pour linux?

      Posté par (page perso) . Évalué à 2.

      Deux programmes sous Linux utilisent déjà MusicBrainz : Juk et AmaroK (au moins).
      • [^] # Re: Rien pour linux?

        Posté par (page perso) . Évalué à 3.

        Oui, mais ils ne permettent pas de :
        - contribuer à la base musicbrainz (ça va venir pour amaroK, c'est en projet)
        - de tagger en masse ses mp3 / ogg (et ça n'existera pas sur amaroK ou juk d'après moi, il faut attendre Picard)
        • [^] # Re: Rien pour linux?

          Posté par (page perso) . Évalué à 2.

          qmbtagger existe aussi :
          http://qmbtagger.sourceforge.net/(...)

          Il permet de renommer en masse lui, et il fonctionne sur les formats mp3, ogg et flac.

          Et il est en qt, c'est sweet.
          • [^] # Re: Rien pour linux?

            Posté par . Évalué à 2.

            dans le même genre, mon préféré est Kremane

            http://www.krename.net/(...)

            Ce message peut paraître hors sujet car ce programme ne gère pas MusicBrainz, mais il est assez complet et, je pense, mérite d'être signalé
            • [^] # Re: Rien pour linux?

              Posté par . Évalué à 3.

              Ouaip. Juk peut aussi tagger plusieurs fichiers d'un seul coup, mais sans passer par la case MusicBrainz en effet. Mais vu que le taux de reconnaissance sur signature de MusicBrainz est à vue de nez de 20% (Dans 20% des cas la signature a une seule corresponance, la bonne, et dans 70% des autres cas il y a plusieurs propositions), il vaut mieux vérifier les résultats toutes les pistes. Mais on peut quand même demander une identification en masse à MusicBrainz.
            • [^] # Re: Rien pour linux?

              Posté par . Évalué à 2.

              Personnellement, pour tagger tout ce qui est MP3/Ogg, j'utilise Easytag (mais en version instable car en Gtk 2.x).
              C'est bien l'un des rares softs en Gtk que j'utilise mais je n'ai jamais trouvé d'équivalent pour Qt/KDE.

              http://easytag.sourceforge.net/(...)

              (celui-là non plus ne gère pas MusicBrainz et c'est bien dommage)
            • [^] # Re: Rien pour linux?

              Posté par (page perso) . Évalué à -1.

              Même mieux ya easyTAG: http://easytag.sourceforge.net/(...)

              D'une efficacité déconcertante!

              « Je vois bien à quels excès peut conduire une démocratie d'opinion débridée, je le vis tous les jours. » (Nicolas Sarkozy)

              • [^] # Re: Rien pour linux?

                Posté par (page perso) . Évalué à 5.

                Pour ceux qui veulent un truc pour tagger simple et efficace (ce qui, avouons le, n'est pas le fort de easytag, dont l'interface est un peu... fouillie), ya Tagtool: http://pwp.netcabo.pt/paol/tagtool/(...)

                C'est du GTK2, ca permet de renommer/tagguer automatiquement, eventuellement en masse, l'ui est tres simple, bref, c'est le bonheur.
      • [^] # Re: Rien pour linux?

        Posté par . Évalué à 3.

        et Zinf ?
        • [^] # Re: Rien pour linux?

          Posté par (page perso) . Évalué à 2.

          Oui Zinf, d'autant plus que ce soft est (me semble-t-il) principalement développé par Robert Kaye, nom très connu chez MusicBrainz :)
  • # /

    Posté par . Évalué à 10.

    Comme dis dans le jornal ( https://linuxfr.org/comments/589003.html#589003(...) ), y a une partie non libre : celle qui permet de generer l'identifiant.

    Sachant que sans cette partie, plus rien ne fonctionne, je trouve qu'il est urgent de trouver une alternative pour que cette solution soit credible pour le libre.
    • [^] # Re: /

      Posté par (page perso) . Évalué à 3.

      D'ailleurs sur leur site ils ne parlent nulle part d'essayer de trouver une solution pour remplacer cette partie ... Ils disent simplement qu'ils utilisent ce service comme une boite noire mais pourquoi ne pas essayer d'implémenter ce service eux même avec une licence libre.
      • [^] # Re: /

        Posté par . Évalué à 4.

        Sans doute car la valeur ajouté de relatable et de son serveur de TRM n'est pas dans les algorithme mais dans le contenu. Ce qu'ils ont faits, c'est dévelloper la technologie TRM et mettre en place des partenariats (avec Emusic au départ et ils viennent d'en faire un avec AllMusic) Et c'est cela qui leur a permi d'avoir une base de donnée de TRM en correspondance avec les chansons. Si c'est le cas, je les comprends aussi (relatable) de pas avoir envie de libérer les données et se débarasser de leur gagne-pain.

        Du coté de MB, ils ont peut-etre pas les moyens de recréer from scratch toute une base pertinente.

        Bon, c'est ce que j'ai compris, mais je me trompe peut etre aussi.
        • [^] # Re: /

          Posté par (page perso) . Évalué à 5.

          Ok, je me trompe peut-être aussi mais voici ce que j'ai compris :

          - Il existe un algo qui à partir de certaines données sur un morceau musical génère un UID.
          - L'algo qui transforme ces données en UID est connu (mais sans doute non implémenté sous licence libre)
          - L'analyse du morceau qui va générer les données sources est lui, déjà implémenté par le client MusicBrainz (sous licence libre)

          Si c'est juste, je ne vois pas le problème : on implémente l'algo qui transforme les données sources en UID, on remplace le service relatable par celui-ci, et au fur et à mesure la DB de notre service s'enrichit automatiquement (lors de la réception d'un set de donnée, on regarde si un similaire n'a pas déjà été traité, sinon on lui applique l'algo).

          Il y a surement un truc qui m'échappe parce que là, je ne vois pas ce qui empêche de déveloper un service similaire ...
          • [^] # Re: /

            Posté par . Évalué à 1.

            J'avais cherche des algos de TRM a une epoque, et si l'algo utilise par musicbrainz est decrit dans un article accessible publiquement, c'est loin d'etre explicite sur le site de musicbrainz. et tu trouves encore moins de lien direct vers des explications sur l'algo. Et si l'algo est decrit qque part. tu vas ensuite te heurter a des pbs de brevets, il me semble que musicbrainz disait a une epoque sur son site que la partie trm pouvait etre couverte par des brevets et tout ca.
    • [^] # Re: /

      Posté par . Évalué à 3.

      > Sachant que sans cette partie, plus rien ne fonctionne

      je trouve que tu tire des conclusions un peu rapides. effectivement, cette partie non libre me gene aussi mais meme s'ils perdaient leur license pour leur serveur de TRM (le client est libre, je le souligne) il ne perdrait qu'une fonctionnalité. Certe, cette fonctionnalité peut sembler la plus original par rapport aux alternatives existentes, mais ce n'est pas ce qui constitue pour moi le point fort de MusicBrainz.

      Ce qui constitue leur point fort c'est leur base de donnée et leur communauté qui permet d'avoir des infos de qualités, cela restera toujours libre. Après on peut perdre la reconnaissance automatique des morceaux mais on aura toujours la possibilité d'interroger la base normalement et cela continuera de constituer une alternative puissante aux autres solution propriétaires avec un contenu sous copyright.
  • # Pour les livres

    Posté par (page perso) . Évalué à 5.

    À quand un projet pour les livres ?

    Il existe déjà un projet pour les livres tombés dans le domaine publics.
    Il en existe même plusieurs.

    - Gnutenberg : http://www.gutenberg.org/(...)
    Il contient certains livres d'auteurs connus de textess tombgés dans le domaine public. La plupart des textes sont en anglais, il y en a en frnçais (surtout les ½uvres originales, de Victor Hugo par exemple)

    - Wikibooks : http://fr.wikibooks.org/wiki/Accueil(...)
    Un projet de WikiMedia, la même fondation qui gère Wikipédia et ses cons½urs. Wikilivres est un ensemble de textes pédagogiques au contenu libre et gratuit.

    - Wikisource : http://wikisource.org/wiki/Main_Page:Fran%C3%A7ais(...)
    Encore un projet de WikiMedia, qui se rapproche plus de Gutenberg : Wikisource est un site hébergeant des textes dans le domaine public ou sous licence GFDL.

    Voila :), donc pour les livres, il y des sources existantes. Par contre, si on veux chercher le titre d'un livre, il suffit de taper deux ou 3 lignes bien typiques et google ou autre retrouvent souvent le titre en question. Un petit passage sr Wikipédia peut permettre d'en savoir davantage
    • [^] # Re: Pour les livres

      Posté par . Évalué à 7.

      Oui ce sont des projets fondamentaux sauf qu'on ne parle pas de la même chose.

      Je parle de catalogues qui ne donnent que des références, pas de bases de textes librement accessible. Et dans les catalogues y'a quoi ?

      - Amazon et consorts, proprio. Bon d'accord Amazon permet l'accès grace aux webservices, mais ils ne te donnent pas accès aux dumps de leur BD... Tu ne peux pas non plus participer à leur enrichissement ou alors en leur faisant cadeaux de valeur ajoutés qu'ils garde précieusement (si tu faits des commentaires sur les livres par exemple)

      - Les catalogues de bibliotheques Nationales, ou les grands catalogues partagés du type Sudoc (que les universitaires présent ici doivent connaitre) Là encore, tu epux y accéder grace au protocole Z3950, mais tu n'as pas accès à des dumps (ou alors ils sont bien cachés) et tu ne peux pas plus participer à l'enrichissement.

      Mais finalement tu n'as pas de grands projets libres avec des données libres et réutilisable...

      Au passage, il y a le meme problème pour les films. Il n'y a que allocine et imdb. résultat, tout le monde s'appuie sur des bases d'infos bien proprio mais rien de communautaire. Si tu veux faire du data minig sur ce genre de données, tu ne peux pas ou alors il faut négocier et tu ne fera pas forécement ce que tu veux.
  • # compatibilité

    Posté par . Évalué à 2.

    Question stupide.

    C'est encore une nouvelle base à renseigner fromscratch, ou bien ça peremt d'utiliser une base déjà existante, telle que freedb ?

    genre si on ne trouve pas les metadonnées, on va chercher celles de freedb, et on renseigne partiellement la base MusicBrainz ?

    Si c'est au client de le faire, ça ne sera pas fait. Mais le serveur, lui, pourrait utiliser ce paliatif pour inciter les utilisateurs à venir, sachant que -- au pire -- tu as les données freedb. Au mieux, tu as tous les plus...
    • [^] # Re: compatibilité

      Posté par . Évalué à 2.

      Je ne connais pas exactement le statut de freedb mais cette base a été créée en réaction à la "fermeture" de cddb, j'en déduis que les données sont libres de droits. Je pense donc que MusicBrainz peut s'alimenter à partir de cette base.
      Mais il reste que le "plus" de MusicBrainz est la validation et ça fait donc une sacré base à valider...
      Peut-être est-il possible de mettre en place une procédure plus directe et simplifiée dédiée à l'import des données depuis freedb. Peut-etre est-ce déjà fait d'ailleurs parce que 3.3 millions de titre ce n'est pas rien.
      • [^] # Re: compatibilité

        Posté par . Évalué à 3.

        En fait, il y a un systeme d'import de FreeDB, si tu ne trouve pas l'album dans MB, tu va le chercher dans FreeDB, et tu rentre son identifiant, après il est importé et tu n'a plus qu'a corriger :)

        Ils ont quand meme pensé à bien faire les choses...
    • [^] # Re: compatibilité

      Posté par (page perso) . Évalué à 6.

      Pourquoi partir d'une base qui a montré ses limites?
      FreeDB pose plein de problèmes :
      - Doublons
      - Fautes d'orthographe non corrigées
      MusicBrainz a une politique très stricte sur le nommage (Majuscules etc...) et la vérification, ce qui n'est pas le cas de FreeDB.

      Ce serait une erreur de partir d'une base qui ne remplit pas les conditions d'une autre base qu'on veut monter...
  • # pas si libre que ça...

    Posté par . Évalué à 1.

    Je pense que musicbrainz n'est pas si libre que ça, en effet lorsque l'on regarde bien ce qui est indiqué sur leur site on constate :

    -> l'algorithme de TRM est propriétaire, de plus en faisant un tour sur le site de relatable (http://relatable.com/)(...) on se rend compte que cet algorithme de TRM est patent pending... NON AUX BREVETS LOGICIELS! Un projet qui utilise un binaire "prété" par une entreprise qui désire le breveter ne me paraît pas très "libre".

    -> Cet algorithme de TRM (qui est le seul avantage de Musicbrainz par rapport à un freedb) n'est pas si efficace que ça, en effet sur mes mp3, 37% ont subi des 'TRM collison' (5904 sur 15957), ce qui signifie que deux morceaux différents ont des identificateurs identiques! => Soit la base n'est pas bonne, soit l'algorithme n'est vraiment pas efficace.

    -> j'ai testé un mp3 d'une même chanson à 128kbps, 192kbps 192kbps avec et sans TAG ID3 et, il semble que music brainz ne sache classer automatiquement que lorsque les tags ID3 sont présents, dans le cas contraire on est obligé de le faire à la main, ce qui est un comble pour un outil d'automatisation...

    -> Le serveur est GPL; ok mais seulement MusicBrainz fait tourner le serveur; quel est l'intérêt pour un user lambda d'avoir le seveur sur sa machine s'il doit avoir une copie de la base pour le faire tourner?

    -> Le client est LGPL qui n'est pas vraiment une bonne license puisqu'elle autorise à des applications propriétaires d'utiliser ce code. Qui dit que les clients officiels fournis seront toujours Libres, qui dit qu'il sera toujours possible de développer des clients libres compatibles?

    -> La base de données est sous license CC. En effet il est impossible de breveter des faits donc c'est ce qui s'est imposé aux yeux de Musicbrainz comme meilleure license (Point 4 du white paper)

    -> Le tagger windows est basé sur MS IE et sa légendaire sécurité sans failles...

    -> La foundation a un white paper qui définit ses orientations et cela contient un tas d'informations qui ne présagent rien de bon...
    http://musicbrainz.org/papers/mb_nonprofit.html,(...) En résumé :
    . cette foundation ne pourra être viable que si elle trouve des accords commerciaux avec partenaires/sponsors.
    . cette même foundation prendra les actions nécessaires pour satisfaire ses partenaires/sponsors
    . la communauté bénévole des utilisateurs/modérateurs du tagger se charge de mettre à jour les données.
    . la foundation se charge de rémunérer le 1er membre fondateur Robet Kaye (non profit signifie juste que tout l'argent gagné doit être réinvesti, comme pour les associations loi 1901 en France).

    Bref le fondateur de ce projet à trouvé le bon filon : exploiter le travail fourni par les gentils utilisateurs qui pensent voient en ce projet un aspect libre ; Mais pour pouvoir ensuite vendre des services à d'autres entreprises...
    Enfin si vous utilisez le client n'oubliez pas de faire un don à la foundation...

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.