Salut journal!
Suite au début de la mise en place de la HADOPI et la lecture des articles que j'ai pu lire sur le comment de la détection de contenu soumis à des droits d'auteurs et qui sont partagés sur un réseau P2P, je commence à m'intéresser aux empreintes numériques de fichiers audio et surtout vidéo.
Pour les néophytes (je ne suis pas loin d'en être un), je les invite à lire les articles de Wikipédia :
* http://en.wikipedia.org/wiki/Fingerprint_(computing)
* http://en.wikipedia.org/wiki/Audio_fingerprint
* http://en.wikipedia.org/wiki/Digital_video_fingerprinting
Pour l'audio, il y a des bibliothèques et des bases d'empreintes libres de disponibles (comme MusicBrainz). Par contre pour la vidéo, rien de libre ne semble exister. Mes questions sont donc :
* Est-ce que je me trompe sur la non existence de bibliothèque libre pour la vidéo?
* Est-ce que la technologie utilisée par Google pour Youtube (en cours de développement en 2007) [1] sera libérée un jour?
* Est-ce que les algorithmes actuelles sont fiables (notamment sur la vidéo)?
Au passage, je n'ai pas trouvé de truc sur les empreintes d'images. La seule bibliothèque qui pourrait remplir cette fonction est libpuzzle [2] qui permet de montrer la similarité entre deux images. C'est un peu comme la distance de Levenshtein pour le texte [3].
[1] : http://googleblog.blogspot.com/2007/06/state-of-our-video-id(...)
[2] : http://libpuzzle.pureftpd.org/project/libpuzzle
[3] : http://en.wikipedia.org/wiki/Levenshtein_distance
# non existence de bibliothèque libre pour la vidéo
Posté par maxime1986 . Évalué à 4.
C'est un chercheur de sous-titre se basant (comme MusicBrainz) sur l'empreinte des video.
[^] # Re: non existence de bibliothèque libre pour la vidéo
Posté par _NaSH_ . Évalué à 4.
apparemment sur subdownloader.net c'est un simple hash qui est utilisé. ce n'est pas la même chose que MusicBrainz.
Dans MusicBrainz quelque soit le format sonore utilisé l'empreinte (le PUID) peut être retrouvé. Là avec un algorithme de hashage, si on recompresse la vidéo, on change le hash, ce qui n'est pas pratique.
Au passage, même si cela serait bien pour les sous-titres, une technologie d'empreinte pourrait être utilisée pour tagger également les vidéos (tout comme musicbrainz).
Sur XBMC, la reconnaissance des films/série/DVD/vidéo clips se fait uniquement via le nom qu'on donne au fichier, ce qui est assez limité et source d'erreur. Si on pouvait utiliser la même technique que dans musicbrainz pour insérer des meta-données, ce serait une solution bien meilleure.
Cela dit, pour la musique, malgré l'utilisation des tags, les "scrappers" des mediacenters, n'utilisent pas les identifiant artistes/Disque de musicbrainz pour les reconnaitre. Ce qui fait par exemple que Will Smith, est un DJ suédois chez moi..
[^] # Re: non existence de bibliothèque libre pour la vidéo
Posté par sanao . Évalué à 2.
Il semblerait que MusicBrainz nécessite de calculer le PUID de tout le fichier audio pour déterminer la chanson. Est-ce qu'il existe une bibliothèque libre permettant à partir d'un extrait de trouver le titre (comme Shazam)?
J'ai trouvé ça pour l'explication du principe : http://drgoulu.com/2009/07/11/comment-marche-shazam/ et http://laplacian.wordpress.com/2009/01/10/how-shazam-works/
L'idéal serait d'avoir un truc identique pour la vidéo.
[^] # Re: non existence de bibliothèque libre pour la vidéo
Posté par El Titi . Évalué à 1.
à partir du moment où tu appliques un watermark à la bande son d'un film dans toutes les langues, quel intérêt pour la vidéo ?
Les pirates ne vont quand même pas s'amuser à refaire les doublages avec leurs petits micros.
[^] # Re: non existence de bibliothèque libre pour la vidéo
Posté par sanao . Évalué à 2.
Je trouve ça amusant de pouvoir identifier un truc avec un simple extrait. Idem pour les images. Tu regardes un tableau, un statue, un monument, tu le prend en photo et tu demandes à ton logiciel c'est quoi son petit nom. Google met en place ce genre de truc : http://www.google.com/mobile/goggles/
[^] # Re: non existence de bibliothèque libre pour la vidéo
Posté par El Titi . Évalué à 2.
Mais dans ce cas le hash est déjà bien pratique même s'il ne couvre pas les transformations.
[^] # Re: non existence de bibliothèque libre pour la vidéo
Posté par _NaSH_ . Évalué à 2.
avec shazam, on a une idée peu précise de la chanson jouée. Si on prend l'exemple d'un medley, shazam va écouter 20s et associer au mauvais titre.
musicbrainz doit faire la même chose. Il y a un calcul du puid qui est long et non-libre. c'est http://www.amplifindmusicservices.com (anciennement musicdns) qui détient les droits. Picard tagger et les autres logiciels font une détermination rapide d'empreinte (sous licence libre) qui envoyée à un webservice permet de retrouver le puid sans avoir a le calculer. Le puid est associé a un titre, et diffère suivant la longueur du titre. Du coup, on peux faire la différence entre une version album, une version radio et une version "compilation" d'un titre.
le problème vient des utilisateurs qui parfois s'en contrefoutent, et associent une empreinte a un titre, même si le morceaux fait 1 min de plus. heureusement on peux corriger en supprimant les puid mal associés mais le logiciel d'association (picard tagger) a quelques lacunes pour éviter que cela se répète.
prendre un extrait de blade runner par exemple et en trouver l'empreinte, ne permettra pas de faire la différence entre une version normale, et la director's cut. tout le fichier est nécessaire si on veux faire une vrai reconnaissance. cependant dans le but de déterminer si l'extrait vidéo est sous licence ou pas, c'est vrai qu'une détermination grossière est suffisante.
Par contre, j'ai peut être oublié quelque chose. Faire une empreinte "façon musicbrain" ou shazam, nécessite de décompresser entièrement le fichier. Ce qui se fait plutôt rapidement avec des musiques de 40 a 50mo décompressé, mais qui serait un tout autre problème avec des films. qui plus est en HD !
# Comme pour tout
Posté par Axioplase ıɥs∀ (site web personnel) . Évalué à 5.
Comme pour tout : une bonne transformée de Fourier, et hop, tu as déjà de quoi sélectionner des informations utiles.
[^] # Re: Comme pour tout
Posté par Quikeg . Évalué à 6.
[^] # Re: Comme pour tout
Posté par JoeBar . Évalué à 10.
La bonne transformée de Fourier, c'est pas pareil : elle voit une fonction, bon, elle la transforme, mais tu vois, c'est une bonne transformée de Fourier.
[^] # Re: Comme pour tout
Posté par Kerro . Évalué à 4.
[^] # Re: Comme pour tout
Posté par mansuetus (site web personnel) . Évalué à 10.
Alors que la bonne... bon, elle prend l'image. Et elle la transforme. Mais c'est une bonne transformée de fourier...
[^] # Re: Comme pour tout
Posté par imr . Évalué à 4.
Ah ben oui, il a déjà été fait à 9h54.
# Vidéo + Son
Posté par Strash . Évalué à 3.
Le seul problème serait-il que les systèmes d'empreinte sonore ne fonctionne que sur des fichiers de quelques minutes et pas des heures comme un film ?
[^] # Re: Vidéo + Son
Posté par Stibb . Évalué à 2.
Ce qu'il faut c'est un shazam à la vidéo...
# l'ina aussi l'a fait
Posté par supareno . Évalué à 1.
et il n'y a pas que Google qui en a créée une: l'INA l'a fait aussi. Et comme Google, elle n'est pas libre (http://www.ina-entreprise.com/entreprise/activites/recherche(...)
# Coquille
Posté par Davy Defaud . Évalué à 3.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.