Forum général.général Freedb-like mais pour toute sorte de fichiers?

Posté par  .
Étiquettes : aucune
0
21
jan.
2012

Bonjour,

Freedb est une base de donnée en ligne permettant de lier une signature de CD ou de piste avec les tags correspondant (artiste, album, année, ...)

Ce style de base de donnée remonte a quelques dizaines d'année.

Hors, actuellement, l'infrastructure existe pour stocker un grand nombre d'informations.

Donc je me demandais si quelqu'un connaissais, ou aurait des idée, une base de donnée "généraliste" (ou plusieurs bases de données par domaines : images, musique, film, documents textes, ...) qui contiennent un hash, et ensuite des tags ?

Bien entendu cette base de donnée pourrait être collaborative.

Donc est ce que quelqu'un a déjà entendu parler d'une telle base de donnée ? ou eu un besoin semblable un moment ?

Merci de m'avoir lu jusqu'au bout

  • # FreeDB

    Posté par  . Évalué à 3.

    Freedb est une base de donnée en ligne permettant de lier une signature de CD ou de piste avec les tags correspondant (artiste, album, année, ...)

    L'original s'appelle CDDB, dont le nom est sans doute plus connu. Sinon, non, je ne saurais pas répondre à votre question.

  • # ouch... pas facile...

    Posté par  (site web personnel) . Évalué à 3.

    Hello,

    Je ne suis pas du tout un expert dans ce genre de techno, mais il me semble que pour que ça fonctionne bien, il faut un mécanisme de hash bien spécifique au fichier et au format...
    Genre si on prend un sha1 , ça fonctionne super pour dire que les fichiers sont identique au mili-poile mais il suffit d'une légère modification pour que ça tombe à l'eau (redimensionnement d'une image, ...)

    Le cd c'est vraiment l'exemple simple... si tu prends rien que les longueurs et le nombre de pistes tu dois déjà être pas loin de trouver ton cd...
    avec une image, tu prends la taille (x*y) ....tu risque d'en avoir un paquet :)

    • [^] # Re: ouch... pas facile...

      Posté par  . Évalué à 2. Dernière modification le 22 janvier 2012 à 15:03.

      voui je suis bien d'accord, mais l'idée sous jacente est lorsque tu récupère un document X ou Y, tu n'ais pas à passer ton temps à tout rechercher de lui, et de permettre d'avoir des tags déjà mis.

      Vu que c'est généraliste, je pense qu'on ne peut pas échapper au fait d'avoir un hash très spécifique (ou alors faire un type de bd pour chaque type de document).

      Par contre rien n'empêche d'avoir deux "hash" par document, un hash crypto type sha1/... et un hash spécifique au format et qu'il soit possible de trier.
      Lors d'une rechercher d'un nouveau document -> on fait une recherche directe (sha1) et de proximité si on ne trouve pas (sur le hash spécifique au document).

      Par contre, fatalement ca vas donner pas mal de taff à la base de donnée ça.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.