Forum Astuces.divers Distance entre deux fichiers

Posté par  (site web personnel) .
Étiquettes : aucune
-1
23
août
2010
Bonjour,

Nous avions parlé il y a quelque temps d'une méthode pour calculer la distance entre deux fichiers.

Méthode efficace pour des petites fichiers, et pour un nombre assez petit de fichier.

LinuxFR : http://linuxfr.org/forums/20/28366.html
Billet : http://www.shadoware.org/index.php/post/2010/06/06/Calcul-de(...)

Ce calcul est très efficace sur des fichiers textes.

Ma question qui se pose maintenant est : le calcul de la distance en utilisant la compression est trop longue à utiliser pour des milliers de photos d'un album photo, ou des milliers de vidéo de taille différentes.

Digikam à partir d'un plugin sait détecter les images dupliqués. Existe-t-il un algorithme du même genre permettant de dire si deux vidéos sont proche par une sorte de calcul d'empreinte. (pour que le calcul soit plus rapide que celui fait avec la compression) ?

Merci :)
  • # Astuce ?

    Posté par  . Évalué à 3.

    Où est l'astuce ?
    • [^] # Re: Astuce ?

      Posté par  (site web personnel) . Évalué à 2.

      Oups, j'ai vus divers mais pas astuce. Ce serait plutôt dans question général, que l'on devrait placer la question.

      Désolé
  • # Proches comment ?

    Posté par  (site web personnel) . Évalué à 3.

    Visuellement ? Temporellement ?

    Si tes deux vidéos ont 1 minutes de décalage, ou si l'une est floue l'autre est nette, ça va pas être du tout le même critère de décision.

    Tant que tu ne nous dis pas *exactement* les similarités possibles, personne ne peut t'aider.
    • [^] # Re: Proches comment ?

      Posté par  (site web personnel) . Évalué à 2.

      La notion de proximité est assez subjective.

      Je dirais que sont proche :
      - Deux filmes dans des formats de compression différentes (là c'est pas évident).
      - Deux filmes dans des tailles différentes
      - Deux filmes de qualités d'image différentes
      - Un film est un extrait d'un film (dans ce cas on peut dire que l'extrait du film est proche de la vidéo).

      Peut-être que l'analyse doit passez par la décompression de la vidéo et une analyse image par image pour voir les images identiques et en déduire des relations.

      Je me demandais si quelqu'un avait déjà étudié la question et si des algorithme n'avait pas déjà été écris.

      En même temps si c'était faisable assez facilement, c'est certaine personne qui serait contente pour recherche les filmes copié transférer sur le réseaux ....

      Mais moi c'est plus pour ma culture personnelle.
      • [^] # Re: Proches comment ?

        Posté par  . Évalué à 1.

        Déjà sur des images, faudrait des algorithmes de reconnaissances de formes pour pouvoir les comparer utilement, sauf si c'est juste de savoir si une image est exactement la même qu'une autre, au quel cas, un comp suffirait.
        • [^] # Re: Proches comment ?

          Posté par  (site web personnel) . Évalué à 2.

          >> Déjà sur des images, faudrait des algorithmes de reconnaissances de formes pour pouvoir les comparer utilement, sauf si c'est juste de savoir si une image est exactement la même qu'une autre, au quel cas, un comp suffirait.

          C'est joli, mais un peu niais.
          En pratique, c'est comme je l'ai dit, plus du traitement du signal que de la reconnaissance de formes (qu'on peut utiliser, hein, mais qui véhicule bien moins d'information.)

          Quand au "comp", bon, on avait bien compris qu'il voulait pas comparer deux données identiques bit-à-bit, donc on oublie (et sur des données codées ou compressées, un seul bit de différence peut avoir un « effet d'avalanche » incroyable sur l'objet représenté.)
      • [^] # Re: Proches comment ?

        Posté par  (site web personnel) . Évalué à 2.

        Donc c'est une question dans le vent, et pas une question pour résoudre un problème ?
        Faut préciser !

        De toute façon, pour le traitement du signal (audio ou vidéo), c'est toujours la même chose : un bon gros coup de transformée de Fourier…

        - Compression différente : tu décompresses avant de traiter. C'est super évident. Ptet même le plus évident de tous…
        - Taille différente : tu veux dire résolution ? Ben, tu réduis l'un à la taille de l'autre avant de traiter
        - Qualité différente : Passe les deux films en noir et blanc 320x240, on verra plus la différence…
        - Film extrait d'un autre : recherche de sous-chaîne, mais tu travailles sur des frames (éventuellement interpolées), ça se fait aussi très bien.



        >> Je me demandais si quelqu'un avait déjà étudié la question et si des algorithme n'avait pas déjà été écris.

        Certainement très très étudié, que plein de papiers existent déjà dessus.
        google : "video signal processing conference".
        Youtube le fait pour l'audio et détecter l'usage de chansons dont on n'a pas les droits. Pour la vidéo, c'est exactement la même chose (avec une dimension supplémentaire).


        >> En même temps si c'était faisable assez facilement, c'est certaine personne qui serait contente pour recherche les filmes copié transférer sur le réseaux....

        Je suis sûr que les gens qui travaillent à la production dans le monde du cinéma ont déjà ces outils.
        Et c'est pas parce que c'est *techniquement* faisable facilement que c'est algorithmiquement facile. En gros, l'algo peu être simple, mais s'il est NP-complet il est sans doute plus simple de procéder autrement (en taggant tes films, ou en apprenant par cœur ceux que tu possèdes…)


        >> Mais moi c'est plus pour ma culture personnelle.

        Cf la suggestion de recherche google ci-dessus.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.