Predator : un programme de reconnaissance visuelle sous GPL

Posté par . Modéré par Bruno Michel.
46
21
avr.
2011
Science

Un jeune chercheur tchèque, Zdenek Kalal, a publié récemment sur YouTube une vidéo assez impressionnante démontrant les capacités du programme de reconnaissance visuelle en temps réel qu’il a développé dans le cadre de sa thèse de doctorat soutenue à l’université du Surrey (Grande Bretagne). Depuis janvier 2011, il poursuit ses travaux à l’EPFL avec Vincent Lepetit et Pascal Fua deux professeurs français de l’université suisse.

Un point intéressant dans ce projet, outre les performances apparemment réellement surprenantes, consiste dans le choix de licence de publication. En effet, les sources sont publiées sous licence GPL, et comme Kalal le rappelle sur son site : « cela signifie que toute diffusion d’un projet contenant tout ou partie du code de OpenTLD devra se faire avec les codes sources et sous licence GPL en version 3.0 ou ultérieure. » OpenTLD (Tracking, Learning and Detection) est l’autre nom du logiciel (le nom Predator étant plus « vendeur », peut-on imaginer).

Ce choix est un exemple du fait que les licences libres ne sont pas un obstacle à la commercialisation, puisque sur la même page Kalal propose une version du même logiciel sous une licence différente ; celle-ci autorisant la réutilisation sans imposer la publication du code source. Cette licence est, quant à elle, vendue par Kalal et son université.

  • # Format lisible pour navigateur moderne ?

    Posté par . Évalué à 4.

    La vidéo est-elle disponible pour navigateur moderne ? J'ai tenté http://www.youtube.com/html5 avec la référence de la vidéo (1GhNXHCQGsM), mais je suis un peu handicapé avec certains sites et j'arrive pas.

  • # Je connais des titres plus vendeur

    Posté par (page perso) . Évalué à -9.

    J'ai tout d'abord lu cette news par lien interposé chez developpez.com. Le titre de la news :

    Un étudiant développe un programme de capture de mouvements, Predator est sous licence GPL et ne demande qu'une Webcam.

    Sur le site des moules on trouve :

    Science Predator : un programme de reconnaissance visuelle sous GPL

    Mes constats :

    • Les moules et la comm' ça fait deux !
    • Chez d.com, on sait vendre un sujet
      1. "un étudiant", on imagine un boutonneux de 16 ans
      2. "ne demande qu'une Webcam", on se dit que c'est plus mieux que tout le reste
    • Franchement moi je propose le titre "Un jeune créé une kikoolol app pour ta cam'. Pour avoir ton app qui suit le cul de la meuf dans la street, envoi CAMCU au 124324"

    Alexandre COLLIGNON

  • # Matlab, quoi..

    Posté par . Évalué à 3. Dernière modification le 21/04/11 à 22:22.

    Ce choix est un exemple du fait que les licences libres ne sont pas un obstacle à la commercialisation,

    Il faut quand même matlab… Mais à part ça, ça à l'air vraiment intéressant. (vite la version avec octave !)

    • [^] # Re: Matlab, quoi..

      Posté par (page perso) . Évalué à 6.

      On peut suivre l'implémentation de Octave sur un autre git apparemment :

      There is an active group of people from the Google Group working toward an implementation using Octave instead of Matlab. Until development with Octave is stable, you will find the most recent updates of the Octave compatible code at https://github.com/bilderbuchi/OpenTLD/.

      • [^] # Re: Matlab, quoi..

        Posté par . Évalué à 3.

        C'est à ça que je faisais réference.
        Bon, j'ai testé avec octave, avec les bonnes libs, et, ça ne marche pas, notemment quand j'utilise "octave test_webcam.m", ce qui n'est pas surprenant.
        J'ai rien trouvé sur leur wiki ou autre. Dommage.

        error: `videoinput' undefined near line 1 column 9

  • # en opensource, grosse innovation !

    Posté par . Évalué à 6.

    ce n'est pas nouveau en terme de recherche et de performance ...
    par contre le fait que ce soit opensource ça c'est réellement nouveau !
    bon l'utilisation de matlab c'est un peu dommage mais si octave peut réellement être utilisé à la place c'est génial !

    • [^] # Re: en opensource, grosse innovation !

      Posté par . Évalué à 7.

      Des références pour appuyer tes propos ?

      Parce que l'auteur semble dire le contraire et j'imagine que si il en a fait une thèse, c'est que des gens potentiellement compétent ont relu son mémoire :)

      • [^] # Re: en opensource, grosse innovation !

        Posté par . Évalué à 10.

        pour la partie détection visuelle et suivi c'est réellement des choses qui
        existent par ailleurs depuis un bon moment ...

        je connais au moins 2 entreprises qui font ça depuis 4 ans pour la partie suivi
        visuel et encore je ne parle que de ce que je connais, je n'ai pas été faire de
        biblio côté recherche sur la chose ... Les liens des 2 entreprises qui proposent
        des produits basés sur la reconnaissance visuelle (starnav,zto)

        l'innovation de ses travaux de thèse concerne en fait la partie apprentissage, détection
        et reconnaissance du visage proprement dit ...

        d'ailleurs c'est le titre de l'article et le début de la vidéo qui m'ont fait
        mettre mon commentaire ... en fait il faudrait plutôt comme titre "détection de visage
        en gpl" plutôt que "reconnaissance visuelle en gpl"

        Des méthodes existaient, cf son dernier article publié, les 2 premiers paragraphes à lire
        elles avaient des problèmes et il propose un nouveau modèle pour résoudre ces problèmes
        et propose en plus une implémentation disponible en open-source plutôt que de la laisser
        dans son labo et que personne ne puisse la voir et l'utiliser et ça c'est classe !

        car des outils comme ça qui traine dans les labos et que personne ne connaît il
        y en a des tonnes ... ça tend à se restreindre, mais il y en a encore ...

  • # Semi hors sujet

    Posté par (page perso) . Évalué à 4.

    Dans le meme genre, projet qui se base sur de la detection de mouvements (en moins complexe):

    http://reactivision.sourceforge.net/ http://www.youtube.com/watch?v=5fVWg_rfq0w

    J'ai vu cela au mix'art myrys à Toulouse, y'a un mec qui en a fait plusieurs et qui fait des démos (le tout sous Linux avec que des soft libres).

    C'est vraiment tripant, ca permet de faire de la zik via des samples, c'est visuel, c'est ludique...

    Je compte bien me motiver à monter cela un jour, ah mon avis tu peux bloquer très longtemps avec un truc comme ca...

  • # Utilisable, mais de nuit une année bisextile, […] en dansant autour d'un banzai.

    Posté par . Évalué à 3.

    Le tool à l'air très bien fait, mais non.
    Déjà, c'est une horreur à mettre en place sous une distribution à jour.
    Premièrement, la version octave, on n'y pense pas, ça marche pas encore. Matlab, ensuite, c'est proprio, c'est dur de se le procurer (à part en tipiak), l'interface graphique ne marche pas chez moi ( j'ai openjdk, j'ai tout, mais non ), ensuite, il faut un gcc 4.3 venu d'ailleurs, et même avec, j'ai des erreurs de compilation. Bref, je repasserais plus tard, dommage.

  • # raisonnement

    Posté par . Évalué à 2.

    Ce choix est un exemple du fait que les licences libres ne sont pas un obstacle à la commercialisation, puisque sur la même page Kalal propose une version du même logiciel sous une licence différente ; celle-ci autorisant la réutilisation sans imposer la publication du code source.

    Autrement dit : Ce choix est un exemple du fait que les licences libres ne sont pas un obstacle à la commercialisation, puisque sur la même page Kalal commercialise son logiciel non pas sous une licence libre mais sous une licence propriétaire permettant la privatisation des améliorations par des tiers.

    Cherchez l'erreur.

    • [^] # Re: raisonnement

      Posté par . Évalué à 2.

      Je ne comprends pas ce que tu veux dire.

      Ce que moi je voulais dire c'est que l'utilisation d'une licence libre n'empêche pas celle d'une licence commerciale. L'intérêt c'est que n'importe qui peut "sortir" du libre, mais que pour ça il doit payer.

      Ca laisse plus de choix est c'est un peu un pied dans la porte de ceux qui autrement aurait refusé le logiciel. Plus tard ils pourront peut-être choisir la version sous GPL afin d'économiser les frais de licence. Ils ont plus de chances de le faire s'ils ont déjà acquis dans le passé une version précédente.

    • [^] # Re: raisonnement

      Posté par (page perso) . Évalué à 1.

      Kalal commercialise son logiciel non pas sous une licence libre mais sous une licence propriétaire permettant la privatisation des améliorations par des tiers. Cherchez l'erreur.

      1. Que la deuxième license soit propriétaire n'est pas écrit
      2. Il existe des exemples de license gratuite GPL, license payante BSD qui implémentent ce qui est décrit plus haut.
      • [^] # Re: raisonnement

        Posté par . Évalué à 1.

        D'un point de vue totalement formel et à la vue des infos dont on dispose, c'est une hypothèse défendable, néanmoins d'un point de vue de ce qui est probable et fait sens il serait assez absurde que la licence payante soit libre permissive et que la licence gratuite soit libre copyleft, car dans ce cas rien n'interdirait aux payeurs de eux-même redistribuer sous licence permissive, ce qui anéantit l’intérêt de cet hypothétique modèle. (A moins peut-être d'être un gros hypocrite pété de tunes et assisté d'une armée d'avocats tel RH, auquel cas on peut se permettre dans tous les cas de chier purement et simplement sur l'esprit de n'importe quelle licence libre en imposant des contrats fachos-pédos-nazis par dessus et en interdisant à ses clients de partager la connaissance sous peine de les bannir de son petit monopole local ainsi constitué.)

        De plus ce modèle économique, quel que soit le caractère propriétaire ou non de la licence payante (et il est probablement propriétaire), à l'inconvénient notable d'être une possibilité limité au détenteur du copyright. (sauf encore une fois à utiliser la méthode RH et à tenir des brides encore plus solides et attachées ailleurs, pour être clair aux couilles de ses propres clients...)

        • [^] # Re: raisonnement

          Posté par (page perso) . Évalué à 2.

          D'un point de vue totalement formel et à la vue des infos dont on dispose, c'est une hypothèse défendable, néanmoins d'un point de vue de ce qui est probable et fait sens il serait assez absurde que la licence payante soit libre permissive et que la licence gratuite soit libre copyleft,

          J'ai écrit: «il existe des exemples» le couple GPL gratuit--BSD payant n'est pas une vue de l'esprit de ma part mais existe dans la réalité --- je connais un exemple, si tu veux tu peux me chicaner mon bout de pluriel ... :)

          L'exemple en question est celui du langage OCaml: les membres du consortium Caml (Microsoft, Dassult le CEA et auparavant Intel, pour ne citer que les plus connus) utilisent le logiciel avec une licence de type BSD alors que la license standard est de type GPL.

          Si je comprends bien, l'intérêt que voient ces sociétés dans la licence permissive est qu'elles peuvent préparer leurs versions maisons et les intégrer à leurs produits sans pour autant devoir plublier le code. Mais depuis quelques temps Microsoft distribue sa mouture de OCaml (appelée F#) sous licence Apache (plus permissive que la GPL).

          dans ce cas rien n'interdirait aux payeurs de eux-même redistribuer sous licence permissive, ce qui anéantit l’intérêt de cet hypothétique modèle.

          Rien ne semble en effet interdire aux payeurs de distribuer le logiciel sous licence permissive, est-ce pour autant leur intérêt?

          • [^] # Re: raisonnement

            Posté par . Évalué à 2.

            Je n'avais en effet pas pensé au cas d'un consortium d'intérêt économique, mais on s'éloigne alors de l'hypothétique entité unique qui ne fait qu'un soft publié gratuitement sous GPL et compterait de plus le vendre sous BSD, cas plus proche de ce qui se passerait ici dans l'hypothèse où la licence payante serait libre permissive (et bien elle directement et non pas un produit dérivé sous licence privatrice -- car au final dans le cas ms cea dassault les revenus finaux proviennent bien de ça)

  • # mouais

    Posté par . Évalué à -3.

    Predator : c'est quand même gravement racoleur comme titre.
    Bon, c'est 'juste' un tracker amélioré.
    Franchement, depuis la sortie de Kinect tout le monde se met à vendre ses travaux de recherche comme des produits. Il va falloir enseigner le marketing en thèse maintenant! Là (las) on atteint l'extrême racolage je trouve. Je ne comprend pas, pourquoi est-ce une dépêche? il n'y a pas grand chose de nouveau là si?

    • [^] # Re: mouais

      Posté par . Évalué à 2.

      Si :)

      Ce qui est nouveau c'est l'aspect apprentissage et que ça marche, une kinect n'apprend rien à priori, et puis elle exploite bien plus qu'une image, elle demande du matos dédié.

      • [^] # Re: mouais

        Posté par . Évalué à 1.

        Exactement. Avec le Kinect, qui est une techno intéressante, il y a des données exploitables de mouvement.
        Là, tu travailles sur n'importe quelle image. Des films de Charlie Chaplin si tu veux. Il n'y a pas besoin de matériel spécifique, et ça, ça n'a pas de prix, ça s'appelle l'interopérabilité ;)
        Ouais, bon, par contre, je n'avais pas vu que ça dépendait de Matlab… Ça c'est plus embêtant pour un logiciel sous GPL, évidemment…

        • [^] # Re: mouais

          Posté par . Évalué à 2.

          Yep,
          Kinect == provondeur 3D, "Predator" == tracker 2D.

          • [^] # Re: mouais

            Posté par . Évalué à -2.

            Bah ça doit pas être très compliqué d'étendre le principe pour faire du tracking en 3D si on le veut vraiment.
            Corrigez moi si je me trompe, mais il suffit d'ajouter une caméra ou deux et de faire une triangulation.

      • [^] # Re: mouais

        Posté par . Évalué à 1.

        l'apprentissage durant le tracking c'est pas nouveau (cf son 1er papier) et puis ma critique était sur l'accroche et le ramdam (la forme) pas le fond !

  • # les applications de ce truc ?

    Posté par . Évalué à 0.

    bizarrement je me suis tout de suite dit "ca pourrait entrer en jeu dans la chasse aux méchants pirates anti-hadopistes et remplacer avantageusement les techniques actuelles de watermarking"

    de fait un logiciel qui utilise tout ou partie de ce soft doit fournir son code, c'est plutot avantageux aussi je trouve...

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.