MAT : Metadata Anonymisation Toolkit 0.3.2

Posté par  (site web personnel) . Édité par Nÿco, Benoît, Benoît Sibaud, baud123 et Nils Ratusznik. Modéré par Nÿco. Licence CC By‑SA.
Étiquettes :
22
4
juin
2012
Base de données

MAT est un projet écrit en python dédié à l'anonymisation de metadonnées, se voulant simple d'utilisation. Écrit durant le GSoC 2011 sous l'ombrelle du projet Tor, il vient de sortir en version 0.3.2. Il est composé d'une bibliothèque, d'une interface en CLI, et d'une autre en GUI.

Qu'est-ce qu'une metadonnée ?

Une métadonnée est une information qui caractérise une donnée.
Prenons un exemple : lorsque vous créez un PDF, en général, des données additionnelles sont ajoutées à votre fichier : le nom du logiciel producteur, votre nom, la date de production, la description de votre document, le titre de votre document, la dernière date de modification, … ce sont des métadonnées. Vous n'avez peut-être pas envie de partager ces informations lorsque vous partagez votre fichier.

Formats pris en charge

Pour l'instant, MAT prend en charge les formats suivants :

  • Portable Document Format (pdf)
  • Zip
  • TApe aRchiver (tar.gz, tar.bz2, tar)
  • Jpeg (jpg, jpeg)
  • Portable Network Graphics (png)
  • Torrent
  • Opendocuments (odt, opt, …)
  • Openxml de Microsoft (docx, pptx, …)
  • MPEG Audio (mp3, mp2, mpa, …)
  • Ogg Vorbis (ogg)
  • Free Lossless Audio Codec (flac)

Objectifs à long terme

Pour l'instant MAT permet l'anonymisation de quelques formats de fichiers couramment utilisés. Un des buts à long terme serait d'implémenter des contres-mesures pour le tatouage/marquage.

Aller plus loin

  • # m4a?

    Posté par  . Évalué à 2.

    Est-ce que cela fonctionne avec les données ajoutées par Apple lors d'un achat de fichier su iTunes?. Anéfé, Apple ajoute le nom de l'utilisateur + id unique à chaque fichier. Ce n'est pas un DRM mais il est aisé de tracer un tel fichier sur le réseau.

    Korben avait donné une soluc qui fonctionne pas mal mais un peu lourde pour faire le ménage sur toute une bibliothèque :
    http://korben.info/enlever-mouchards-itunes.html

  • # tatouage

    Posté par  (site web personnel) . Évalué à 4.

     Un des buts à long terme serait d'implémenter des contres-mesures pour le tatouage/marquage.
    
    

    C'est assez compliqué sans abimer le fichier. Le tatouage est de l'info rajouté inutile.

    Si il ne se voit pas sur une image, cela veut dire qu'il suffit "d'optimiser le fichier" pour faire disparaitre les infos en plus. Si cela se voit, il faut compresser plus le fichier, virer/rajouter des lignes/colonnes pour faire du décalage dans la façon d'encoder le fichier et brouiller le message. Il faut sans doute jouer sur un filtre type anti-bruit mais qui rajoute aussi un peu de bruit (comme le dithering).

    C'est difficile de faire un élément générique, surtout que cela deviendra l'étalon pour tester les nouveaux systèmes de tatouage.

    "La première sécurité est la liberté"

  • # Anonymisation ?

    Posté par  (site web personnel) . Évalué à 1.

    Pour ceux qui se demanderaient ce que peut bien signifier «anonymiser des métadonnées», voici ce qui est dit sur la page du projet :

    Why MAT is not the ultimate solution ?
    Mat only removes metadata from your files, it does not anonymise their content, nor handle watermarking, steganography, or any overly customized metadata field/system.
    If you really want to be anonymous, use format that does not contain any metadata, or better : use plain-text.

    Ce que je traduis par :

    Pourquoi MAT n'est pas la solution ultime ?
    MAT ne fait que supprimer les metadonnées de vos fichiers, il n'anonymise pas leur contenu, ni ne gère les filigranes, la stéganographie, ou tout autre personnalisation excessive des métadonnées.
    Si vous voulez réellement être anonyme, utilisez un format qui ne contient pas de métadonnées, ou mieux : utilisez du plain-text

    • [^] # Re: Anonymisation ?

      Posté par  (site web personnel) . Évalué à 2.

      ou mieux : utilisez du plain-text

      Texte brut en français.

    • [^] # Re: Anonymisation ?

      Posté par  (site web personnel) . Évalué à 3.

      Si vous voulez réellement être anonyme, utilisez un format qui ne contient pas de métadonnées, ou mieux : utilisez du plain-text

      On peut faire de la stéganographie avec du texte, donc dissimuler dedans des données personnelles ou des métadonnées.

      • [^] # Re: Anonymisation ?

        Posté par  . Évalué à 0.

        Personnellement je conseil de chiffrer avec openssl au lieu d'utiliser la stégano seul… Aujourd'hui il y a de vrai hachoir a donnée dans les cables… (par lequelle transite toutes nos données…les vicieux nous vois très bien d'ou ils sont avec leurs super équipement…)

        pour ceux qui souhaitent savoir pourquoi la stégano et systematiquement décortiqué? les pédo et autre détraqué séxuel utilise beaucoup se type de dissimulation !

        utiliser openssl (work around!)

  • # Hexdump mon ami

    Posté par  . Évalué à -2.

    Hexdump -C | more (ou less)

    quelques fichiers ont besoin de leurs moulinette pour pouvoir lire leur META INFO! (tout est dans le format…) :D

    • [^] # Re: Hexdump mon ami

      Posté par  . Évalué à 1.

      hexdump ne retire pas les méta-données à ma connaissance, ou tu en as une version fortement modifiée

      • [^] # Re: Hexdump mon ami

        Posté par  . Évalué à -1.

        Tu as tout a fait raison, hexdump fait simplement un dump brute des données en hexadécimal,
        l'option -C traduit l'hexa avec la table des caractères ASCII.
        Pour pouvoir éditer les META (Quand elles sont visibles) il faut
        un logiciel d'édition hexadécimal (en.wikipedia.org/wiki/Comparison_of_hex_editors)

  • # Que devient hachoir ?

    Posté par  (site web personnel) . Évalué à 4.

    Il y a quelques années, on parlait du projet hachoir, destiné à lire les informations binaires dans un fichier.

    C'est aussi écrit en python, et commençait à gérer pas mal de fichier… Est-ce que les deux projets sont liés ? Pour ceux qui connaissent, est-ce que les deux projets pourraient s'interfacer ?

    Ok je viens d'aller sur le site du projet, et effectivement, c'est basé sur hachoir. Au moins voilà un projet qui ne réinvente pas la roue !

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.