Le Projet "libre" Artica depasse les 20 millions de sites Internet catégorisés.

Posté par  (site web personnel) . Édité par Benoît Sibaud, baud123 et claudex. Modéré par patrick_g. Licence CC By‑SA.
13
24
mai
2012
Internet

Artica est un projet « libre » permettant d'installer et de configurer facilement des services d'infrastructures comme un serveur de messagerie, serveur de fichiers ou mandataire/proxy Internet.

Dans le monde du filtrage Web, la catégorisation des sites internet est importante car elle permet d'assurer une cohérence avec les règles de filtrage crée par l'administrateur et la navigation des utilisateurs.
À ce jour le projet Artica est le seul projet « libre » à proposer autant de sites Internet catégorisés.

Le taux de catégorisation croît de jour en jour du fait que la catégorisation s'effectue de façon automatique, grâce à la communauté des utilisateurs d'Artica.

Plus Artica est téléchargé et utilisé, et plus le taux de catégorisation s'accélère. En effet, lorsque le proxy détecte un site Internet qui n'est pas catégorisé, il le place dans une section particulière. L'administrateur en charge de maintenir la solution de filtrage est alors en mesure de visualiser les sites « non-catégorisés » et de le placer lui-même dans plus de 150 catégories disponibles. (la suite en seconde partie)

NdM : Le code est sous licence BSD. Nous n'avons pas trouvé les conditions d'utilisation de la base de données du classement, nous savons donc pas si son utilisation est libre.

Cette fonctionnalité est disponible pour deux raisons : en premier pour assurer un bon taux de filtrage de son proxy, mais aussi pour pouvoir disposer des statistiques de visites du site web concerné.

Cette opération de classement effectuée par l'administrateur est envoyée sur Internet. Les serveurs sur Internet sont en charge, par un système de vote automatique, de décider si oui ou non le site Internet doit être classé officiellement dans la catégorie concernée. En effet, si plusieurs administrateurs de pays différents catégorisent le site Web de la même façon, il y a de grandes chances que la catégorie affectée à ce site Internet soit la bonne.

De par cette méthode, le rythme de catégorisation et le taux de performances de la solution s'accélère à environ 1 million de sites par mois et entre totalement dans l'esprit du monde libre en rendant la solution « communautaire »

Fort de ce taux de détection, le projet Artica propose aussi un composant FireFox qui permet d'être informé immédiatement de la catégorie du site visité. Au gré de votre navigation, une barre d'outils vous permet de visualiser la catégorie du site Internet, le niveau de risque pour les enfants et les adultes à naviguer sur le site, ainsi que du risque Malware ou Phishing.

Des disques ISO sont disponibles sur le site de SourceForge afin d'installer la solution sur des machines virtuelles ou physiques

Aller plus loin

  • # filtrage et libre

    Posté par  . Évalué à 0.

    Ce projet semble vraiment intéressant, et je suis content de voir que le "libre" apporte une solution pour filtrer les sites internet selon leur contenu.

    Il serait intéressant de pousser ce genre de projets à se développer.
    Cela n'entravent pas la liberté d'expression et plus généralement la neutralité du net, bravo, je jetterai un œil à l'occasion.

  • # P'tits drapeaux

    Posté par  (Mastodon) . Évalué à 1.

    Il me semble que les p'tits drapeaux sont pas bons. Le site du projet ne parle pas vraiment en français. Je dirais anglais.

    • [^] # Re: P'tits drapeaux

      Posté par  . Évalué à 2.

      Corrigé. Merci.

      « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

  • # Code source ?

    Posté par  . Évalué à 2.

    Je dois avoir mal cherché, je ne l'ai pas trouvé.

    L'un d'entre vous aurait eu plus de succès ?

    • [^] # Re: Code source ?

      Posté par  . Évalué à 0.

      • [^] # Re: Code source ?

        Posté par  . Évalué à 4.

        Justement pas

        Le compte crée pour l'annonce, les guillemets autour du mot libre dans le titre, le dépôt github vide, l'absence de licence sur la base, la pauvre licence balancée sur le site web, dont on ne sait pas à quoi elle s'applique, ça commence à faire beaucoup de zones d'ombre.

        Investigons:

        Déjà, le personnage : il travaille pour kaspersky (whois artica.fr). Cette parenté n'est vraiment pas manifeste sur le site artica.fr

        Ensuite le logiciel : j'ai téléchargé http://www.artica.fr/download/artica-1.6.050100.tgz
        l'archive contient un repertoire LICENCE, contenant des textes de licence Kaspersky et la licence artica (le PHP sous licence apache, les binaires sous licence BSD) … Les binaires ? Ah oui, il y a un repertoire bin

        Il est rigolo, ce repertoire bin, il contient des clefs publiques Kaspersky visiblement pour des licences valables un mois au nom de David Touzeau, il contient pas mal de fichier ELF. Où sont les sources ? Oh, le joli nom de programme : artica-msmtp, sont-y pas balots ils ont pris le même nom qu'un produit sous GPL… Ah ben en fait non, c'est l'original http://msmtp.sourceforge.net/
        il suffit de le lancer :

        % ./bin/artica-msmtp --version
        Copyright (C) 2008 Martin Lambers and others.
        This is free software. You may redistribute copies of it under the terms of
        the GNU General Public License <http://www.gnu.org/licenses/gpl.html>.

        Bref, sans reprocher quoi que ce soit au modérateur, il me semble que ce genre de pub a plus sa place sur gpl-violations.org qu'ici.

  • # RE le vieux barbu

    Posté par  (site web personnel) . Évalué à 0.

    "Déjà, le personnage : il travaille pour kaspersky (whois artica.fr). Cette parenté n'est vraiment pas manifeste sur le site artica.fr"

    Oui, il travaille pour Kaspersky… Pourquoi ça empêche de développer un projet ?
    Faudra que je le dise à Wietse Venema, le fondateur de Postfix qui travaille chez IBM !!
    Et à tous les autres.. Attention si vous créez un projet, faut surtout pas bosser pour une société… Vivre de pain et d'eau fraîche…

    "le dépôt github vide,": Pourquoi, tu veux coder ?
    "l'absence de licence sur la base, la pauvre licence balancée sur le site web..": Ha bah je ne savais pas qu'il fallait un Avocat juriste pour fabriquer un projet.

    …sont-y pas balots ils ont pris le même nom qu'un produit sous GPL… Ah ben en fait non, c'est l'original.. Pourquoi ca te gène ??? au lieu de farfouiller le code, merci de tester le logiciel ça fera avancer les choses.

    En finalité, 9 années de développement mis à bas par le vieux barbu…

    Arrête ton comportement sectaire… Ca fait pas avancer Linux…

    • [^] # Re: RE le vieux barbu

      Posté par  . Évalué à 1.

      Faudra que je le dise à Wietse Venema, le fondateur de Postfix qui travaille chez IBM !!

      Si postfix distribuait des licences pour des produits commerciaux IBM, je crois que Wietse Venema mettrait un point d'honneur à ce que cette relation soit manifeste

      "le dépôt github vide,": Pourquoi, tu veux coder ?

      Et pourquoi pas ?
      Ou alors simplement, je voulais me renseigner sur le produit.

      Ha bah je ne savais pas qu'il fallait un Avocat juriste pour fabriquer un projet.

      En finalité, 9 années de développement mis à bas par le vieux barbu…

      En 9 années, tu aurais du prendre le temps de lire la GPL.

      Tu m'as fourni le binaire artica-msmtp, sa licence t'oblige à m'en fournir les sources, y compris tes modifications (en simplifiant un peu), et y compris si tu ne l'as pas modifié.
      Elles ne sont pas disponibles dans les liens que tu donnes.

      Après, faut pas trop t'en faire, tu ne serais pas le premier à devoir réguler les licences après coup, sauf que là , en mixant les licences apache, BSD et GPL, tu ne te simplifies pas la tâche.

  • # Où sont les sources...

    Posté par  (site web personnel) . Évalué à 0.

    • [^] # Re: Où sont les sources...

      Posté par  (site web personnel) . Évalué à 1.

      Salut,

      Je n'ai pas encore tester le live-cd mais ca ne serai tarder.

      En attendant j'ai lu un peu le code a la recherche de la liste des domaines et la licence de ces derniers. J'ai entre-apercu que certain fichiers n'etaient telechargeable qu'avec un identifiant FTP, d'autre listes externe (phishing et malware) ne sont utilisable que pour une utilisation non commercial.

      Serait-il possible de clarifier la licence de la liste des 20 millions de sites et de comment participer pour la tester et l'evoluer ?

      http://www.theatre-eibel.fr http://www.isc2chapter-yorkshire.co.uk

      • [^] # Re: Où sont les sources...

        Posté par  (site web personnel) . Évalué à -1. Dernière modification le 29 mai 2012 à 12:05.

        Attention ce n'est pas un Live-CD mais un CD d'install…!

        Non tout est libre d'utilisation….
        http://artica.fr/index.php/home/licenseforartica

        N'essayez pas de rechercher le droit d'utilisation….
        Testez le produit et vous verrez bien que :
        Il n'y a pas de publicité (pour répondre a vieux barbu)
        Il n'y a pas de système de licence commercial.
        Il n'y a pas de bridage ni autre système de calcul.

        On est juste en train de mettre en place un système de support technique payant au même titre qu'un projet Open source qui "tente" de s'amortir…

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.