Forum général.général logiciel de détection de plagiat

Posté par  (site web personnel) . Licence CC By‑SA.
0
30
sept.
2016

Bonjour,

Connaissez-vous des logiciels libre de détection de plagiat ? Actuellement nous utilisons un logiciel propriétaire et voulons étudier d'autres voies.

Pour l'histoire, je ne suis pas personnellement impliqué dans le groupe plagiat de notre institution, mais relativement proche des personnes qui s'en occupent. Je serais particulièrement heureux de pouvoir leur proposer une solution open-source, qui vas dans le sens de ce qu'on impose aux scientifiques qui font appel à nous ( on ne finance que des articles open-access et on pousse pour l'open-data ).

La grosse difficulté est qu'il faut avoir accès à une grande base de donnée d'articles scientifiques et assurer une confidentialité des données traitées. Une particularité Suisse à remplir est d'être efficace non seulement pour des documents en anglais, mais aussi en français, en allemand et en italien (je crois pas que le romanche ait été utilisé).

Si vous avez des pistes, je suis preneur.

Merci à tous.

  • # liberté

    Posté par  . Évalué à -3.

    Ce que vous appelez plagiat est de la diffusion d'information.

    • [^] # Re: liberté

      Posté par  . Évalué à 0.

      C'est l'utilisation d'information/d’œuvre dans sont intégralité ou pas sans aucune modification pour son propre compte sans cité ses sources.

      Merci aux personnes qui mon aidé a trouvé des solutions pour essayer d’écrire sans faute d’orthographe.

    • [^] # Re: liberté

      Posté par  (site web personnel) . Évalué à 3.

      Comme dit plus haut, on fait du plagiat quand on écrit un texte sans citer ses sources.

      Par exemple, quand tu fait une thèse ou un mémoire et tu récupère des information de différentes source. Si tu cite clairement ta/tes source/s, il n'y a pas de problème. Cependant, si tu omet d'écrire d'où viens ton idée, on considère ça comme du plagiat car tu te l'approprie.

      C'est très important de pouvoir détecter et quantifier le plagiat pour trier les chercheurs qui font de la recherche original de ceux qui s'approprient l'originalité des sources. Je dis quantifier, car il existe toujours la possibilité d'oublier de citer une source tout en étant honnête. Mais passé une certaine quantité, ça deviens de la malhonnêteté.

  • # NLP ?

    Posté par  . Évalué à 3. Dernière modification le 01 octobre 2016 à 09:22.

    Genre:
    1. convertir les documents au format texte, puis avec des libs de NLP
    2. faire la tokenization
    3. récupérer les stems
    4. calculer les distances entre les documents

    cf. https://stackoverflow.com/questions/8897593/similarity-between-two-text-documents.

    C'est facile à scripter, et te permet de faire un PoC rapidement. Une petite interface web ad hoc n'est sans doute pas compliquée à faire, ou tout comme le scan automatique de documents stockés dans un espace dédié sur des disques réseaux partagés. Le support d'autres langues que l'anglais dépend fortement de la lib NLP que tu utilises.

    Sinon, vaguement connexe, il y a prochainement un webinaire sur le text-mining et les brevets.

    Fais-moi signe si tu as envie d'en savoir plus. J'ai fréquenté pendant longtemps le monde de la recherche en suisse, et la thématique m'intéresse beaucoup: ça peut être intéressant d'en parler.

    • [^] # Re: NLP ?

      Posté par  (site web personnel) . Évalué à 1.

      C'est un peu ça, en effet. Je pense que la grosse difficulté est d'avoir accès aux textes. Habituellement, quand on souscrit un abonnement à une revue, une clause interdit l'utilisation de robot pour avoir un accès automatique aux données. De plus, dans notre institution, on est loin d'avoir un accès large. Beaucoup de revue ne sont donc pas accessible. Il faut que je creuse auprès du service qui s'occupe des bases de données.

      En tout cas, je transmet ta réponse à mes collègues. Le webminar peut les intéresser.

      • [^] # Re: NLP ?

        Posté par  . Évalué à 2.

        À noter un article qui liste 5 outils de détection de plagiat sur ZDNet.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.