raphael0202 a écrit 3 commentaires

  • [^] # Re: Késkidi ?

    Posté par  . En réponse au journal Google démantèle son éthique (et tout le monde s'en fout...). Évalué à 0.

    Ce n'est pas vraiment des bases de données sur lesquels sont entraînés les modèles de Google, plutôt du texte issu de crawl web. Pour le papier cité, ils ont utilisé un dataset issus de common crawl, le C4.
    Le problème avec les données textuelles issu du web, c'est qu'on y retrouve de nombreux biais de nos sociétés (sexisme, racisme,…). Ces biais se retrouvent dans les modèles entraînés sur ces données, c'est notamment ce dont parle le papier de Timnit Gebru.

  • # Lien mort

    Posté par  . En réponse à la dépêche La Student DemoCup 2016 est lancée ! #SDC16. Évalué à 0.

    Le lien vers le règlement de la compétition ne fonctionne pas.

  • # Disponibilité du code source

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 7.

    Très bonne initiative, un bon correcteur orthographique/grammatical libre qui puisse être comparé aux solutions propriétaires manquait vraiment. J'ai vu que le code source était disponible sur le site du projet, mais pas sous une forme très accessible (un fichier 7z). Ne serait-il pas plus simple de le mettre à disposition dans un dépôt git ? Surtout que vu l'enthousiasme qu'a suscité le projet, des contributeurs pourraient aider à améliorer le correcteur.