Olivier a écrit 319 commentaires

  • [^] # Re: Et la LR ?

    Posté par  . En réponse au journal Marine versus Windaube 10 ! . Évalué à 4.

    La politisation est des idées est effectivement un problème, mais ça concerne tous les partis et toutes les tendances, pas seulement le FN. On trouve plus de liberté de pensée dans les partis extrêmes ou négligeables.

    Mais contrairement à Emmanuel Goldstein, le FN n’est pas une invention du parti au pouvoir, et c’est le parti préféré des xénophobes.

    ce que tu reproches au FN d'avoir peut-être pensé.

    Je suis soupçonneux, surtout quand ça concerne les politiciens et les parleurs en tout genre. Sérieusement, qui va se contenter de croire les discours officiels des partis ? Toi, tu y crois ? La novlangue et la langue de bois, le FN connaît ça autant que les autres.

    Mais j'ai vraiment du mal avec les critiques qui sont faites de ce parti depuis qu'il a changé de tête.

    Tous les partis racontent n’importe quoi dès qu’il s’agit de discréditer les partis adverses. Le FN raconte aussi de la merde sur les autres, tu devrais le savoir. Je ne connais pas un seul politisé qui ne se plaigne pas des mensonges que les autres racontent sur le parti qu’il défend.

    les idées de bon sens de Marine le Pen

    Le bon sens, tout le monde est persuadé de le détenir. C’est de la vanité.

  • [^] # Re: Et la LR ?

    Posté par  . En réponse au journal Marine versus Windaube 10 ! . Évalué à 8.

    Note que le texte dénonce la surveillance des “patriotes” et de “l’opposition” (eux), mais pas celle des Français en général (sans doute parce qu’il y a toute une catégorie de Français qu’ils ne considèrent pas comme de bons Français). L’extrême-droite, dans sa logique de normalisation, fait très attention à son vocabulaire. Le flicage généralisé des musulmans, comme l’indique le texte, ne les indignerait sans doute pas plus que ça.
    Par ailleurs, ce que dit un parti dans l’opposition n’est pas ce que fait ce même parti au pouvoir.
    Le problème, ce n’est probablement pas tant Marine Le Pen que tous ceux derrière elle qui piaffent d’impatience d’avoir les manettes entre les mains.

  • # Avenir de Linux ?

    Posté par  . En réponse à la dépêche NixOS 14.12, la distribution Linux sans effet de bord. Évalué à 8.

    Votre distribution me fait beaucoup penser au plan de Lennart Poettering pour l’avenir de Linux. Suivez-vous l’affaire ? Aidez-vous à œuvrer dans ce sens ? Ça avance ?

  • [^] # Re: C'est arrivé à d'autres

    Posté par  . En réponse au journal La communauté Open Source Américaine et la liberté d'expression. Évalué à 1. Dernière modification le 22 juin 2015 à 11:31.

    Pour quelle raison l’Église se figure avoir un quelconque droit de légiférer contre des personnes qui ne font pas partie de ses membres ? L’Église interdit déjà le mariage homosexuel à l’intérieur d’elle-même. Ça ne lui suffit pas ?

  • [^] # Re: Han

    Posté par  . En réponse au journal Grammalecte : plus que presque rien !. Évalué à 8.

    En effet, il y avait une erreur d’étiquetage dans le dictionnaire. Augure était étiqueté épicène (comme l’indique le lexicographe dans le menu contextuel), au lieu d’être marqué masculin.
    Je viens de corriger l’entrée.

  • [^] # Re: Dictionnaire grammatical anglais

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 1.

    Oui, il existe un dictionnaire grammatical pour l’anglais. Celui de LanguageTool, qui contient environ 354000 formes fléchies. L’anglais est probablement la langue la mieux fournie en ressources. Mais j’ignore s’il existe d’autres dictionnaires libres.

  • [^] # Re: Compte demandé

    Posté par  . En réponse au journal Grammalecte needs you !. Évalué à 10.

    On vient de m’informer qu’il était possible de procéder par virement bancaire sans créer de compte.

    http://fr.vox.ulule.com/comment-verser-sommes-projet-sans-passer-paypal-ch-749/

    Si ça intéresse certaines personnes, envoyez-moi un e-mail à :
    olivier /at/ grammalecte /point/ net

    Et je vous renverrai un RIB. Ensuite il me suffit d’apporter la preuve du versement à Ulule pour que votre contribution soit ajoutée à la somme totale.

    Je vous rembourserai évidemment si la campagne de financement échoue.

  • [^] # Re: Compte demandé

    Posté par  . En réponse au journal Grammalecte needs you !. Évalué à 5.

    Si j’ai bonne mémoire, 5 % de la somme pour Ulule, 3 % pour l’intermédiaire financier. J’avais veillé à ce que le siège social d’Ulule soit en France et le remboursement sans frais.

    Quant à la localisation de l’intermédiaire financier, je n’y ai pas accordé une grande importance attendu que c’est en Europe. Je présume que les banquiers peuvent spéculer où ils veulent dans les filiales européennes fiscalement avantageuses, quoi qu’on fasse. Il n’y a probablement pas que les compagnies américaines qui connaissent toutes les magouilles de ce genre.

    Cela dit, j’imaginais plutôt que c’était Ulule qui faisait travailler l’argent en attente. Rien ne dit que l’argent reste chez l’intermédiaire pendant tout ce temps. Les annulations ne sont pas nombreuses.

    Mais je comprends tout à fait les réserves qu’on peut avoir sur ces pratiques. Comme je l’ai dit, Grammalecte n’était pas très connu. J’ai hésité longtemps entre faire la campagne sur mon site personnel ou via un intermédiaire comme Ulule.

  • [^] # Re: Compte demandé

    Posté par  . En réponse au journal Grammalecte needs you !. Évalué à 1.

    s/font/sont/

  • [^] # Re: Compte demandé

    Posté par  . En réponse au journal Grammalecte needs you !. Évalué à 8.

    La plupart des projets de financement offrent des contreparties matérielles, ils ont donc besoin de savoir à qui envoyer. Il y a aussi des campagnes qui offrent des contreparties immatérielles, comme des PDF de livres. Ils ne peuvent probablement pas se permettre de les diffuser gratuitement sur leur site web. Ces plateformes de financement ne font pas vraiment pensées pour le logiciel libre.

    À mon avis, si Ulule demande une adresse e-mail, c’est pour leur servir de base de diffusion pour promouvoir des projets tiers. Une fois par semaine, je reçois un mail de leur part qui évoque les projets les plus en vue du moment.

    Quant au reste, j’imagine qu’il doit exister des raisons légales, attendu qu’il faut des autorisations pour collecter de l’argent pour des tiers (j’espère ne pas dire une bêtise, je ne sais plus où j’ai lu ça).

    Mais je transmettrai quand même la requête à Ulule. :)

  • [^] # Re: Je me jette

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 5.

    Oui, ils sont présents dans le logiciel. Il suffit de décocher la case “temps composés”, qui active le mode que l’on voit sur l’image.

    En fait, il ne manque pas de conjugaisons dans dans le conjugueur, mais l’étiquetage de tous les verbes n’ayant pas été contrôlés et mis à jour depuis 2008 pour beaucoup d’entre eux (à l’époque où Grammalecte n’existait pas encore), j’ai préféré désactiver le mode “temps composés” et “pronominal” par précaution. Il est prévu d’améliorer l’interface pour pouvoir compléter l’étiquetage manquant (sans jargon) et transmettre l’information en ligne à la base de données. En fait, il manque juste de spécifier si le verbe auxiliaire est “être” ou “avoir” (pour voir les temps composés) et de vérifier si le verbe peut être utilisé pronominalement.

  • [^] # Re: Disponibilité du code source

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 2.

    J’aime travailler seul. Mais oui, si la campagne réussit, ce sera l’occasion de revoir l’organisation du site et d’ouvrir un dépôt. Je pense changer de nom de domaine au passage. Dicollecte, c’était avant tout un site pour travailler sur les dictionnaires.

  • [^] # Re: Debian

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 2.

    Je me disais bien aussi… ce n’est pas si simple, j’aurais dû vérifier avant de répondre.
    J’avais donc bien créé ces règles, puis je les ai supprimées. Et, bien plus tard, j’ai fini par les réintégrer sous une forme a priori avec de peu de risques d’erreur. Mais il se trouve que certaines règles du préprocesseur les rendent inopérantes. À revoir donc.

  • [^] # Re: Questions en vrac

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 4.

    Autant de fautes dans un commentaire sur les correcteurs grammaticaux.

    Moi aussi, j’en fais. Être attentif à tout, ce n’est pas facile.

    Pourquoi es-tu si réticent vis-à-vis de la "tokenisation" ?

    Je ne suis pas réticent vis-à-vis de la tokenisation en général. J’y suis réticent dans Grammalecte en l’état des choses. Parce que Grammalecte est basé sur un autre concept, pas incompatible avec la tokenisation, mais utiliser cet autre procédé juste pour faire de la désambiguïsation, ce serait du gaspillage de ressources. Ou alors il faudrait que ça serve à autre chose, ou tout réécrire depuis le commencement. Pour l’instant, l’étape suivante, c’est faire ce que j’ai proposé dans la campagne de financement.

    Ne crains-tu pas que l'explosion combinatoire des règles que tu mets en place (même après les phases de simplification) et la cohérence entre ces règles ne finissent par rendre le logiciel trop lent ?

    Ça fait partie des problèmes à gérer. J’y suis attentif. Il y a encore pas mal de choses optimisables çà et là. Il y a justement le remplacement de Hunspell qui fournit les données en vrac en XML, la refonte des dictionnaires avec des étiquettes plus adaptées, et diverses parties du code qui peuvent être améliorées.

    Est-on vraiment obligé d'en passer par un couplage avec OO/LO ?

    Non, mais si on veut s’en passer et pouvoir faire des choses intéressantes par la suite, il y a pas mal à faire.

    Pourquoi ne pas analyser des textes bruts plutôt que des ODF pour tes TUs ?

    Ça, c’est ce qu’on me proposait de faire temporairement en attendant une solution plus efficace, mais c’est sur des textes bruts que je compte faire des tests.

    De même pourrais-tu détailler un peu la solution que tu envisages pour la "désambiguisation", car même après la lecture de ton billet je ne comprends pas très bien ce que serait un "index de balises" ?

    Plutôt que tokeniser et faire l’étiquetage de tous les tokens, je vais dresser avec des règles de désambiguïsation un dictionnaire temporaire avec pour clés les positions des mots désambiguïsés et pour valeurs les étiquettes grammaticales à utiliser.
    Ensuite, lors des règles de contrôle, lorsqu’on fait appel à la commande d’analyse lexicale, celle-ci, avant d’interroger le lexique, va regarder si la position du mot à analyser existe dans le dictionnaire comme clé (ce que j’ai appelé une balise). Si c’est le cas, pas besoin d’interroger le lexique, le correcteur utilisera la valeur indiquée par le dictionnaire temporaire. Sinon il interrogera le lexique.

    Concernant ta structure pour stocker le vocabulaire et la nature grammaticale des mots, ne crains tu pas que ceci ne puisse plus te permettre de proposer des suggestions sur des mots mal orthographiés dès le début.

    Pour commencer, il est prévu de se passer de Hunspell pour la grammaire, mais pas pour l’orthographe. Ensuite, avec le temps, j’espère aussi remplacer Hunspell pour l’orthographe, mais peut-être que ce ne sera pas toujours possible partout à cause des performances. Le graphe de mots devrait pouvoir servir de base pour faire des suggestions orthographiques (reste à trouver un algo efficace). Quoi qu’il en soit, le dictionnaire pour Hunspell va subir une grosse cure de simplification de ses règles internes, et ça devrait le rendre plus efficace.

    aurais-tu quelques références à nous indiquer pour effleurer ce sujet, car des adjectifs épicènes, des lemmes, des thesaurus

    Pour le vocabulaire, Wikipédia, c’est pas mal. Sinon, il y a des masses de papiers trouvables en ajoutant “filetype:pdf” à vos recherches dans Google, plus que vous ne pourrez en lire. Je ne sais pas quoi conseiller. :)

  • [^] # Re: Exemples de limites en vrai

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 4.

    Noté. Merci. Les rapports de faux positifs se font dans un fil dédié. Le fil fait peur, mais c’est juste un mémo. Les nouveaux faux positifs arrivent au fur et à mesure des nouvelles versions et sont résolus plus ou moins vite.

  • [^] # Re: Bravo!

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 5.

    Comme tu l'as fait remarquer, j'y vois hélas un inconvénient majeur: c'est lorsqu'il s'agit de rapporter les erreurs sur du texte modifié.

    Cet inconvénient, jusqu’à présent, ne s’est pas révélé si problématique que ça, mais il est exact que, dans certains cas, il serait utile de pouvoir connaître le texte originel. Ça va bientôt se faire. J’hésite entre une méthode simple et une autre plus coûteuse en ressources.

  • [^] # Re: Debian

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 9.

    En effet. Mais ici il faut que j’aborde la stratégie du correcteur.

    Il existait à un moment une règle pour les cas comme “nous écrivez”, puis je l’ai assez rapidement supprimée. Car il y a des tas de cas où cette suite de mots est correcte. Par ailleurs, ce n’est pas une erreur que les gens font usuellement. Il y a vraiment des tas d’autres erreurs bien plus communes que celles-là. Qui écrit “nous écrivez” au lieu de “nous écrivons”? Il y a rarement des erreurs sans confusion basée sur la phonétique. En bref, les ressources sont limitées. Je préfère les consacrer à autre chose.

    J’ai le sentiment que, cette erreur, les gens ne la font que lorsqu’ils veulent tester le correcteur (on ne m’en parle qu’à ces moments-là). Finalement, pour la crédibilité du correcteur, ça a peut-être un intérêt, mais juste pour ça. :)

  • [^] # Re: LaTeX

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 8.

    Je n’avais pas songé à la ligne de commande, mais rien ne s’y oppose. Ça ne devrait pas être bien compliqué d’ajouter une interface en ligne de commande pour traiter des fichiers de texte brut. Si j’ai le temps, je ferai ça en même temps que la finalisation du serveur.
    En revanche, je n’ai pas prévu de m’occuper du format LaTeX. Mais les gens motivés pourront ajouter des règles optionnelles dans le préprocesseur de texte pour effacer les balises qui gênent.

  • [^] # Re: Utilisation dans l'administration

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 4.

    serait-il possible de détecter les doubles retours à la ligne et de suggérer de régler les interlignes dans le style de paragraphe ?

    Non, le correcteur grammatical n’a aucun pouvoir sur les styles et le formatage, il ne voit le texte que paragraphe par paragraphe et il ne choisit pas l’ordre dans lesquels les paragraphes lui sont passés.

    Le formateur de texte pourrait en revanche supprimer les paragraphes vides.

    tu as pensé à en faire en automatique en pilotant un LibreOffice headless

    Non, je n’y avais pas pensé. Je n’ai jamais essayé le mode headless. Maintenant je vais attendre la fin de la campagne. :)

  • [^] # Re: Pourquoi Ulule ?

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 7.

    Pourquoi est-tu passé par ulule pour faire une campagne de financement participatif plutôt qu'autre chose ?

    Même s’il existe depuis quatre ans, Grammalecte n’est pas un logiciel très connu, et je pensais qu’une campagne n’avait guère de chances d’aboutir si je la montais sur mon propre site. C’est une question de confiance. Passer par Ulule, c’est choisir un intermédiaire qui apporte une visibilité hors du milieu des geeks et des technophiles, et surtout de la crédibilité.

    Ensuite, entre Ulule, KissKissBankBank et MyMajorCompany, le choix s’est porté sur la plateforme avec le nom le plus court, les conditions d’utilisation les plus courtes et le site qui avait la plus belle allure à mon goût.

    il me semble que si les 15 000 € ne sont pas atteint, alors tu ne toucheras rien.

    En effet.

    Ça me parait dommage dans le sens ou un financement flexible aurait peut-être été plus adapté.

    L’idée d’origine, c’était d’essayer de me consacrer environ un an à ça. Parce qu’il y a énormément à faire. Par ailleurs, cette campagne est une sorte de test pour mesurer l’intérêt que les millions d’utilisateurs francophones de Firefox et Thunderbird peuvent porter à ce genre de projet.

  • [^] # Re: Exemples de limites en vrai

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 6.

    Je sais ce qu’est aimer.

    Oui, c’est correct. C’est Grammalecte qui se trompe. J’ajoute le cas à ma liste de faux positifs à résoudre. Celui-là devrait être simple à éradiquer.

    Merci pour le test du logiciel.

  • [^] # Re: Linguistes ?

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 8.

    Quand je veux savoir quelque chose que je ne sais pas, j’utilise Google pour trouver des papiers, des idées, etc. Le Net regorge déjà de ressources. Il y a déjà plus de choses à lire que je n’ai de temps à y consacrer. :)

    Par ailleurs, ne prenez pas Grammalecte pour ce qu’il n’est pas. C’est encore un petit projet, avec des mécanismes simples, une mise en œuvre basée sur un déroulé d’opérations qui vise à la simplification du texte. Mais je passerais plus de temps à expliquer ce que ça fait dans le détail qu’à améliorer l’existant. Ce que j’ai décrit dans l’article, c’est assez grossièrement ce qui se passe vraiment. Je vous assure que s’occuper d’un correcteur grammatical, c’est gérer des détails, encore des détails, des cas particuliers, des exceptions et des exceptions aux exceptions, etc. Et si l’amélioration d’un correcteur peut ressembler, vu de loin, à la composition d’un bel algorithme qui va résoudre tous les problèmes, soyez sûrs que c’est une illusion.
    Prenons le cas du désambiguïsateur que je prévois de créer, son code devrait être relativement rapide à concevoir. En revanche, écrire toutes les règles nécessaires va nécessiter la mise au point d’innombrables détails, comme réviser les règles existantes.
    Tout ça pour dire que les pauvres linguistes à qui je pourrais demander un avis vont me regarder bizarrement si je leur dis : « Voudriez-vous lire ces milliers des règles écrites sous forme d’expressions régulières avec du code inclus dedans et me dire ce que vous en pensez ? Ah oui, et ces étiquettes, c’est codé, voilà la traduction en clair… J’espère que vous comprenez le Python… »

  • [^] # Re: Prolog et Chercheurs ?

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 8. Dernière modification le 23 avril 2015 à 19:46.

    Ce que j’envisage, pour l’instant, c’est de faire ce qui est décrit dans la campagne de financement. Et c’est déjà pas mal. Comme je l’ai dit plus haut, je n’ai pas de prétention académique. J’essaie de résoudre les problèmes un par un en pensant à l’étape n+1 quand certains problèmes sont trop compliqués à résoudre en l’état actuel des choses. J’ai commencé en tâtonnant un peu, mais depuis lors j’ai avancé et j’ai les idées plus claires avec une feuille de route déjà bien chargée. Je n’ai pas le temps de me documenter sur les problèmes qui ne sont pas encore à ma portée, car il y a déjà toujours quelque chose à améliorer en l’état. Les questions d’IA, j’en suis très loin. Je constate effectivement, parmi les limitations du correcteur, qu’il bute sur les ambiguïtés sémantiques, mais ça c’est l’étape n+2. Il faudrait déjà résoudre les ambiguïtés grammaticales. Bref, je ne vais éviter de mettre la charrue avant les bœufs. Grammalecte est encore un petit projet.

  • [^] # Re: Erreur

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 5.

    les structures grammaticalement correctes mais peu courantes

    Ça dépend de ce dont il s’agit. Mais oui, probablement.

    Une erreur classique est d'utiliser un homophone

    Il y a quand même une question de ressources, mais ça dépend de ce dont il s’agit. Ce que j’aimerais c’est correcteur orthographique capable de signaler les mots rares ou douteux si l’utilisateur le souhaite, un correcteur orthographique capable de dire : « oui, ça existe, mais… c’est super rare / un anglicisme / un terme vieillot… » Pour l’instant, il peut juste dire si un mot existe ou pas. Et le correcteur grammatical lui-même n’est pas fait pour ça.

  • [^] # Re: Wahou

    Posté par  . En réponse à la dépêche Grammalecte, correcteur grammatical. Évalué à 5.

    Il n’y comprend rien, mais il s’en sort comme il faut, en disant rien, hormis qu’il faudrait une apostrophe typographique. ;)