Pour la même raison qui fait qu’on écrit plus souvent Dvorak ou Dvorák que Dvořák.
Pour la même raison qu’on n’écrit pas les mots russes en caractères cyrilliques.
99 % des gens n’ont simplement pas les outils adéquats. S’ils les avaient, on réviserait ce choix.
Il est déjà difficile de faire accepter les apostrophes typographiques (que Wikipédia n’a pas voulu imposer, soit dit en passant) et les majuscules accentuées bien de chez nous. Alors, ça, bonne chance.
Mais oui, idéalement… c’est ce qu’il faudrait faire. À moins de considérer que l’appropriation et la simplification des graphies étrangères soit une chose normale, voire souhaitable.
Vous dites bien Londres et Francfort(-sur-le-Main), et non London et Frankfurt( am Main), n’est-ce pas ?
Adopter les mêmes règles permettrait de remplir automatiquement le dico en se basant sur les pages présentes dans l'encyclopédie.
Non. Ils acceptent bien trop de choses pour nous. On remplirait le dictionnaire avec des dizaines ou des centaines de milliers d’entrées. Par ailleurs, Wikipédia ne recense même pas les noms communs, ce n’est pas un dictionnaire. Pas le même but.
Enfin, leur titres utilisent souvent des graphies trop savantes comme Łódź, que nous écrivons simplement Lódz, parce que nous refusons les diacritiques sur les consonnes (une seule exception historique avec ñ pour certains mots espagnols).
Ce moteur peut-il servir facilement à générer d’autres extensions ?
Il faudrait faire un peu de nettoyage, mais on pourrait faire des extensions pour d’autres langues. Pas trop de boulot à faire pour Python, je pense, mais pour JavaScript, ce serait plus compliqué, attendu que rien n’est prêt pour ça.
Enfin, il faudrait quand même écrire des règles pour ces autres langues et c’est déjà en soi beaucoup de travail.
Penses-tu te pencher dans le futur sur la création d’une extension pour Word ?
Non. Je ne sais même pas si on peut faire des extensions pour Word. Google n’a pas l’air de savoir de quoi je parle…
De la même manière que nous avons accès dans les configurations à l’ancienne ou à la nouvelle orthographe, n’y aurait-il pas possibilité de choisir « Français étendu (avec néologismes) » ?
Avec beaucoup de temps et d’argent, tout est possible. Mais il n’y déjà pas grand-monde pour travailler sur le lexique… alors…
Avez-vous une idée du temps qu’il a fallu pour gérer la réforme, quelques milliers de graphies “seulement”?
Moi aussi, j’ai souvent des problèmes avec mon Firefox ultra-customisé quand je veux payer quelque chose. Le mieux que j’ai trouvé, c’est d’avoir un navigateur alternatif nu pour passer ces obstacles fâcheux. (Et encore, même comme ça, il arrive que ça ne fonctionne pas…)
comment cela fonctionne-t-il ??? un petit texte explicatif ? un lien ?
Dans ce fichier, on liste sur une ligne les mots qui ont une prononciation similaire, mais seulement ceux qui ont des lemmes différents. Par exemple, inutile de lister ronger, rongeait, rongé, rongez, etc. puisque ce sont tous des mots dérivés du lemme ronger.
Cette liste est utile pour le moteur de suggestions du correcteur.
Il n’est pas nécessaire de comprendre comment ça fonctionne en fait. Par la suite, lors de la compilation des données, cette liste est rassemblée en un dictionnaire qui pointe vers une liste d’ensembles, et les étiquettes grammaticales sont rassemblées pour qu’on puisse filtrer à la demande.
Voici ce qu’en dit le Bon Usage de Grevisse (la plus grosse référence en matière de grammaire). Je résume :
— l’accord au singulier est possible si le sens permet qu’on remplace “un” par “celui” (c’est bien ce sens que j’ai voulu donné à ma phrase) ;
— il est cependant remarqué que, même sans ce sens logique, l’accord au singulier est souvent fait (citations à l’appui) ;
— il est également mentionné que la construction au singulier était courante jusqu’au XVIIIᵉ siècle (et au-delà).
Voici ce qu'en disait Claude Hagège
Comme il le dit lui-même : « les évolutions se font plus en fonction des sens plus que des formes ».
Dans ses exemples, il mélange deux cas : « un des [noms] qui » et « un de ceux qui ». Deux cas à mes yeux différents, mais qu’importe, le Grevisse signale aussi qu’il y a des exemples d’accord au singulier avec « un de ceux qui ».
Je ne connaissais pas Brython, donc je n’ai pas d’avis sur la question pour l’instant. :)
J’ai essayé l’éditeur en ligne et je ne comprends pas ce que je lis.
Le code que j’exécute avec [Exécuter], il est lancé avec l’interpréteur Python ou JavaScript?
Quand je clique sur [> JavaScript], ça me renvoie systématiquement une erreur.
Par ailleurs, qu’en est-il des performances? Quelle la vitesse par rapport au script Python originel?
Grammalecte sollicite beaucoup de ressources, et s’exécute dans un processus séparé pour ne pas figer le navigateur.
En effet, si on écrit, pour simplifier, "un des points qui m'[avoir] surpris est le fait de…", le sujet du verbe "avoir" est "des points" (on écrit donc "ont") et le sujet du verbe "être" est "un des points qui m'ont surpris" (singulier). Le pronom "qui" se rapportent à "points".
Ça peut aussi être “un”, comme l’attestent les liens de Benoît. Dans le premier, vous avez l’exemple: « un des chercheurs qui a été honoré pour ses travaux »…
je vois mal comment on peut défendre la forme "Pierre est un des élèves qui est venu", qui est semblable aux formes que vous défendez.
J’ai écrit : « L’un des points auxquels je n’avais pas beaucoup réfléchi et qui m’a le plus surpris ». Ça ne me paraît pas semblable à la forme que vous évoquez. Il n’y a pas de « Pierre est » ou quoi que ce soit de similaire dans ma phrase.
Ce que j’ai voulu dire exactement, c’est : « le point, parmi tous ceux que j’ai dû traiter, auquel je n’avais pas beaucoup réfléchi et qui m’a le plus surpris, c’est blablabla. »
Dans tous les cas, réfléchi reste au singulier, parce que un des points n’est pas COD mais COI. On réfléchit à quelque chose. On écrirait pareillement: ces points auxquels j’ai réfléchi.
Et c’est bien un seul point qui m’a surpris. Ici, il n’y a ni COD ni COI. Un des points est le sujet. Surprendre doit ici s’accorder avec “me”.
En revanche, il faudrait écrire auquel à la place de auxquels.
Cette fois, il y a effectivement une erreur. Il faut mettre un “s”.
Et vous avez raison, impossible de savoir qui est vous, si c’est un vous de politesse ou non. Le correcteur ignore complètement ce cas-là.
En revanche, Grammalecte détectera l’erreur si vous écrivez: « Si la première campagne les a satisfait. »
L'accord du participe passé est-il difficile à traiter, en général ?
Oui, difficile. Par exemple, pour les COD qui précèdent le «que» d’une proposition.
Avec, par exemple, les verbes que j’ai conjugué, Grammalecte voit l’erreur, mais si le COD est placé bien plus loin, Grammalecte va se tromper ou ne rien voir.
Par exemple, avec les ennemis de la république que nous avons enfermés, Grammalecte se trompe: il veut enfermer la république.
Le problème des wikis, c’est que leur format n’est vraiment pas commode à exploiter. Si quelqu’un s’y colle, je suis preneur, c’est peut-être plus simple maintenant qu’autrefois. Mais oui, idéalement, ça pourrait servir.
Dans cette liste, il n'y a pas de distinction entre é et è ? poignée (pwaɲe) / poignet (pwaɲɛ)
Non, on fait dans l’homophonie grossière. Les accents sont parfois prononcés différemment d’une région à l’autre. On associe même rail avec raye. J’envisage même d’y mettre des graphies semblables, comme darde et dard.
Une règle ne va pas suffire. :) Mais oui, il y a des cas gérables. Grammalecte a fait des progrès sur ces erreurs syntaxiques, mais le chemin est encore long.
Il est fréquent que être et avoir soient considérés hors groupe, comme verbes auxiliaires. C’est d’ailleurs aussi mon choix.
Je constate que le Grevisse ne mentionne pas les groupes que nous connaissons. Peut-être parce que c’est belge?
Il est mentionné “quatre” classes de conjugaisons :
— 1ʳᵉ classe, les verbe en -er, comme aimer,
— 2ᵉ classe A, les verbes en -ir, comme finir,
— 2ᵉ classe B, les verbes en -ir, comme sentir,
— 3ᵉ classe, les verbes en -oir, comme recevoir,
— 4ᵉ classe, les verbe en -re, comme rendre.
Il est précisé en note de bas de page que c’est une longue tradition de répartir les verbes dans ces “quatre” classes, que les grammairiens se sont longtemps querellés sur les critères de classement des verbes, et qu’à force de disputes, beaucoup préfèrent s’en tenir à ces “quatre” classes traditionnelles.
Dans ton moteur tu le charges en mémoire ou tu vas lire le dictionnaire sur le disque ?
Le fichier est lu et mis en mémoire. Ce sont des données figées. Le graphe de mots est une structure binaire parcourue avec des opérateurs logiques.
Peux-tu envisager une fusion-compilation de plusieurs dictionnaires (à la volée en fonction d'une option) avant d'entamer l'analyse proprement dite ?
Avec du temps, tout est envisageable. Pour l’instant, la compilation des données se fait à la création de l’extension, et je le fais uniquement lors des mises à jour du dictionnaire. Ça prend une minute sur ma machine. Donc, oui, on pourrait fusionner des dictionnaires, s’ils suivent le schéma suivant:
flexion lemme étiquettes
Il faut que les étiquettes concordent, sous peine d’égarer le correcteur grammatical. Il ne faut pas fusionner n’importe quoi, comme le dico français et anglais. Les étiquettes ne sont différentes.
se joue la possibilité pour l'utilisateur de personnaliser son dictionnaire en fonction de ses besoins
Oui, ça fait partie des buts à long terme. Si tu as lu la campagne de financement, tu as dû voir qu’il y est fait mention de pouvoir mieux gérer le lexique. Il est vrai que je n’ai pas parlé de personnalisation de son dico, j’aurais pu, j’aurais peut-être dû, mais j’ai préféré éviter de trop promettre. Je n’y ai pas beaucoup réfléchi en fait.
Pour l’instant, c’est quand même possible, mais il faut que tu récupères les sources, tu édites le fichier French.lex dans le dossier lexicons, tu ajoutes ce que tu veux et tu recompiles. La compilation est rapide. En quelques minutes, voire moins, c’est plié.
la gestion de dictionnaires multiples chacun arbitrera pour lui-même car, comme tu le dis, sur ces questions « ça dépend des personnes ».
Oui, c’est une idée que j’aurais dû creuser. Je vais y réfléchir. Bizarrement, j’avais classé la personnalisation dans les idées logistiques à remettre à beaucoup plus tard, mais ça mérite que je pèse à nouveau la question…
ne crois pas que je souhaite de basher gratuitement
Je ne le crois pas. Mais je ne vais pas discuter sans fin non plus, ça ne mène rien.
tu exploites aller comme du premier groupe car cela te simplifie la tâche est une chose
Non. La logique qui consiste à étiqueter V1 (1ᵉʳ groupe) en interne, elle se base avant toute chose sur l’infinitif et le participe passé. C’est commode de faire ainsi.
Mais ce n’est pas la logique interne qui dicte le choix dans le conjugueur et le lexicographe. Je n’ai qu’à mettre un if et la question est réglée. Ce n’est rien.
Seulement voilà, les raisons de mettre aller dans le 3ᵉ groupe me semblent futiles et contradictoires avec les faits.
Le 1ᵉʳ groupe contient des tas de verbes irréguliers dont le radical est modifié. C’est pourquoi, à mes yeux, le verbe aller y a sa place, comme tous les autres. Par ailleurs, comme il n’y a aucun lien quelconque entre aller et les verbes du 3ᵉ groupe (qui n’est pas un groupe «poubelle»), je ne vois pas de raison probante de l’y mettre. C’est tout.
Dans le fond, je ne crois pas que vous contesteriez cette décision si l’Académie classait elle aussi “aller” dans le 1ᵉʳ groupe. Je pense que vous cherchez à justifier un « c’est comme ça » établi par une habitude qui, à mon avis, n’a pas été beaucoup réfléchie.
Je peux fournir le dictionnaire Hunspell avec les étiquettes grammaticales. C’est même l’option par défaut de genèse des dictionnaires. Ce n’est pas un souci.
Je vais le faire bientôt.
le premier groupe : verbe dont l'infinitif est en « er » dont (:-P1) le radical ne subit pas d'altération lors de sa conjugaison
On n’est déjà pas d’accord ça. Les radicaux du 1ᵉʳ sont souvent modifiés. Sinon je n’aurais pas eu besoin d’autant de règles pour gérer ça.
La réforme de 1990 elle-même opère des transformations sur ces radicaux, un changement de la norme d’accentuation. Par exemple: célébrerais devient célèbrerait: https://fr.wiktionary.org/wiki/c%C3%A9l%C3%A9brerait
Même sans la réforme, plein de verbes fonctionnent ainsi: peler devient pèle, semer devient sème, etc.
La transformation d’un c en ç, d’un y en i, c’est aussi une modification du radical.
Vous ne me croyez apparemment pas. Donc voici les verbes irréguliers en -er selon le Robert:
Ils ont aussi décidé d’y mettre les verbes qui engendrent des sonorités inhabituelles, comme épier, à cause des formes comme épiions. C’est plus discutable, mais ce n’est pas le sujet.
Par ailleurs, le Bescherelle, le Larousse et bien d’autres (ici, ici, ici, ici, ici) considèrent envoyer comme un verbe du premier groupe.
Bref, comme je l’ai dit, en grammaire, l’unanimité n’a pas encore été trouvée.
les expressions régulières sont fort utiles pour de l'analyse lexicale, le choix de construire un moteur entier d'analyse grammaticale autour des expressions régulières est déjà, en soi, une option discutable2.
Ce qui est discutable, ce n’est pas de bâtir autour d’expressions régulières. Ce qui est discutable, c’est de ne se baser que sur ça. J’en conviens, mais je suis parti d’une base existante qui avait fait ce choix, et il y a aussi des avantages. Je finirai par utiliser une autre approche, sans abandonner la première.
Car la tokenisation pose des tas de problèmes, tellement que LanguageTool a suivi il y a peu le chemin de Grammalecte en faisant de la reconnaissance d’erreurs par expressions régulières, mais je crois que c’est beaucoup limité que ce que je peux faire. Je me souviens par exemple que jusqu’à récemment, LT ne pouvait pas examiner des formes comme “pouvait-vous”. Je ne sais pas si le problème a été résolu.
tu te fondes sur un tel choix pour justifier ta classification des verbes alors là je ne peux absolument plus te suivre
J’ai déjà dit que j’avais fait ce choix avant de concevoir le correcteur. Mais je l’ai effectivement confirmé pour des raisons pratiques. J’ai deux raisons de suivre cette logique, pas une seule.
[^] # Re: Règles Wikipédia
Posté par Olivier . En réponse au journal Enquête sur les noms propres pour le dictionnaire orthographique. Évalué à 10.
Par simple réalisme.
Pour la même raison qui fait qu’on écrit plus souvent Dvorak ou Dvorák que Dvořák.
Pour la même raison qu’on n’écrit pas les mots russes en caractères cyrilliques.
99 % des gens n’ont simplement pas les outils adéquats. S’ils les avaient, on réviserait ce choix.
Il est déjà difficile de faire accepter les apostrophes typographiques (que Wikipédia n’a pas voulu imposer, soit dit en passant) et les majuscules accentuées bien de chez nous. Alors, ça, bonne chance.
Mais oui, idéalement… c’est ce qu’il faudrait faire. À moins de considérer que l’appropriation et la simplification des graphies étrangères soit une chose normale, voire souhaitable.
Vous dites bien Londres et Francfort(-sur-le-Main), et non London et Frankfurt( am Main), n’est-ce pas ?
[^] # Re: Règles Wikipédia
Posté par Olivier . En réponse au journal Enquête sur les noms propres pour le dictionnaire orthographique. Évalué à 3. Dernière modification le 17 juin 2017 à 16:38.
Non. Ils acceptent bien trop de choses pour nous. On remplirait le dictionnaire avec des dizaines ou des centaines de milliers d’entrées. Par ailleurs, Wikipédia ne recense même pas les noms communs, ce n’est pas un dictionnaire. Pas le même but.
Enfin, leur titres utilisent souvent des graphies trop savantes comme Łódź, que nous écrivons simplement Lódz, parce que nous refusons les diacritiques sur les consonnes (une seule exception historique avec ñ pour certains mots espagnols).
[^] # Re: Grammalecte pour Word ? Français littéraire ou "web" ?
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 5.
Il faudrait faire un peu de nettoyage, mais on pourrait faire des extensions pour d’autres langues. Pas trop de boulot à faire pour Python, je pense, mais pour JavaScript, ce serait plus compliqué, attendu que rien n’est prêt pour ça.
Enfin, il faudrait quand même écrire des règles pour ces autres langues et c’est déjà en soi beaucoup de travail.
Non. Je ne sais même pas si on peut faire des extensions pour Word. Google n’a pas l’air de savoir de quoi je parle…
Avec beaucoup de temps et d’argent, tout est possible. Mais il n’y déjà pas grand-monde pour travailler sur le lexique… alors…
Avez-vous une idée du temps qu’il a fallu pour gérer la réforme, quelques milliers de graphies “seulement”?
[^] # Re: j'arrive pas sur Ulule
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.
Moi aussi, j’ai souvent des problèmes avec mon Firefox ultra-customisé quand je veux payer quelque chose. Le mieux que j’ai trouvé, c’est d’avoir un navigateur alternatif nu pour passer ces obstacles fâcheux. (Et encore, même comme ça, il arrive que ça ne fonctionne pas…)
[^] # Re: J'en connais un qui a oublié d'utilisé grammalecte
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.
Dans cette locution, “légion” est usuellement invariable. (Mais le pluriel est aussi parfois employé.)
Des tas d’exemples dans les livres: au singulier, au pluriel.
Quand Grammalecte détectait quelque chose, c’était un faux positif. ;)
[^] # Re: homophones
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.
Merci.
Dans ce fichier, on liste sur une ligne les mots qui ont une prononciation similaire, mais seulement ceux qui ont des lemmes différents. Par exemple, inutile de lister ronger, rongeait, rongé, rongez, etc. puisque ce sont tous des mots dérivés du lemme ronger.
Cette liste est utile pour le moteur de suggestions du correcteur.
Il n’est pas nécessaire de comprendre comment ça fonctionne en fait. Par la suite, lors de la compilation des données, cette liste est rassemblée en un dictionnaire qui pointe vers une liste d’ensembles, et les étiquettes grammaticales sont rassemblées pour qu’on puisse filtrer à la demande.
[^] # Re: un des
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3. Dernière modification le 13 juin 2017 à 01:41.
Voici ce qu’en dit le Bon Usage de Grevisse (la plus grosse référence en matière de grammaire). Je résume :
— l’accord au singulier est possible si le sens permet qu’on remplace “un” par “celui” (c’est bien ce sens que j’ai voulu donné à ma phrase) ;
— il est cependant remarqué que, même sans ce sens logique, l’accord au singulier est souvent fait (citations à l’appui) ;
— il est également mentionné que la construction au singulier était courante jusqu’au XVIIIᵉ siècle (et au-delà).
Comme il le dit lui-même : « les évolutions se font plus en fonction des sens plus que des formes ».
Dans ses exemples, il mélange deux cas : « un des [noms] qui » et « un de ceux qui ». Deux cas à mes yeux différents, mais qu’importe, le Grevisse signale aussi qu’il y a des exemples d’accord au singulier avec « un de ceux qui ».
[^] # Re: Super boulot !
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 5. Dernière modification le 12 juin 2017 à 08:41.
Je ne connaissais pas Brython, donc je n’ai pas d’avis sur la question pour l’instant. :)
J’ai essayé l’éditeur en ligne et je ne comprends pas ce que je lis.
Le code que j’exécute avec [Exécuter], il est lancé avec l’interpréteur Python ou JavaScript?
Quand je clique sur [> JavaScript], ça me renvoie systématiquement une erreur.
Par ailleurs, qu’en est-il des performances? Quelle la vitesse par rapport au script Python originel?
Grammalecte sollicite beaucoup de ressources, et s’exécute dans un processus séparé pour ne pas figer le navigateur.
[^] # Re: un des
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 5.
Ça peut aussi être “un”, comme l’attestent les liens de Benoît. Dans le premier, vous avez l’exemple: « un des chercheurs qui a été honoré pour ses travaux »…
J’ai écrit : « L’un des points auxquels je n’avais pas beaucoup réfléchi et qui m’a le plus surpris ». Ça ne me paraît pas semblable à la forme que vous évoquez. Il n’y a pas de « Pierre est » ou quoi que ce soit de similaire dans ma phrase.
Ce que j’ai voulu dire exactement, c’est : « le point, parmi tous ceux que j’ai dû traiter, auquel je n’avais pas beaucoup réfléchi et qui m’a le plus surpris, c’est blablabla. »
[^] # Re: un des
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 4. Dernière modification le 11 juin 2017 à 13:54.
Dans tous les cas, réfléchi reste au singulier, parce que un des points n’est pas COD mais COI. On réfléchit à quelque chose. On écrirait pareillement: ces points auxquels j’ai réfléchi.
Et c’est bien un seul point qui m’a surpris. Ici, il n’y a ni COD ni COI. Un des points est le sujet. Surprendre doit ici s’accorder avec “me”.
En revanche, il faudrait écrire auquel à la place de auxquels.
[^] # Re: un des
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 4.
Cette fois, il y a effectivement une erreur. Il faut mettre un “s”.
Et vous avez raison, impossible de savoir qui est vous, si c’est un vous de politesse ou non. Le correcteur ignore complètement ce cas-là.
En revanche, Grammalecte détectera l’erreur si vous écrivez: « Si la première campagne les a satisfait. »
Oui, difficile. Par exemple, pour les COD qui précèdent le «que» d’une proposition.
Avec, par exemple, les verbes que j’ai conjugué, Grammalecte voit l’erreur, mais si le COD est placé bien plus loin, Grammalecte va se tromper ou ne rien voir.
Par exemple, avec les ennemis de la république que nous avons enfermés, Grammalecte se trompe: il veut enfermer la république.
[^] # Re: homophones
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 2.
Fichier mis à jour. Merci.
[^] # Re: un des
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 4.
En fait, on accorde selon le sens désiré.
Il est systématique avec
un de ceux qui [verbe au pluriel]
et Grammalecte analyse ces cas-là.Malheureusement, on ne peut connaître le sens que veulent faire passer les gens.
Ici, on pourrait effectivement croire qu’il y a une erreur, mais en fait, j’euphémise… de tous les problèmes, celui-ci m’ennuie beaucoup.
[^] # Re: homophones
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.
La proximité phonétique n’est pas requise.
Le problème des wikis, c’est que leur format n’est vraiment pas commode à exploiter. Si quelqu’un s’y colle, je suis preneur, c’est peut-être plus simple maintenant qu’autrefois. Mais oui, idéalement, ça pourrait servir.
[^] # Re: homophones
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 2.
Merci pour les suggestions.
Non, on fait dans l’homophonie grossière. Les accents sont parfois prononcés différemment d’une région à l’autre. On associe même rail avec raye. J’envisage même d’y mettre des graphies semblables, comme darde et dard.
[^] # Re: homophones
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 4.
Bien vu. Corrigé.
C’est ce que je me dis souvent, mais je trouve régulièrement de nouvelles homophonies.
[^] # Re: et/est
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.
Une règle ne va pas suffire. :) Mais oui, il y a des cas gérables. Grammalecte a fait des progrès sur ces erreurs syntaxiques, mais le chemin est encore long.
[^] # Re: accord
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.
Oui, Grammalecte n’essaie même pas encore de corriger ce genre de choses.
[^] # Re: Il y a un mais !
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.
Il est fréquent que être et avoir soient considérés hors groupe, comme verbes auxiliaires. C’est d’ailleurs aussi mon choix.
Je constate que le Grevisse ne mentionne pas les groupes que nous connaissons. Peut-être parce que c’est belge?
Il est mentionné “quatre” classes de conjugaisons :
— 1ʳᵉ classe, les verbe en -er, comme aimer,
— 2ᵉ classe A, les verbes en -ir, comme finir,
— 2ᵉ classe B, les verbes en -ir, comme sentir,
— 3ᵉ classe, les verbes en -oir, comme recevoir,
— 4ᵉ classe, les verbe en -re, comme rendre.
Il est précisé en note de bas de page que c’est une longue tradition de répartir les verbes dans ces “quatre” classes, que les grammairiens se sont longtemps querellés sur les critères de classement des verbes, et qu’à force de disputes, beaucoup préfèrent s’en tenir à ces “quatre” classes traditionnelles.
[^] # Re: Super boulot !
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 7.
Le fichier est lu et mis en mémoire. Ce sont des données figées. Le graphe de mots est une structure binaire parcourue avec des opérateurs logiques.
Avec du temps, tout est envisageable. Pour l’instant, la compilation des données se fait à la création de l’extension, et je le fais uniquement lors des mises à jour du dictionnaire. Ça prend une minute sur ma machine. Donc, oui, on pourrait fusionner des dictionnaires, s’ils suivent le schéma suivant:
flexion lemme étiquettes
Il faut que les étiquettes concordent, sous peine d’égarer le correcteur grammatical. Il ne faut pas fusionner n’importe quoi, comme le dico français et anglais. Les étiquettes ne sont différentes.
Oui, ça fait partie des buts à long terme. Si tu as lu la campagne de financement, tu as dû voir qu’il y est fait mention de pouvoir mieux gérer le lexique. Il est vrai que je n’ai pas parlé de personnalisation de son dico, j’aurais pu, j’aurais peut-être dû, mais j’ai préféré éviter de trop promettre. Je n’y ai pas beaucoup réfléchi en fait.
Pour l’instant, c’est quand même possible, mais il faut que tu récupères les sources, tu édites le fichier
French.lex
dans le dossierlexicons
, tu ajoutes ce que tu veux et tu recompiles. La compilation est rapide. En quelques minutes, voire moins, c’est plié.Oui, c’est une idée que j’aurais dû creuser. Je vais y réfléchir. Bizarrement, j’avais classé la personnalisation dans les idées logistiques à remettre à beaucoup plus tard, mais ça mérite que je pèse à nouveau la question…
[^] # Re: Il y a un mais !
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 5.
Je ne le crois pas. Mais je ne vais pas discuter sans fin non plus, ça ne mène rien.
Non. La logique qui consiste à étiqueter V1 (1ᵉʳ groupe) en interne, elle se base avant toute chose sur l’infinitif et le participe passé. C’est commode de faire ainsi.
Mais ce n’est pas la logique interne qui dicte le choix dans le conjugueur et le lexicographe. Je n’ai qu’à mettre un if et la question est réglée. Ce n’est rien.
Seulement voilà, les raisons de mettre aller dans le 3ᵉ groupe me semblent futiles et contradictoires avec les faits.
Le 1ᵉʳ groupe contient des tas de verbes irréguliers dont le radical est modifié. C’est pourquoi, à mes yeux, le verbe aller y a sa place, comme tous les autres. Par ailleurs, comme il n’y a aucun lien quelconque entre aller et les verbes du 3ᵉ groupe (qui n’est pas un groupe «poubelle»), je ne vois pas de raison probante de l’y mettre. C’est tout.
Dans le fond, je ne crois pas que vous contesteriez cette décision si l’Académie classait elle aussi “aller” dans le 1ᵉʳ groupe. Je pense que vous cherchez à justifier un « c’est comme ça » établi par une habitude qui, à mon avis, n’a pas été beaucoup réfléchie.
[^] # Re: Dictionnaire hunspell
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 9.
Voilà, c’est fait.
[^] # Re: Dictionnaire hunspell
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 6.
Il y a un package Grammalecte en Python, mais effectivement le dictionnaire et son module ne sont pas fournis séparément.
Mais qu’importe, je vais ressusciter la version Hunspell d’autrefois. C’est juste une option de genèse des dicos.
[^] # Re: Dictionnaire hunspell
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 7.
Je peux fournir le dictionnaire Hunspell avec les étiquettes grammaticales. C’est même l’option par défaut de genèse des dictionnaires. Ce n’est pas un souci.
Je vais le faire bientôt.
[^] # Re: Il y a un mais !
Posté par Olivier . En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 7.
On n’est déjà pas d’accord ça. Les radicaux du 1ᵉʳ sont souvent modifiés. Sinon je n’aurais pas eu besoin d’autant de règles pour gérer ça.
La réforme de 1990 elle-même opère des transformations sur ces radicaux, un changement de la norme d’accentuation. Par exemple: célébrerais devient célèbrerait: https://fr.wiktionary.org/wiki/c%C3%A9l%C3%A9brerait
Même sans la réforme, plein de verbes fonctionnent ainsi: peler devient pèle, semer devient sème, etc.
La transformation d’un c en ç, d’un y en i, c’est aussi une modification du radical.
Vous ne me croyez apparemment pas. Donc voici les verbes irréguliers en -er selon le Robert:

Ils ont aussi décidé d’y mettre les verbes qui engendrent des sonorités inhabituelles, comme épier, à cause des formes comme épiions. C’est plus discutable, mais ce n’est pas le sujet.
Par ailleurs, le Bescherelle, le Larousse et bien d’autres (ici, ici, ici, ici, ici) considèrent envoyer comme un verbe du premier groupe.
Bref, comme je l’ai dit, en grammaire, l’unanimité n’a pas encore été trouvée.
Ce qui est discutable, ce n’est pas de bâtir autour d’expressions régulières. Ce qui est discutable, c’est de ne se baser que sur ça. J’en conviens, mais je suis parti d’une base existante qui avait fait ce choix, et il y a aussi des avantages. Je finirai par utiliser une autre approche, sans abandonner la première.
Car la tokenisation pose des tas de problèmes, tellement que LanguageTool a suivi il y a peu le chemin de Grammalecte en faisant de la reconnaissance d’erreurs par expressions régulières, mais je crois que c’est beaucoup limité que ce que je peux faire. Je me souviens par exemple que jusqu’à récemment, LT ne pouvait pas examiner des formes comme “pouvait-vous”. Je ne sais pas si le problème a été résolu.
J’ai déjà dit que j’avais fait ce choix avant de concevoir le correcteur. Mais je l’ai effectivement confirmé pour des raisons pratiques. J’ai deux raisons de suivre cette logique, pas une seule.