Olivier a écrit 324 commentaires

[^] # Re: Tant mieux

Posté par Olivier le 29 juin 2017 à 19:38. En réponse au journal [HS] Bookmark déplacé : bronsonisation de T411 :<. Évalué à 7.

Je regrette l'époque où tout le monde était sur la mule, et se partageaient directement les fichiers sans intermédiaire. Là aussi on y trouvait des perles indisponibles légalement.

La mule, elle existe toujours, et elle ne se porte pas si mal, même s’il y a moins de monde qu’avant (encore que c’est difficile d’en juger avec le réseau décentralisé Kadmelia).

Ce n’est plus du tout comme il y a 10 ans, et si ce n’est toujours pas aussi rapide que BitTorrent, c’est quand même bien plus véloce qu’autrefois, notamment parce que pas mal de gens ont la fibre.
[^] # Re: Ressources utiles

Posté par Olivier le 20 juin 2017 à 06:56. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 4.

Merci pour les liens.

Sequoia sera sans doute utile en effet.

Grew est intéressant, mais ça ne peut pas servir tel quel: c’est du Ocaml et rien n’est apparemment prévu pour Windows.

La première chose que je lui ai donnée, c’est une aberration grammaticale comme on peut en voir, pas une jolie phrase bien formée. Parce que le boulot de Grammalecte, ce n’est pas de sortir une analyse de texte décrivant à quoi correspond les éléments, mais de détecter les anomalies. J’imagine que Grew part du principe qu’une phrase est (à peu près) correctement formée et que les erreurs potentielles sont des raretés. En cas d’aberration, ça envoie juste une analyse brute des mots, mais on ne peut pas le lui reprocher, ce n’est pas ce pour quoi ça a été fait.

Grammalecte dispose aussi à présent d’un moyen d’étiqueter les mots absents du dictionnaire, mais c’est une fonctionnalité encore peu utilisée.
[^] # Re: Règles Wikipédia

Posté par Olivier le 18 juin 2017 à 14:59. En réponse au journal Enquête sur les noms propres pour le dictionnaire orthographique. Évalué à 3.

si un jour vous vous retrouvez en Pologne à demander votre chemin

Comme avec Varsovie et bien d’autres mots locaux… comme dans de nombreux pays du monde…

La question n’est pas de savoir si c’est correct ou non. La question, c’est le degré de rigorisme qu’on impose.

L’apostrophe droite est incorrecte. Pourtant, le correcteur orthographique la tolère et ne dit rien. On devrait l’imposer, mais on ne le fait pas… A-t-on raison ou tort ?

Toutes ces décisions ont été prises il y a très longtemps. Certaines ont été prises par ceux qui se sont occupés du dictionnaire avant moi. À l’époque où il y avait pas mal de contributeurs au dictionnaire, personne n’a remis ce point en cause. On aurait peut-être dû. Ou peut-être pas.

D’un côté, il y a les rigoristes. De l’autre, il y a des gens qui veulent tout simplifier à l’extrême. Et il y a ceux qui se foutent de tout. Et quoi qu’on fasse, il en aura toujours pour vous dire que vous êtes dans l’erreur. Nous sommes trop rigoristes pour les uns, pas assez pour les autres.

À l’époque où j’ai commencé, l’UTF-8 n’était pas aussi utilisé que maintenant (le dico était en Latin-1), et de mémoire Wikipédia n’a pas toujours été aussi si pointilleux sur les toponymes. La situation a beaucoup changé depuis lors.

On pourrait passer en revue toutes entrées du dictionnaire et imposer les graphies savantes pour Łódź, Chișinău et des tas d’autres villes. Je ne suis pas certain que ce serait très apprécié cependant…

Si j’avais pensé à ce point, je l’aurais inclus dans mon questionnaire.
[^] # Re: Pas très clair.

Posté par Olivier le 17 juin 2017 à 23:38. En réponse au journal Enquête sur les noms propres pour le dictionnaire orthographique. Évalué à 10.

En effet, ce n’est pas très clair.

Beaucoup de logiciels libres et quelques logiciels non libres utilisent le même correcteur orthographique appelé Hunspell. C’est pourquoi, tous ces logiciels utilisent aussi les mêmes dictionnaires orthographiques.  Ce sont ces dictionnaires qu’on trouve dans les distributions Linux, en général en vrac dans un répertoire commun appelé hunspell, dictionaries ou myspell, me semble-t-il. (Myspell est simplement l’ancêtre de Hunspell.)

Bref, ce correcteur et ces dictionnaires sont utilisés par Firefox, Thunderbird, LibreOffice, Chrome et des tas d’autres logiciels¹, y compris des poids lourds comme InDesign ou des petits logiciels comme WriteMonkey (un logiciel pour écrivain)…

Hunspell est une librairie très utilisée. Et comme je suis celui qui gère le dictionnaire français pour Hunspell, je demande votre avis.

¹ Cette liste n’est pas exhaustive.
[^] # Re: Règles Wikipédia

Posté par Olivier le 17 juin 2017 à 18:04. En réponse au journal Enquête sur les noms propres pour le dictionnaire orthographique. Évalué à 6.

la graphie officielle

Les villes étrangères sont souvent renommées en France.
[^] # Re: Règles Wikipédia

Posté par Olivier le 17 juin 2017 à 17:36. En réponse au journal Enquête sur les noms propres pour le dictionnaire orthographique. Évalué à 10.

Par simple réalisme.

Pour la même raison qui fait qu’on écrit plus souvent Dvorak ou Dvorák que Dvořák.
Pour la même raison qu’on n’écrit pas les mots russes en caractères cyrilliques.
99 % des gens n’ont simplement pas les outils adéquats. S’ils les avaient, on réviserait ce choix.

Il est déjà difficile de faire accepter les apostrophes typographiques (que Wikipédia n’a pas voulu imposer, soit dit en passant) et les majuscules accentuées bien de chez nous. Alors, ça, bonne chance.

Mais oui, idéalement… c’est ce qu’il faudrait faire. À moins de considérer que l’appropriation et la simplification des graphies étrangères soit une chose normale, voire souhaitable.

Vous dites bien Londres et Francfort(-sur-le-Main), et non London et Frankfurt( am Main), n’est-ce pas ?
[^] # Re: Règles Wikipédia

Posté par Olivier le 17 juin 2017 à 16:38. En réponse au journal Enquête sur les noms propres pour le dictionnaire orthographique. Évalué à 3. Dernière modification le 17 juin 2017 à 16:38.

Adopter les mêmes règles permettrait de remplir automatiquement le dico en se basant sur les pages présentes dans l'encyclopédie.

Non. Ils acceptent bien trop de choses pour nous. On remplirait le dictionnaire avec des dizaines ou des centaines de milliers d’entrées. Par ailleurs, Wikipédia ne recense même pas les noms communs, ce n’est pas un dictionnaire. Pas le même but.

Enfin, leur titres utilisent souvent des graphies trop savantes comme Łódź, que nous écrivons simplement Lódz, parce que nous refusons les diacritiques sur les consonnes (une seule exception historique avec ñ pour certains mots espagnols).
[^] # Re: Grammalecte pour Word ? Français littéraire ou "web" ?

Posté par Olivier le 15 juin 2017 à 16:30. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 5.

Ce moteur peut-il servir facilement à générer d’autres extensions ?

Il faudrait faire un peu de nettoyage, mais on pourrait faire des extensions pour d’autres langues. Pas trop de boulot à faire pour Python, je pense, mais pour JavaScript, ce serait plus compliqué, attendu que rien n’est prêt pour ça.
Enfin, il faudrait quand même écrire des règles pour ces autres langues et c’est déjà en soi beaucoup de travail.

Penses-tu te pencher dans le futur sur la création d’une extension pour Word ?

Non. Je ne sais même pas si on peut faire des extensions pour Word. Google n’a pas l’air de savoir de quoi je parle…

De la même manière que nous avons accès dans les configurations à l’ancienne ou à la nouvelle orthographe, n’y aurait-il pas possibilité de choisir « Français étendu (avec néologismes) » ?

Avec beaucoup de temps et d’argent, tout est possible. Mais il n’y déjà pas grand-monde pour travailler sur le lexique… alors…
Avez-vous une idée du temps qu’il a fallu pour gérer la réforme, quelques milliers de graphies “seulement”?
[^] # Re: j'arrive pas sur Ulule

Posté par Olivier le 14 juin 2017 à 15:48. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.

Moi aussi, j’ai souvent des problèmes avec mon Firefox ultra-customisé quand je veux payer quelque chose. Le mieux que j’ai trouvé, c’est d’avoir un navigateur alternatif nu pour passer ces obstacles fâcheux. (Et encore, même comme ça, il arrive que ça ne fonctionne pas…)
[^] # Re: J'en connais un qui a oublié d'utilisé grammalecte

Posté par Olivier le 14 juin 2017 à 15:41. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.

Dans cette locution, “légion” est usuellement invariable. (Mais le pluriel est aussi parfois employé.)

Des tas d’exemples dans les livres: au singulier, au pluriel.

Quand Grammalecte détectait quelque chose, c’était un faux positif. ;)
[^] # Re: homophones

Posté par Olivier le 14 juin 2017 à 09:48. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.

Merci.

comment cela fonctionne-t-il ??? un petit texte explicatif ? un lien ?

Dans ce fichier, on liste sur une ligne les mots qui ont une prononciation similaire, mais seulement ceux qui ont des lemmes différents. Par exemple, inutile de lister ronger, rongeait, rongé, rongez, etc. puisque ce sont tous des mots dérivés du lemme ronger.

Cette liste est utile pour le moteur de suggestions du correcteur.

Il n’est pas nécessaire de comprendre comment ça fonctionne en fait. Par la suite, lors de la compilation des données, cette liste est rassemblée en un dictionnaire qui pointe vers une liste d’ensembles, et les étiquettes grammaticales sont rassemblées pour qu’on puisse filtrer à la demande.
[^] # Re: un des

Posté par Olivier le 13 juin 2017 à 01:39. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3. Dernière modification le 13 juin 2017 à 01:41.

Voici ce qu’en dit le Bon Usage de Grevisse (la plus grosse référence en matière de grammaire). Je résume :
— l’accord au singulier est possible si le sens permet qu’on remplace “un” par “celui” (c’est bien ce sens que j’ai voulu donné à ma phrase) ;
— il est cependant remarqué que, même sans ce sens logique, l’accord au singulier est souvent fait (citations à l’appui) ;
— il est également mentionné que la construction au singulier était courante jusqu’au XVIIIᵉ siècle (et au-delà).

Voici ce qu'en disait Claude Hagège

Comme il le dit lui-même : « les évolutions se font plus en fonction des sens plus que des formes ».

Dans ses exemples, il mélange deux cas : « un des [noms] qui » et « un de ceux qui ». Deux cas à mes yeux différents, mais qu’importe, le Grevisse signale aussi qu’il y a des exemples d’accord au singulier avec « un de ceux qui ».
[^] # Re: Super boulot !

Posté par Olivier le 12 juin 2017 à 08:39. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 5. Dernière modification le 12 juin 2017 à 08:41.

Je ne connaissais pas Brython, donc je n’ai pas d’avis sur la question pour l’instant. :)

J’ai essayé l’éditeur en ligne et je ne comprends pas ce que je lis.
Le code que j’exécute avec [Exécuter], il est lancé avec l’interpréteur Python ou JavaScript?

Quand je clique sur [> JavaScript], ça me renvoie systématiquement une erreur.

Par ailleurs, qu’en est-il des performances? Quelle la vitesse par rapport au script Python originel?

Grammalecte sollicite beaucoup de ressources, et s’exécute dans un processus séparé pour ne pas figer le navigateur.
[^] # Re: un des

Posté par Olivier le 11 juin 2017 à 16:24. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 5.

En effet, si on écrit, pour simplifier, "un des points qui m'[avoir] surpris est le fait de…", le sujet du verbe "avoir" est "des points" (on écrit donc "ont") et le sujet du verbe "être" est "un des points qui m'ont surpris" (singulier). Le pronom "qui" se rapportent à "points".

Ça peut aussi être “un”, comme l’attestent les liens de Benoît. Dans le premier, vous avez l’exemple: « un des chercheurs qui a été honoré pour ses travaux »…

je vois mal comment on peut défendre la forme "Pierre est un des élèves qui est venu", qui est semblable aux formes que vous défendez.

J’ai écrit : « L’un des points auxquels je n’avais pas beaucoup réfléchi et qui m’a le plus surpris ». Ça ne me paraît pas semblable à la forme que vous évoquez. Il n’y a pas de « Pierre est » ou quoi que ce soit de similaire dans ma phrase.

Ce que j’ai voulu dire exactement, c’est : « le point, parmi tous ceux que j’ai dû traiter, auquel je n’avais pas beaucoup réfléchi et qui m’a le plus surpris, c’est blablabla. »
[^] # Re: un des

Posté par Olivier le 11 juin 2017 à 13:53. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 4. Dernière modification le 11 juin 2017 à 13:54.

Dans tous les cas, réfléchi reste au singulier, parce que un des points n’est pas COD mais COI. On réfléchit à quelque chose. On écrirait pareillement: ces points auxquels j’ai réfléchi.

Et c’est bien un seul point qui m’a surpris. Ici, il n’y a ni COD ni COI. Un des points est le sujet. Surprendre doit ici s’accorder avec “me”.

En revanche, il faudrait écrire auquel à la place de auxquels.
[^] # Re: un des

Posté par Olivier le 11 juin 2017 à 13:40. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 4.

Si la première campagne vous a satisfait

Cette fois, il y a effectivement une erreur. Il faut mettre un “s”.
Et vous avez raison, impossible de savoir qui est vous, si c’est un vous de politesse ou non. Le correcteur ignore complètement ce cas-là.

En revanche, Grammalecte détectera l’erreur si vous écrivez: « Si la première campagne les a satisfait. »

L'accord du participe passé est-il difficile à traiter, en général ?

Oui, difficile. Par exemple, pour les COD qui précèdent le «que» d’une proposition.

Avec, par exemple, les verbes que j’ai conjugué, Grammalecte voit l’erreur, mais si le COD est placé bien plus loin, Grammalecte va se tromper ou ne rien voir.

Par exemple, avec les ennemis de la république que nous avons enfermés, Grammalecte se trompe: il veut enfermer la république.
[^] # Re: homophones

Posté par Olivier le 11 juin 2017 à 13:12. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 2.

Fichier mis à jour. Merci.
[^] # Re: un des

Posté par Olivier le 11 juin 2017 à 13:05. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 4.

un des [nom] qui + [verbe au pluriel].

En fait, on accorde selon le sens désiré.
Il est systématique avec un de ceux qui [verbe au pluriel] et Grammalecte analyse ces cas-là.

Je ne sais pas si ce genre de choses est facile à détecter pour Grammalecte.

Malheureusement, on ne peut connaître le sens que veulent faire passer les gens.

L’un des problèmes qui m’ennuie assez

Ici, on pourrait effectivement croire qu’il y a une erreur, mais en fait, j’euphémise… de tous les problèmes, celui-ci m’ennuie beaucoup.
[^] # Re: homophones

Posté par Olivier le 11 juin 2017 à 12:58. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.

La proximité phonétique n’est pas requise.

Wiktionary

Le problème des wikis, c’est que leur format n’est vraiment pas commode à exploiter. Si quelqu’un s’y colle, je suis preneur, c’est peut-être plus simple maintenant qu’autrefois. Mais oui, idéalement, ça pourrait servir.
[^] # Re: homophones

Posté par Olivier le 11 juin 2017 à 12:43. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 2.

Merci pour les suggestions.

Dans cette liste, il n'y a pas de distinction entre é et è ? poignée (pwaɲe) / poignet (pwaɲɛ)

Non, on fait dans l’homophonie grossière. Les accents sont parfois prononcés différemment d’une région à l’autre. On associe même rail avec raye. J’envisage même d’y mettre des graphies semblables, comme darde et dard.
[^] # Re: homophones

Posté par Olivier le 11 juin 2017 à 11:27. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 4.

je suggère ici l'ajout de "lissée / lycée / etc."

Bien vu. Corrigé.

il me semble que la liste est quasi complète

C’est ce que je me dis souvent, mais je trouve régulièrement de nouvelles homophonies.
[^] # Re: et/est

Posté par Olivier le 11 juin 2017 à 10:21. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.

Une règle ne va pas suffire. :) Mais oui, il y a des cas gérables. Grammalecte a fait des progrès sur ces erreurs syntaxiques, mais le chemin est encore long.
[^] # Re: accord

Posté par Olivier le 11 juin 2017 à 10:18. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.

Oui, Grammalecte n’essaie même pas encore de corriger ce genre de choses.
[^] # Re: Il y a un mais !

Posté par Olivier le 10 juin 2017 à 16:49. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 3.

Il est fréquent que être et avoir soient considérés hors groupe, comme verbes auxiliaires. C’est d’ailleurs aussi mon choix.

Je constate que le Grevisse ne mentionne pas les groupes que nous connaissons. Peut-être parce que c’est belge?

Il est mentionné “quatre” classes de conjugaisons :
— 1ʳᵉ classe, les verbe en -er, comme aimer,
— 2ᵉ classe A, les verbes en -ir, comme finir,
— 2ᵉ classe B, les verbes en -ir, comme sentir,
— 3ᵉ classe, les verbes en -oir, comme recevoir,
— 4ᵉ classe, les verbe en -re, comme rendre.

Il est précisé en note de bas de page que c’est une longue tradition de répartir les verbes dans ces “quatre” classes, que les grammairiens se sont longtemps querellés sur les critères de classement des verbes, et qu’à force de disputes, beaucoup préfèrent s’en tenir à ces “quatre” classes traditionnelles.
[^] # Re: Super boulot !

Posté par Olivier le 10 juin 2017 à 16:25. En réponse à la dépêche Grammalecte, correcteur grammatical [2]. Évalué à 7.

Dans ton moteur tu le charges en mémoire ou tu vas lire le dictionnaire sur le disque ?

Le fichier est lu et mis en mémoire. Ce sont des données figées. Le graphe de mots est une structure binaire parcourue avec des opérateurs logiques.

Peux-tu envisager une fusion-compilation de plusieurs dictionnaires (à la volée en fonction d'une option) avant d'entamer l'analyse proprement dite ?

Avec du temps, tout est envisageable. Pour l’instant, la compilation des données se fait à la création de l’extension, et je le fais uniquement lors des mises à jour du dictionnaire. Ça prend une minute sur ma machine. Donc, oui, on pourrait fusionner des dictionnaires, s’ils suivent le schéma suivant:
flexion lemme étiquettes
Il faut que les étiquettes concordent, sous peine d’égarer le correcteur grammatical. Il ne faut pas fusionner n’importe quoi, comme le dico français et anglais. Les étiquettes ne sont différentes.

se joue la possibilité pour l'utilisateur de personnaliser son dictionnaire en fonction de ses besoins

Oui, ça fait partie des buts à long terme. Si tu as lu la campagne de financement, tu as dû voir qu’il y est fait mention de pouvoir mieux gérer le lexique. Il est vrai que je n’ai pas parlé de personnalisation de son dico, j’aurais pu, j’aurais peut-être dû, mais j’ai préféré éviter de trop promettre. Je n’y ai pas beaucoup réfléchi en fait.

Pour l’instant, c’est quand même possible, mais il faut que tu récupères les sources, tu édites le fichier French.lex dans le dossier lexicons, tu ajoutes ce que tu veux et tu recompiles. La compilation est rapide. En quelques minutes, voire moins, c’est plié.

la gestion de dictionnaires multiples chacun arbitrera pour lui-même car, comme tu le dis, sur ces questions « ça dépend des personnes ».

Oui, c’est une idée que j’aurais dû creuser. Je vais y réfléchir. Bizarrement, j’avais classé la personnalisation dans les idées logistiques à remettre à beaucoup plus tard, mais ça mérite que je pèse à nouveau la question…