Il y a pas mal de temps, j'avais essayé d'installer Savannah (en utilisant les paquets debian) et j'avais pas mal galérer surtout que je n'avais aucune expérience de configuration des dépendances requises (MySQL, exim, mailman, ...)
D'un point de vue fonctionnel, LibreSource est beaucoup plus souple que Savane (à moins que ça ai vraiment beaucoup changé depuis que j'ai essayé ;)). LibreSource, c'est comme des Lego, tu assembles différents composants pour fabriquer "un espace collaboratif" qui te convient.
Cet "espace collaboratif" peut, par exemple, contenir les briques : pages Wikis, forums, bugtracker et outils de gestion de versions.
J'insiste sur le fait que ces composants tu les assembles avec tes petites mains avec une interface web (et pas en editant des fichiers de confs ou en codant des scripts). Ca permet a des gens pas forcément techos de faire du travail collaboratif (et oui, tout le monde ne code pas...).
Je viens de tester Kolab et à ma grande surprise, il est léger et réactif. Je travaille avec Lotus par contrainte et la différence est grande.
Lotus est lourd et pas du tout ergonomique (a mon goût) alors que Kolab est bien plus rapide et simple a utiliser.
Certes je n'utilise pas le dixème de ce que peut faire Lotus, mais je suis certains qu'au boulot Kolab pourrait très bien remplacer Lotus pour moi et mes collègues.
C'est vrai que faire annoter plusieurs fois la même phrase par des contributeurs différents est une bonne idée.
Pour générer un texte tu dois avoir une base de règles et un dictionnaire. Cette base de règles c'est précisement ce que l'on cherche a déterminer par apprentissage sur le corpus annoté.
Vous m'avez donner envie d'initier la construction de ce corpus, je suis en train de developper l'outil permettant aux contributeurs d'annoter des phrases, j'espere avoir le temps de le terminer rapidement.
J'espère que tu as raison, de toute façon on ne pourra le savoir qu'en experimentant. Quelqu'un a poster un lien sur Rosetta, je vais y jeter un oeil pour savoir si on peut l'utiliser ou l'adapter facilement pour ce genre de travaux.
Concernant le second corpus, les règles de grammaires étant déduites de celui-ci, il faut que les tournures de phrases du corpus d'apprentissage soient les mêmes que les tournures de phrases du textes à corriger.
Les auteurs classiques utilisent des tournures de phrases très particulièrent, très peu usités en nos temps modernes. Si l'apprentissage ne se fait que sur ce genre de texte, certaines des règles déduites pourront nous sembler bizarre.
Bien sur la plus part des règles les plus simples seront apprises (ex: "un verbe qui suit un groupe nominal masculin pluriel doit être conjugué à la troisième personne pluriel")
Une fois l'apprentissage effectué sur le corpus avec GRAC, il serait possible de détourner GRAC pour retrouver le corpus d'origine. Meme si le corpus n'est pas ouvert, la licence serait certainement très permissive.
J'avais eut cette idée de faire une interface web qui propose des phrases tirées de divers documents aléatoirement que chaque visiteur pourrait taggué pendant son temps libre :). Le problème est qu'il faut que cet ensemble de contributions soit sans aucune erreur, et il faudrait donc des relecteurs de "confiance".
La tache de relecture prend autant de temps que le fait d'étiquetter des phrases. C'est pour cela que j'ai abandonné cette idée.
En réalité la théorie se base sur 2 types de corpus: le premier dit "annoté" et le second qui se doit d'étre sans erreur de grammaire.
Un corpus annoté c'est un texte dont chaque mot doit étre annoté (taggué en franglais). Par exemple dans la phrase: "je suis une vache", le mot "suis" sera annoté par "verbe conjugué à la premiere personne du singulier", le mot "vache" par "nom commun singulier feminin", etc...
Le problème de la construction de corpus annoté est qu'il faut obligatoirement le faire à la main (en tout cas, on ne peut faire qu'une infime partie du travail automatiquement avec des règles simples propres a chaque langue). Les gens qui effectuent se genre de travail n'ont pas vraiment envie de le fournir à tout le monde et de l'ouvrir (et c'est bien dommage pour nous).
On espère avoir des nouvelles du LIMSI (www.limsi.fr) qui travaille sur le traitement du langage naturel et qui donc est susceptible d'être en possession de ce genre de corpus.
Pour le second corpus j'en écrirait un peu plus long demain quand j'aurais dormit et évacuer mes 3 grammes.
[^] # Re: a propos de jython
Posté par maxapoil . En réponse à la dépêche Cassandra, le logiciel de visualisation scientifique 3D utilise VTK 5.. Évalué à 2.
Une roadmap qui date du 3 février 2007:
http://www.jython.org/Project/roadmap.html
source: le blog d'un dev Jython:
http://fwierzbicki.blogspot.com/index.html
[^] # Re: pas mal comme soft
Posté par maxapoil . En réponse à la dépêche LibreSource passe en version 2.0. Évalué à 4.
En comparaison, LibreSource est beaucoup plus simple a installer, surtout depuis la mise en place de l'installateur (http://dev.libresource.org/home/community/downloads)
D'un point de vue fonctionnel, LibreSource est beaucoup plus souple que Savane (à moins que ça ai vraiment beaucoup changé depuis que j'ai essayé ;)). LibreSource, c'est comme des Lego, tu assembles différents composants pour fabriquer "un espace collaboratif" qui te convient.
Cet "espace collaboratif" peut, par exemple, contenir les briques : pages Wikis, forums, bugtracker et outils de gestion de versions.
J'insiste sur le fait que ces composants tu les assembles avec tes petites mains avec une interface web (et pas en editant des fichiers de confs ou en codant des scripts). Ca permet a des gens pas forcément techos de faire du travail collaboratif (et oui, tout le monde ne code pas...).
# Test de Kolab
Posté par maxapoil . En réponse à la dépêche Nouvelle version de Kolab Groupware. Évalué à 5.
Lotus est lourd et pas du tout ergonomique (a mon goût) alors que Kolab est bien plus rapide et simple a utiliser.
Certes je n'utilise pas le dixème de ce que peut faire Lotus, mais je suis certains qu'au boulot Kolab pourrait très bien remplacer Lotus pour moi et mes collègues.
[^] # Re: Miam
Posté par maxapoil . En réponse à la dépêche GRAC 0.1a : vérificateur grammatical. Évalué à 3.
Vous pouvez voir la tête de la bête ici: http://www.biais.org/ct
Si des gens on des idées pour le rendre plus agréables, les commentaires sont les bienvenues.
[^] # Re: Miam
Posté par maxapoil . En réponse à la dépêche GRAC 0.1a : vérificateur grammatical. Évalué à 1.
Pour générer un texte tu dois avoir une base de règles et un dictionnaire. Cette base de règles c'est précisement ce que l'on cherche a déterminer par apprentissage sur le corpus annoté.
Vous m'avez donner envie d'initier la construction de ce corpus, je suis en train de developper l'outil permettant aux contributeurs d'annoter des phrases, j'espere avoir le temps de le terminer rapidement.
[^] # Re: Miam
Posté par maxapoil . En réponse à la dépêche GRAC 0.1a : vérificateur grammatical. Évalué à 2.
[^] # Re: Oeuvres du domaine publique
Posté par maxapoil . En réponse à la dépêche GRAC 0.1a : vérificateur grammatical. Évalué à 1.
Les auteurs classiques utilisent des tournures de phrases très particulièrent, très peu usités en nos temps modernes. Si l'apprentissage ne se fait que sur ce genre de texte, certaines des règles déduites pourront nous sembler bizarre.
Bien sur la plus part des règles les plus simples seront apprises (ex: "un verbe qui suit un groupe nominal masculin pluriel doit être conjugué à la troisième personne pluriel")
[^] # Re: Oeuvres du domaine publique
Posté par maxapoil . En réponse à la dépêche GRAC 0.1a : vérificateur grammatical. Évalué à 2.
[^] # Re: Miam
Posté par maxapoil . En réponse à la dépêche GRAC 0.1a : vérificateur grammatical. Évalué à 3.
La tache de relecture prend autant de temps que le fait d'étiquetter des phrases. C'est pour cela que j'ai abandonné cette idée.
[^] # Re: Ce qu'on dit des cordonniers ...
Posté par maxapoil . En réponse à la dépêche GRAC 0.1a : vérificateur grammatical. Évalué à 3.
[^] # Re: Oeuvres du domaine publique
Posté par maxapoil . En réponse à la dépêche GRAC 0.1a : vérificateur grammatical. Évalué à 7.
Un corpus annoté c'est un texte dont chaque mot doit étre annoté (taggué en franglais). Par exemple dans la phrase: "je suis une vache", le mot "suis" sera annoté par "verbe conjugué à la premiere personne du singulier", le mot "vache" par "nom commun singulier feminin", etc...
Le problème de la construction de corpus annoté est qu'il faut obligatoirement le faire à la main (en tout cas, on ne peut faire qu'une infime partie du travail automatiquement avec des règles simples propres a chaque langue). Les gens qui effectuent se genre de travail n'ont pas vraiment envie de le fournir à tout le monde et de l'ouvrir (et c'est bien dommage pour nous).
On espère avoir des nouvelles du LIMSI (www.limsi.fr) qui travaille sur le traitement du langage naturel et qui donc est susceptible d'être en possession de ce genre de corpus.
Pour le second corpus j'en écrirait un peu plus long demain quand j'aurais dormit et évacuer mes 3 grammes.