La chaîne cyberthèse va passer au libre

Posté par  . Modéré par Fabien Penso.
Étiquettes :
0
20
mar.
2002
Communauté
Tout d'abord un petit résumé : la chaîne cyberthèse est un projet commun de l'université Lumière-Lyon2 et les presses de l'Université de Montréal, elle a pour but de permettre aux auteurs de thèses de mettre en ligne leur pavé de facon simple. Cette chaîne est d'accès libre aussi bien en consultation qu'en utilisation -il suffit de faire une demande d'ouverture d'accès pour déposer votre thèse et réaliser les traitements pour la mise en ligne-.
Techniquement, lorsque vous avez un compte ouvert, vous pouvez y uploader sur le serveur votre document au format RTF, celui ci traverse certaines étapes -que vous controllez- où il est transformé en XML respectant une DTD particulière pour les publications en sciences humaines à la base, la TeiXlite, puis des étapes de validation de la structure et autre. Le document obtenu peut ensuite être transformé en SGML, HTML et autre suivant des règles de transformation pour un parcours aisé sur un navigateur. Il faut savoir que pour chaque étape, vous avez un rapport d'erreurs -ou non-, et que vous pouvez télécharger le document à chacune des étapes.


Update du modérateur: la nouvelle a été coupée. En effet elle donnait des informations qui sont pour l'instant confidentielles, et qui pourraient compromettre le projet. Nous vous tiendrons informés sur la suite des évenements, dès qu'on pourra communiquer dessus.

Aller plus loin

  • # petit rajout

    Posté par  . Évalué à 4.

  • # Et TeX ?

    Posté par  (site web personnel) . Évalué à 6.

    On peut pas uploader sa thèse au format (La)TeX ? En sciences humaines je sais pas, mais généralement, les thésards en math/info utilisent souvent (La)TeX...
    • [^] # Commentaire supprimé

      Posté par  . Évalué à -7.

      Ce commentaire a été supprimé par l’équipe de modération.

    • [^] # Re: Et TeX ?

      Posté par  . Évalué à 10.

      Si tu suis le lien << presentation de la chaine >>, il semblerait que le but est de prendre pleins de types de fichiers d'entree differents.

      Le lien [1] semble confirmer cela egalement.

      [1] http://mirror-fr.cybertheses.org/ressources.html#chaine(...)
      • [^] # Re: Et TeX ?

        Posté par  (site web personnel) . Évalué à 5.

        Ben le fonctionnement précédent, avec Omnimark, semble bien proposer TeX en entrée... mais actuellement j'ai l'impression qu'il n'y a que Word/SOffice en entrée. Enfin j'imagine qu'ils adapteront leurs scripts pour accepter du TeX.
        • [^] # Re: Et TeX ?

          Posté par  . Évalué à 10.

          Bonjour,
          je me présente, vivi, actuelle "responsable des développements de CyberThèses", du serveur, de l'assistance aux utilisateurs, accessoirement auteur d'une bonne partie du code...
          Eh oui, TeX... On l'a prévu, c'est pour cela qu'il apparait dans le petit schéma cité plus haut. Le problème est que je bosse dans une université de sciences humaines, que sur les 150 thèses qui passent à travers la chaine ici chaque année, une seule est en TeX, les autres sont toutes déposées par leurs auteurs sous un format de type RTF. Donc de mon coté, les dvpt teX ne sont pas à l'ordre du jour...
          des volontaires ? :)
          A+
          vivi
          • [^] # Re: Et TeX ?

            Posté par  . Évalué à 1.

            Ben justement moi je suis en pleine thèse d'histoire à Lyon2 et je la prépare avec LyX (donc TeX). Ça t'en fera une de plus à traiter si jamais j'arrive au bout.
  • # libre ?

    Posté par  . Évalué à 7.

    il était basé sur Omnimark qui jusqu'à début 2001 était libre -pas GPL ni open source, mais comme Blender, gratuit d'utilisation-.

    Libre mais pas open source c'est un peu dure... Je pense qu'il y a une petite bourde dans la phrase.

    Si c'est libre, alors c'est de fait gratuit et opensource, mais la reciproque n'est pas forcemment vraie.
    La GPL est *une* license libre, donc, un produit GPL est en consequence gratuit et ses sources sont ouvertes.
    • [^] # Re: libre ?

      Posté par  (site web personnel) . Évalué à 7.

      Un produit GPL n'est pas nécessairement gratuit.
      Une boîte peut vendre un produit à ses clients lesquels clients ne sont pas obligés de rediffuser le produit.
      Dans ce cas, les sources ne sont pas non plus disponibles, sauf pour les clients. Dans tous les cas, la GPL oblige de fournir les sources aux utilisateurs/clients, pas à tout le monde.
      • [^] # Re: libre ?

        Posté par  . Évalué à 3.

        ouais, à mon avis c'est vachement plus simple :

        si tu distribues un truc en GPL :

        - tu le fait payer ou pas (même si t'es pas l'auteur)
        - tu ne dois fournir les sources que si quelqu'un te les demande.
        - copyleft !

        évidemment les gens qui récupérent un truc GPLed ne sont pas obligés de le diffuser, mais si il veulent le faire, ils peuvent vendre le truc encore plus cher qu'ils l'ont acheté. et ils doivent aussi fournir les sources sur demande.

        Quelqu'un peut toujours choisir à qui il va distribuer le logiciel. Mais si le logiciel est disponible, alors les sources sont disponibles (sur demande ou directement, au choix du distributeur).

        si tu a le logiciel GPLed et que tu veux les sources, tu dois pouvoir les avoir, que tu sois client, utilisateur ou un porc savant.
    • [^] # Re: libre ?

      Posté par  . Évalué à 4.

      Si c'est juste gratuit d'utilisation ca n'est pas libre. La phrase est un peu dure a comprendre et semble melanger un peu tout.
    • [^] # Re: libre ?

      Posté par  . Évalué à -9.

      j'ai dit libre pas GPL donc c a toi de ne pas confondre c libre d'uitlisation comme blender l'etait
      • [^] # Re: libre ?

        Posté par  . Évalué à 1.

        Dans ce cas il aurait ete preferable que tu utilises "libre d'utilisation" ou meme mieux freeware ou meme "gratuit" que de dire libre. Que ce soit libre au sens fsf (donc pas seulement GPL qui elle en plus d'etre libre est copyleft) ou opensource c'est ok sinon ca n'a rien de libre et tout du moins ne fait que semer un gros doute inutile.
      • [^] # Re: libre ?

        Posté par  . Évalué à 1.

        Quand on parle de logiciel libre sur un site parlant de linux, il faut s'attendre à ce que les lecteurs comprennent libre au sens de liberté d'utilisation, de modif et de distribution (j'en ai oublié une non ?), et non pas simplement d'utilisation.

        D'ailleurs en général, tu ne dis pas que tu es libre simplement parce que tu peux écrire librement sur le papier que tu mets dans la boite à la mairie (waw, c'est limite subversif ce que je dis ! :) )
      • [^] # Re: libre ?

        Posté par  . Évalué à 5.

        j'ai dit libre pas GPL donc c a toi de ne pas confondre c libre d'uitlisation comme blender l'etait


        Et bien, je ne vois pas coment ne pas confondre : tu dis "libre" et tu penses "libre d'utilisation". Tu dis "libre comme Blender l'était" alors que Blender n'était pas libre...

        Comprends-tu pourquoi nous ne comprenons pas ? ;-)
    • [^] # Re: libre ?

      Posté par  . Évalué à 4.

      omnimark n'a jamais été open source, et encore moins sous licence GPL. Le binaire a simplement été distribué gratuitement pendant une courte période, pour essayer de créer une communauté d'utilisateurs, mais cela n'a pas marché donc ils sont revenus à un modèle économique + classique, càd payant
      • [^] # Re: libre ?

        Posté par  . Évalué à 4.

        Non, Omnimark n'a jamais été OpenSource (c'est bête, parce que c'est vraiment un langage génial).
        Il y a quelques années, le produit avait un tarif très intéressant pour les universités, puis est même devenu totalement gratuit.
        La société a changé sa politique commerciale. D'où notre souhait de passer à du complètement libre pour CyberThèses.
        A+
        Vivi
  • # MatLab

    Posté par  . Évalué à -3.

    MatLab c'est pas libre et y'a pas de 'h' dedans.
    Scilab (inria) c'est mieux (polynômes [X], fractions rationelles ...), c'est libre et mon pote il bosse dessus (projet SIMPA)

    -1 ça trolle
    • [^] # Re: MatLab

      Posté par  (site web personnel) . Évalué à -4.

      Tiens je croyais que SIMPA c'était un truc pour gérer des mailing lists, comme mailman mais en moins bien.

      [-1 c'est plus du troll là]
    • [^] # Re: MatLab

      Posté par  . Évalué à 3.

      Nan. Il y a une confusion. Il s'agit très certainement de MathML (DTD pour les équations mathématiques), pas de Matlab.
      Et dire que Scilab est _mieux_ que Matlab ça se discute. Sinon en passant ya Octave aussi en clone de Matlab.
      • [^] # Re: MatLab

        Posté par  . Évalué à 4.

        Tout à fait, c'est bien de MathMl qu'il s'agit
      • [^] # Re: MatLab

        Posté par  . Évalué à -1.

        J'ai pas pour habitude qu'on discute ce que je dis !

        -1 décideur pressé qui va monter en charge.
  • # TeX ?

    Posté par  . Évalué à -2.

    Euh... Qui n'utilise pas TeX pour faire sa thèse ? Je n'aurais jamais l'idée de taper ma thèse en rtf !!!
    • [^] # Re: TeX ?

      Posté par  . Évalué à 7.

      A mon avis sans support de TeX/LaTeX, le projet peut faire une croix sur les theses de mathematiques et informatiques et meme plus generalement sur les sciences dures. Les matheux et informateux que je connais utilisent tous TeX et LaTeX. Mais pour supporter TeX et LaTeX, il faut que leur DTD soit assez expressive pour permettre un une conversion correcte.

      ps1: sur le premier lien http://theses.univ-lyon2.fr/index.html(...) dans outil pour la redaction, ils conseillent Word97, Word98 et StarOffice :-(
      • [^] # Re: TeX ?

        Posté par  . Évalué à 6.

        deux choses : ils conseillent pas word et autre mais fournissent des modeles pour ces logiciels, de plus je rapelle a la base que les litérraires utilisent plutot les 3 produits cité plus haut que tex ou latex.
        expressive une dtd: si c'est de compexité de la description est des tags la version lite de la TEI fait plus de 128 pages de tags ecrit tout petit petit
        • [^] # Re: TeX ?

          Posté par  . Évalué à -2.

          Bon pour Word, ok je disais juste que c'est dommage d'avoir fait un style Word et pas de classe LaTex c'etait juste l'esprit de ma remarque. La disponibilite de style pour ces logiciels proprietaires encouragent a les utiliser c'est tout.

          Pour l'expressivite je ne parle pas de la complexite (complexite pour decrire certaines choses) mais de ce que le langage permet reelement de decrire, donc oui des tags. Pour les mathematiciens et informaticiens, est il possible par exemple de décrire la structuration d'une formule mathematique ou celle d'un algorithme ?
          • [^] # Re: TeX ?

            Posté par  . Évalué à 1.

            Oui, il existe dans la TEI un élément formule dans lequel on peut coller à peu près n'importe quoi sous réserve d'avoir précisé le format de codage. D'autre part, en passant à la version XML de la TEI (notre objectif), via les schémas : plus de soucis.
            Ceci dit, il faut bien voir que CyberThèse repose sur la DTD TEI, qui est nettement orientée SHS, et que ça n'est pas nécessairement la DTD idéale pour représenter un document de sciences dures :)
      • [^] # On oublie les DTD ! Hop !

        Posté par  . Évalué à 6.

        Les DTD sont obsoletes. Elles ne sont pas assez expressives de toutes facons.
        On utilise des Schemas maintenant[1].

        [1] http://www.w3.org/XML/Schema(...)
      • [^] # Re: TeX ?

        Posté par  . Évalué à 8.

        Oui, TeX/LateX est un outil de production de thèses très utilisé en Maths, Physique et info. C'est à dire, les sciences "très dures". Les sciences "semi dures" (bio, chimie, etc) l'utilisent déjà nettement moins, les "sciences molles" pas du tout :)
        L'ajout de l'entrée TeX/LateX à la chaine CyberThèses serait génial, et ne pose pas, a priori, de problème puisque si ces langages sont utilisés correctement, on a déjà un document structuré.
        Yapluka, mais compte tenu : 1)des forces de l'équipe de développeurs de CyberThèses (2 mimines ici présentes), 2) du champs disciplinaire de leur institution de rattachement (SHS), il n'y a pas de raison que l'on se consacre à ce genre de développements : si les institutions concernées souhaitent valoriser leurs travaux de recherches menées en maths et info... eh bien ... qu'elles s'y collent ! ;) Leur contribution sera vivement appréciée.

        Réponse au PS1 :
        Nan !!!! on ne conseille pas !!!!!
        On fournit à nos utilisateurs (doctorants dans une université de SHS) les modèles de documents qui collent avec les outils qu'ils utilisent habituellement ! c'est très différent ! Si ça ne tenait qu'à moi ... je ne proposerais que les modèles pour StarOffice ou OpenOffice ! ;)
        • [^] # Re: TeX ?

          Posté par  . Évalué à 4.

          Il est faux d'affirmer que "L'ajout de l'entrée TeX/LateX ne pose pas, a priori, de problème puisque si ces langages sont utilisés correctement, on a déjà un document structuré".

          Car quelqu'un qui utilise TeX correctement risque de ne pas adopter la structure "standard" d'un document LaTeX, par exemple en redéfinissant certaines des macros couremment utilisées pour le structurer. Il existe de nombreux programmes pour convertir du LaTeX en HTML : aucun ne marche sur mes fichiers.

          Le logiciel de conversion le plus satisfaisant (pour les gens autour de moi) est tex4ht (http://www.cis.ohio-state.edu/~gurari/TeX4ht/mn.html(...) ). Je crois qu'il peut aussi produire du XML avec MathML.
          • [^] # Re: TeX ?

            Posté par  . Évalué à 5.

            Je précise ma pensée :
            il est a priori nettement plus simple de convertir du TeX/LateX vers un format structuré de type SGML/XML que du RTF qui est quand même passablement linéaire voire destructuré.
            Au début de CyberThèses, nous avons étudié cette possibilité, nous nous sommes vite rendu compte que
            - d'une part les utilisateurs de LateX avaient déjà leurs propres modèles (classes) et n'étaient pas du tout prêts à se plier à un modèle imposé ;) (NB en SHS, la formation à l'utilisation de modèle est bien accueillie, ne serait-ce que parce qu'on montre comment générer et mettre à jour de façon automatique des tables des matières ou des index, ce que 80% de nos auteurs ne savent pas, imaginez ce que ça donne comme boulot quand on sait que leurs thèses font en moyenne 500 pages...)
            - en effet, l'utilisation systématique de macros et autres raccourcis rendait la conversion ardue.
            Ceci dit, depuis cette époque les choses ont changé il existe des outils particulièrement intéressants pour convertir du TeX (je ne sais plus quelle classe) vers du MathML, cf club des utilisateurs de TeX de l'Université d'Oxford (en particulier les pages de S. Rahtz) dont je n'ai pas l'URL sous la main.
        • [^] # Re: TeX ?

          Posté par  . Évalué à 2.

          On peut toujours dire aux thésards en Sciences Humaine qu'il existe des outils comme LyX qui permettent de produire du PDF et du Latex. Mais à mon avis, il faudrait que les étudiants aient connaissance de l'existence de LaTeX, qui existe sous Zin. Qui pourrait bien le leur faire savoir?
  • # Précisions diverses

    Posté par  . Évalué à 5.

    De la nature de la chaîne CyberThèses :
    La chaîne a été conçue pour convertir les thèses telles qu'elles sont produites par leurs auteurs (majoritairement avec des choses de type wintruc. Pas taper ! c'est vraiement le cas si on regarde un peu ce qui se passe en dehors des sciences dures) vers un format d'archivage normé, pérenne et réutilisable facilement : le SGML. A partir de ce format, on produit du HTML, XML ou n'importe quoi d'autre pour la diffusion.

    Du statut de la chaîne :
    Les sources sont libres, téléchargeables, etc. Mais (car il y a un mais), puisqu'il s'agit de scripts Omnimark, il faut avoir l'Omnimark Virtual Machine pour les faire tourner.
    Il en résulte que : oui, on peut récupérer les sources ; non, on ne peut pas créer son serveur chez soi. et c'est bien dommage.

    De l'utilisation du serveur (de production) :
    Malheureusement non, tout un chacun n'y a pas accès, les comptes sont ouverts pour les institutions qui le souhaitent sur simple demande, mais nous (ni moi ni le serveur) ne pouvons faire face à des demandes d'utilisateurs isolés. Patience, quand tout sera effectivement libre, vous pourrez avoir le vôtre chez vous :)
  • # post inutile

    Posté par  . Évalué à -1.

    Ayant eu droit durant mes études à un "cours sur les outils XML" qui se révelait être une présentation d'un produit ( Omnimark ), je suis vraiment content de voir qu'un produit payant est abandonné au profit d'une solution libre...

    Y'a pas à dire, ca fait chaud au coeur :)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.