Bonjour à toute la communauté!
<mavie>
Je suis un informaticien, compagnon d'une universitaire qui est en train de publier avec des collègues une somme sur un auteur ancien.
</mavie>
Je voudrais l'aider à générer les références de l'index de l'ouvrage. Ça représente un certain volume de texte (on parle de 6 volumes d'environ 1000 pages chacun), et l'index contient environ 3400 entrées …
Bien entendu, ce sont des littéraires, la mise en page finale est en cours et je n'ai que les pdf des tirages finaux pour composer les liens (oui ça aurait été bien plus facile avec du latex et les balises \index mais la moyenne d'âge des co-éditeurs frise les 65 ans).
Je me dis que ce problème à du être rencontré un peu partout dans le monde universitaire et peut être que je suis passé à côté d'un projet Européen ou autre qui pourrait nous aider à faire ça "plus facilement".
J'ai commencé quelque chose de mon côté, avec l'aide des IAs (je me dis que c'est un bon projet perso pour confirmer ce que je pense (ou pas) du code construit par les IA (ça fera l'objet d'un autre journal si j'aboutis à quelque chose)).
Le principe serait de permettre la description de l'index via une interface web (plus simple pour des néophytes ?), puis la génération du document d'index final.
Je pensais que ça serait simple, mais en fait c'est bien plus complexe que ce qu'il n'y parait. Par exemple comment trouver les noms des gens présents dans l'index, lorsque deux noms de famille identiques sont présents, comment gérer les références dans l'index (les "see also"), comment gérer les titres sur de la concordance (matching) multi-ligne, etc … Sans compter le côté humain de l'index actuel (comprendre avec des erreurs, le formatage est un peu aléatoire, etc …)
Bref c'est une tâche bien plus importante que mon idée de départ, alors je fais appel à ceux qui savent / ont déjà fait ça : comment avez-vous fait ?
(la réponse "c'est l'éditeur qui a pris ça en charge me va", mais dans leur cas, c'est niet, les universités de Princenton leurs ont dit débrouillez-vous).
Merci d'avance pour vos idées !
Caeies
# Lapin compris
Posté par ǝpɐןƃu∀ nǝıɥʇʇɐW-ǝɹɹǝıԀ (site web personnel) . Évalué à 5 (+3/-0).
Excusez-moi, je n'arrive pas bien à comprendre de quelles données vous partez, et à quoi vous souhaité arrivé. Du coup, le reste des questions me restent hermétiques. Pouvez-vous réexpliquer ?
Euh, les gens de 65⁺ ans qui se préoccupent un tant soit peu des formats de données utilisent LaTeX (quand c'est approprié) et le recommandent à leurs étudiants, aux proches, voire à la volée sur les réseaux sociaux :-).
D'ailleurs d'autres logiciels permettent une gestion propre de la bibliographie. À une époque j'ai même su le faire avec un ancêtre de Libreoffice, et actuellement les foules semblent plébisciter Zotero.
« IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace
[^] # Re: Lapin compris
Posté par Gil Cot ✔ (site web personnel, Mastodon) . Évalué à 4 (+2/-0).
J’ai aussi pensé à Zotero quand j’ai lu interface et tout ça (bien sûr qu’il y a des gestionnaires graphiques BibL mais il est explicité qu’on est loin de cet univers. il y aussi pléthore d’autres programmes mais privateurs et avec des formats bien cadenassés.)
La question de savoir d’où on part est pertinente, parce-que je n’ai pas compris pourquoi vouloir faire la gestion des biographies quand on indique que l’ouvrage est terminé et dans les tuyaux (mais qu’on n’a pas eu accès aux PDF finaux), en tout cas de ce que j’ai compris.
“It is seldom that liberty of any kind is lost all at once.” ― David Hume
# Plus de précision
Posté par lejocelyn (site web personnel) . Évalué à 2 (+0/-0).
Est-ce que l'index doit être à la fin de chaque volume, ou alors il est possible d'avoir un index dans un volume indépendant ?
~3400 entrées, donc ça signifie que ces entrées ont déjà été identifiées ? Si je comprends bien ton problème, franchement ton exposition n'est pas claire du tout, c'est que tu as les entrées, mais pas les pages qui devraient être associées à ces entrées ?
On est dans de la pensée quantique vis-à-vis de l'IA ;)
Sinon, pour revenir à la construction d'un index, de mon expérience, soit les gens font ça un peu à l'arrache à la fin, soit l'index a été prévu depuis le début et ça ne pose pas vraiment de problème.
Pour les noms de famille aux formes identique mais correspondant à des personnes différentes, ben il faut déjà ajouter des informations supplémentaires (dates, prénoms, etc.) dans leurs entrées d'index respectives. C'est d'ailleurs un peu le même problème lorsqu'un mot est utilisé plusieurs fois avec des sens différents. Et pour gérer les homographes, malheureusement, mis à part consulter manuellement les pages pour distinguer le sens, je ne vois pas ce qui est possible de faire.
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.