Journal Référencer les archives audiovisuelles libres sur linuxfr et ailleurs

Posté par  .
Étiquettes :
11
10
sept.
2009
Archiver et diffuser les documents sur le libre

Cette semaine, un événement particulier a eu lieu autour du financement des oeuvres, et il s'en produit presque tous les jours sur différents sujets.

Linuxfr annonce la grande majorité des événements du libre et ceux-ci sont de plus en plus souvent enregistrés, mais l'accès aux documents n'est pas toujours facile car il n'est pas indexé dans les articles archivés.

Par exemple, je viens d'ajouter à l'article sur la SARD l'adresse des enregistrements d'oxyradio, qui j'espère y resteront disponibles. Ainsi dans quelques mois ou quelques années, on retrouvera facilement ces interventions, et pas seulement leur annonce !
http://linuxfr.org/comments/1064220.html#1064220

La veille RMS avait présenté une autre conférence. Si cette conférence a été rediffusée, aucun lien n'a été mentionné à la suite de l'article qui l'a annoncée sur l'emplacement des archives. Comment la retrouvera-t-on dans quelques années ?
- FRHack : Conférence de RMS en accès gratuit
http://linuxfr.org/2009/09/05/25872.html

Un autre aspect des archives est la retranscription. Elle permet de rendre plus accessible les documents, que ce soit par leur indexation sémantique, ou par l'adaptation à des supports ou des langues accessibles à plus de public (malentendants, langues étrangères). En effet le document texte peut être ensuite indexé, traduit en d'autres langues, et sous-titrer le document original, pour une plus large diffusion. Un texte peut aussi être transcrit en braille, notamment des descriptions visuelles.
- transcription en braille
http://2008.rmll.info/FR-Atelier-La-transcription.html

La transcription devient obligatoire pour les grands médias. Celle-ci utilise de moins en moins d'employés au profit de logiciels propriétaires. Bien-sûr, des logiciel ou librairies existent en logiciel libre, mais ils ne sont pas aussi aboutis et exploitables. Pas encore.
Ce n'est pas l'objet de cet article de faire la liste des techniques actuellement exploitées, que chacun pourra trouver sur internet, et qui serait trop long à faire..
- Transcription du débat entre Ségolène Royan et Nicolas Sarkozy lors des dernières élections présidentielles (Libération) :
http://www.liberation.fr/politiques/010118726-la-transcripti(...)
- Le maigre article de wikipedia en français sur la transcription :
http://fr.wikipedia.org/wiki/Transcription_(linguistique)
http://en.wikipedia.org/wiki/Transcription_(linguistics) (anglais)
- Documents du LIMSI :
http://www.google.com/search?q=transcription&sitesearch=lims(...)

Dans le futur, les transcriptions de documents libres devraient idéalement être automatisées ou externalisées (sous-traitées par des entreprises spécialisées).

L'exemple de l'April

L'April a par exemple lancé des études et travaux sur la transcription qui en est à ses balbutiements. La tâche est énorme, car on estime qu'il faut 12 heures pour transcrire 1h manuellement. Pourtant des documents ont profité des travaux de ce groupe :
- Quelques documents relatifs à la transcription de documents sur le site de l'April :
http://www.april.org/fr/search/node/transcription
- Vidéo de mise en garde contre l'informatique déloyale qui est appelée de manière trompeuse "informatique de confiance" (trusted computing) :
http://www.april.org/fr/trusted-computing-le-film
- Introduction par Noël Mamère lors de la conférence de Richard M. Stallman à l'Assemblée Nationale le 20/11/2001 :
http://www.april.org/fr/actions/rms/20011120

L'un des écueils est le niveau de qualité désiré, qui augmente le volume de travail, et freine l'accès rapide aux documents. Peut-être y aurait-il un compromis à trouver, par exemple en précisant un niveau de finition des documents pour accélérer leur diffusion.
- Document de référence du groupe transcription de l'April :
http://www.april.org/files/documents/html/table.html

Une réorganisation prochaine des contenus produits dans le cadre du groupe transcription est prévue pour adapter les anciens travaux au nouveau site de l'April.

Les personnes souhaitant rejoindre ce groupe de travail sont invitées à s'inscrire sur la liste de diffusion du groupe transcription.
- Présentation du groupe transcriptions :
http://www.april.org/groupes/transcriptions
- Liste de diffusion transcriptions (actuellement 35 abonnés) :
http://www.april.org/wws/info/transcriptions
- Conférence de Sébastien Blondeel, "Immortaliser des interventions : pourquoi et comment ? Intérêts et outils de la transcription", réalisée dans le cadre du thème "Accessibilité et handicap" des RMLL 2008, à Mont-de-Marsan, enregistrée dans de mauvaises conditions et hélas non disponible publiquement, comme l'ensemble du thème :
http://2008.rmll.info/Immortaliser-des-interventions.html
(seul le thème "Embarqué" a été disponible, grâce à Free Electrons)

La première étape consiste à produire, référencer et archiver les sources des documents.

La multiplication des sources favorisée par la démocratisation des moyens d'enregistrement, et la transcription des documents du libre ne pouvant que s'améliorer, il convient de veiller à protéger les sources des documents actuelles, par leur archivage et leur référencement. Une base de donnée centralisée et libre (à l'exemple de wikipedia), mentionnant titres, descriptions, sources et copies disponibles, de ces documents pourrait nous y aider.
Au delà de ces étapes fondamentales, d'autres problèmes techniques doivent être franchis, comme la mise en place de sous-titrages et leur automatisation. Les travaux déjà réalisés par l'April peuvent servir de terrain d'exercice.
La logistique nécessaire à des enregistrements de masse exploitables en est un autre aspect, comme l'ont montré les essais d'enregistrement lors des RMLL 2008 de Mont-de-Marsan. Nous devrions pouvoir aboutir à enregistrer 100% des conférences et les diffuser en direct, ne serait-ce qu'en audio. Pour l'heure, il s'agira de faire le maximum en fonction des moyens à notre disposition. Ceux qui sont intéressés par le sujet ou qui ont des compétences à apporter, peuvent s'inscrire à la liste des rmll 2010.
  • # podcasts oxyradio

    Posté par  . Évalué à 6.

    Les podcasts resteront disponible au téléchargement sur nos serveurs si et seulement si nous continuons à avoir les moyens de payer ces serveurs.

    C'est pour cela que nous comptons sur les membres de l'association via leur cotisation afin de faire vivre l'association et donc de renouveller le serveur.

    Ainsi, il est logique de comprendre que la campagne d'adhésion que nous avons lancé n'avait pas pour unique but d'imprimer des flyers, mais surtout de faire vivre l'association afin de payer les serveurs et la connection internet qui permettra de faire régulièrement les émissions de nos studios et ainsi de contribuer aux archives audios que nous proposons.

    Si vous souhaitez nous aider et contribuer, n'hésitez pas à adhérer (http://www.oxyradio.net/adhesion.html) ou à nous proposer un hébergement en datacenter.
  • # transcription

    Posté par  . Évalué à 1.

    Je me permet de rappeller la définition de transcription (qui est tout autre de ce que m'a inculqué mes cours sur le vivant) C'est un procédé qui consiste à prendre un document préalablement enregistré en audio ou vidéo et de le taper sous forme de texte.

    envoyé depuis mon clavier bépo

  • # trouver l'information à la source ?

    Posté par  . Évalué à 4.

    est-ce qu'il n'est pas envisageable aussi de récupérer les documents étant à la source des "podcasts" ou des discours ? (cas de l'assemblée nationale)
    Cela pourrait faciliter une partie du travail peut-être.

    Sinon j'avoue que j'ai du mal avec les "podcasts" et autres média volontairement sonores, je préfère lire les textes, et souvent si un document m'intéresse à moitié (typiquement les actualités sur le site "le monde") et qu'il n'est disponible qu'en vidéo, il n'est pas rare que je passe mon chemin, alors qu'en texte je peux le survoler et récupérer plus rapidement les informations.

    Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

    • [^] # Re: trouver l'information à la source ?

      Posté par  . Évalué à 4.

      Entièrement d'accord, pour un contenu audio/vidéo, on n'a pas de sommaire indexé comme pour un texte (sommaire+liens, titres plus gros que le corps, etc.), on a juste une scrollbar, qui en plus force à écouter car on ne peut pas avoir à un instant t l'aperçu de tout un intervalle de temps (alors que pour un texte, on a l'écran qui affiche plus qu'une syllabe à la fois).
  • # Requalifier ce journal en dépêche ?

    Posté par  . Évalué à 6.

    Ce journal est passionnant, original et bien rédigé.
    Peut-on envisager de le mettre "à la une" en le transformant en dépêche ? (modification technique)

    BeOS le faisait il y a 20 ans !

  • # Contenus libres

    Posté par  . Évalué à 3.

    Au passage, si vous avez des contenus "vidéos" libres, je suis preneur pour le projet OpenDCI[*]

    - http://openmovie.opendci.org/

    OpenMovie.OpenDCI.org est la mise à disposition de contenus libres encodés sous format DCP (Digital Cinema Package) pour le cinéma numérique actuellement en cours de migration (35mm => numérique). Ces films peuvent être utilisés pour les exploitants et les projectionnistes en quête de contenus alternatifs.


    *: OpenDCI est une association libre et de fait composé de personne travaillant dans le domaine du cinéma numérique. cette association a pour but la diffusion des informations liées au cinéma numérique notamment relatif à l'univers "logiciel libre" & dérivés.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.