Forum général.cherche-logiciel moteur de recherche d'archives audio

Posté par  . Licence CC By‑SA.
Étiquettes : aucune
2
31
mai
2018

Bonjour,

Je travaille avec une radio associative. On aimerait valoriser nos archives audio (sous forme de mp3) en donnant la possibilité aux visiteurs du site de piocher dedans à la recherche d'une émission/interview/etc. La quantité de fichiers est relativement importante (>2To). Dans l'idéal, chaque fichier est assorti d'une fiche descriptive, et trouvable via l'indexation du contenu de cette fiche. La recherche peut se faire via une boite de recherche ou une recherche par critère, sur une page intégrée à notre site actuel. Le stockage des fichiers serait indépendant du site.
J'ai regardé du côté d'OpenSearchServer et d'OpenSemanticSearch.

Je suis preneur d'alternatives à ces solutions :)

  • # Piste...

    Posté par  . Évalué à 1.

    Mmmm, projet intéressant est-ce que tes fichiers audios sont dotés de méta data suffisantes pour qu'elle soit indexées dans un moteur d'indexation basé sur lucen style elastic Search ou solr ? Ou faut-il prévoir une phase d'auto transcription ?

    • [^] # Re: Piste...

      Posté par  . Évalué à 1.

      Les metadata mp3 sont assez limitées, d'après ce que j'en comprends. Il est envisageable de commencer à remplir une base de données à partir des meta existantes, et ensuite de compléter la bdd. Ou l'inverse, renseigner une fiche descriptive par fichier puis verser dans le fichier toutes les meta possibles. Dans tous les cas, les metas ne sont qu'un point de départ et je ne pense pas échapper à la construction d'une bdd qui serait plus "renseignée" que les fichiers eux-mêmes.

      D'après ce que je comprends, OpenSemanticSearch est basé sur Solr. Je jette un oeil, ça a l'air intéressant !

      • [^] # Re: Piste...

        Posté par  . Évalué à 1.

        Tiens nous au courant si tu arrives à obtenir quelquechose, ce projet et très intéressant !

  • # État des lieux

    Posté par  (site web personnel) . Évalué à 1.

    Bonjour,
    dans votre question je ne comprends pas de quelles métadonnées descriptives vous disposez actuellement. Il y a déjà un fichier texte (ou une entrée de base de donnée) pour chaque fichier audio décrivant par exemple les thèmes abordés, les intervenants, etc. ? Ou vous souhaitez extraire ces informations des fichiers audio ?

    • [^] # Re: État des lieux

      Posté par  . Évalué à 1.

      Bonjour,
      Voir ma réponse au-dessus. Les fichiers ne sont tous taggés mais nous disposons d'informations sur eux, comme effectivement les intervenants, l'animateur, les thèmes abordés. Dans l'idéal, les metas et la fiche descriptive attachée à chaque fichier seraient au maximum redondantes.

  • # furkwhale ?

    Posté par  (site web personnel) . Évalué à 2.

    Funkwhale est un logiciel qui te permet de proposer un site façon soundcloud (mais libre et fédéré avec ActivityPub). Je sais pas si sa recherche fonctionne bien, mais ça peut être une piste sympa.

    https://funkwhale.audio/

    Being a sysadmin is easy. As easy as riding a bicycle. Except the bicycle is on fire, you’re on fire and you’re in Hell.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.