Journal Tout est écrit!

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes : aucune
6
29
jan.
2016

Cher journal, nous avons appris cette semaine la première victoire d'un programme informatique contre un joueur de go, c'est un domaine aussi vertigineux que je vous invite à découvrir.

Si vous avez lu la nouvelle de Borges "La Bibliothèque de Babel" vous avez ressenti le vertige que provoque l'idée d'une bibliothèque complète constituée de toutes les combinaisons possibles des lettres de l'alphabet et de la ponctuation:

Tous les livres sont ainsi écrit, y compris votre biographie, ainsi que de multiples variantes de celle-ci, partiellement ou totalement erronnées.

L'histoire du monde depuis son commencement jusqu'à sa fin dans les plus infimes détails dans toutes les langues ayant existés, existantes ou futures. Oui le vertige donc, irréaliable sans doute mais un sous ensemble de cette bibliothèque vient d'être réalisé : http://data.blog.lemonde.fr/2015/12/23/les-proprietes-vertigineuses-de-la-bibliotheque-univers-de-babel/

Cette biblitohèque ne comporte pas tous les livres, mais bien toutes les pages possibles écrites avec les lettres de notre alphabet.
Il contient par exemple ce texte, ainsi que chacun de vos commentaires comme vous pourrez le contater ici: https://libraryofbabel.info/search.html

  • # Indeed

    Posté par  . Évalué à 4.

    https://libraryofbabel.info/bookmark.cgi?urzohenfsxbjzqfldrd,du301

    Depending on the time of day, the French go either way.

    • [^] # Re: Indeed

      Posté par  (site web personnel) . Évalué à 4.

      Tu aurais pu aller plus loin avec le texte entier c'est plus impressionnant.

      • [^] # Re: Indeed

        Posté par  . Évalué à 3.

        https://libraryofbabel.info/bookmark.cgi?mu,zzxnyeisuigwlellnhbyb220
        Ligne 20

        Depending on the time of day, the French go either way.

        • [^] # Re: Indeed

          Posté par  (site web personnel) . Évalué à 3.

          :)

        • [^] # Re: Indeed

          Posté par  (site web personnel) . Évalué à 4.

          C'est une application possible de cette bibliothèque: transmettre des messages en indiquant seulement un numéro de page.

          • [^] # Re: Indeed

            Posté par  . Évalué à 4.

            Par contre j’suis pas super fan des pages avec des caractères aléatoires, visuellement, celles avec des mots aléatoires sont plus agréables, je trouve.

            Problème du jour: Un linuxeferien décide de ne plus employer que ce système pour ses commentaires. Sachant qu’il dispose de 4000 points de karma, et qu’il poste 4 à 5 fois par semaine, après combien de jours ne pourra-t-il* plus poster de commentaires?

            *Punaise, ça m’a pris au moins 5 minutes a correctement écrire pourra-t-il, et je ne sais pas combien de combinaisons plus ou moins hideuses.

            Depending on the time of day, the French go either way.

          • [^] # Re: Indeed

            Posté par  (site web personnel) . Évalué à 3.

            Le souci c’est que le numéro de page est plus grand que le contenu de la page lui-même (sinon on aurait trouvé là l’algo de compression ultime, en faisant des numéro de pages vers des listes de numéro de page). Le numéro dans l’url n’est qu’un numéro "marque page" associé à un numéro bien plus grand enregistré quelque part sur le serveur dans une joli table.

            Après, je me demande si utilisé conjointement avec des algos de compression, on serait capable de compresser une liste suffisamment longue d’adresses pour que la liste de ces adresses prenne moins de place que la somme du contenu à ces adresses. Mais peut-être peut-on démontrer mathématiquement que ce n’est pas possible.

            Quand j’avais appris l’existence du projet je m’étais amusé à coder ma photo avec la liste des caractères autorisés (un base64 étendu, en gros) et à rechercher cette chaîne de caractère. Bon, il fallait un jpeg avec une toute petite résolution quasi illisible, à moins d’employer plusieurs tuiles.

            ce commentaire est sous licence cc by 4 et précédentes

  • # Not sure if

    Posté par  . Évalué à 6.

    Je n'arrive pas à savoir si c'est du génie ou si c'est complètement stupide. Help. Je ne dors plus. :(

    • [^] # Re: Not sure if

      Posté par  . Évalué à 7.

      C'est du génie. Autant de tapage pour un site qui te permet d'afficher le texte que tu lui soumet à travers un tas de suite de caractère illisible. Faut le faire.

    • [^] # Re: Not sure if

      Posté par  (site web personnel) . Évalué à 2.

      Moi aussi
      d'après ce que j'ai compris c'est la version internet de l'armée de singes qui tapent à la machine ?

  • # Intelligence artificielle et jeux de GO et Kasparov

    Posté par  . Évalué à 6. Dernière modification le 29 janvier 2016 à 14:58.

    Je me souviens avoir lu que Big Blue n'était pas programmé dans le sens où il avait déjà codé dans les sources l'ensemble de toutes les combinaisons possibles, mais que c'était une sorte d'algorithme adaptatif tel que des réseaux de neurones (je ne sais pas si c'est des réseaux de neurones mais cela semblait suivre ce genre d'idée ). Dès lors toutes les combinaisons n'étaient pas écrite à l'avance tel que la Bibliothèque de Babel.

    Par rapport au lien que tu donnes pour illustrer le proof of concept de la bibliothèque de Babel, ce que je trouve étonnant (ou bizarre) c'est que lorsque je rentre du texte , celui-ci se trouve au milieu d'une nuée de texte aléatoire et soudainement ce texte précis ressort. A la fin du texte, cela repart vers de l'aléatoire total (pourquoi n'y a -t-il pas un texte sémantiquement sensé juste après ? ou avant ? ou un bout de phrase sémantiquement correcte juste après et avant ? ) Je me demande si cela n'était pas plus simple de faire un générateur aléatoire et de copier coller le texte dont tu lui demande de vérfiier l'existence et puis d'y adjoindre des pseudo attribut (vous retrouvez ce texte à tel page de tel livre avec tel titre ) en donnant ainsi l'illusion que c'était écrit d'avance.

    Dans ce cas là, cela serait une sorte de performance artistique , un peu fumeuse version poudre au yeux :)

    • [^] # Re: Intelligence artificielle et jeux de GO et Kasparov

      Posté par  (site web personnel) . Évalué à 1.

      Voici ce qu'explique l'article du Monde sur ce point: Bien sûr, la bibliothèque contient tellement d’information qu’il serait impossible de la stocker numériquement. Le contenu de la bibliothèque est généré à partir d’un algorithme spécial créé par Jonathan Basile. Chaque page a un numéro unique qui lui est propre et qui l’identifie dans la bibliothèque. L’algorithme utilise ensuite ce numéro de page pour générer un nombre pseudo-aléatoire unique qui est lui-même converti en base 29, c’est-à-dire en texte utilisant les 29 signes cités précédemment : le texte de la page est généré. Le même numéro de page créera donc la même page à chaque fois.

      • [^] # Re: Intelligence artificielle et jeux de GO et Kasparov

        Posté par  . Évalué à 3.

        Euh, mais attends, c'est complètement trivial ce truc, non? Quand tu reçois une requête de n caractères,

        • 1) tu tires au sort l'emplacement du début du texte entre 1 et N-n (N étant le nombre de caractères dans la page)
        • 2) tu remplis le reste de la page de caractères aléatoires
        • 3) tu stockes dans une base de données la requête et la graine du RNG, et tu identifies cette entrée avec un numéro unique

        Du coup, tu crées juste tes pages à la demande, c'est une simulation de la bibliothèque de Babel, mais ça n'a rien à voir avec le concept.

        Un truc plus intéressant serait de générer des binaires informatiques aléatoires afin d'optimiser les tâches simples. Par exemple, la fonction "factorial" a un jeu d'entrées/sorties fini (si on veut récupérer la sortie dans un int, mettons). Du coup, il doit être possible de chercher le plus petit binaire possible qui donne le bon résultat, sans le programmer, juste en testant des binaires aléatoires de taille croissante jusqu'à ce que ça marche. J'imagine qu'on pourrait trouver des binaires plus efficaces que n'importe quel truc compilé. Ça pourrait vraiment aider l'optimisation du calcul numérique, etc. Au moins ça aurait un intérêt…

        • [^] # Re: Intelligence artificielle et jeux de GO et Kasparov

          Posté par  (site web personnel) . Évalué à 2.

          Oui et non, c'est certe trivial d'intégrer un texte à une série aléatoire, mais ensuite la trace de ce texte est conservée, de telle manière, si j'ai bien compris, que la requête vers le numéro de page du livre renverra toujours le même texte.

          En clair certe cette bibliothèque est incomplète et menteuse mais elle ne se contredit pas et fonctionne bien à ce titre comme elle l'indique, même si les autres livres ne sont pas générés, tu trouveras toujours la page que tu cherches à sa place.

          Dans une vraie biblitohèque, les pages des livres que tu n'as jamais lu pourraient tout aussi bien être blanches, tu as donc une représentation réaliste de la bibliothèque de Babal, vue du point de vue du lecteur.

          • [^] # Re: Intelligence artificielle et jeux de GO et Kasparov

            Posté par  . Évalué à 6.

            ensuite la trace de ce texte est conservée, de telle manière, si j'ai bien compris, que la requête vers le numéro de page du livre renverra toujours le même texte.

            Oui, bah soit il stocke quelque part le résultat, soit il associe la graine du RNG (un hash de la requête?) à la référence de la page et du bouquin, mais il n'y a rien de fascinant là dedans. C'est un peu comme si tu étais sur le cul de découvrir qu'un RNG pouvait te sortir à la demande des séries identiques si tu lui filais toujours la même référence…

            fonctionne bien à ce titre comme elle l'indique

            Oui, c'est une simulation, mais c'est juste que je n'en comprends pas l'intérêt. Je peux te faire un simulateur de décimales de pi : j'affiche 100 chiffres aléatoirement. Je peux prétendre que mon ordinateur stocke toutes les positions possibles de l'échiquier, donne m'en une et je l'affiche. Je veux dire par là qu'on peut trouver un intérêt à un simulateur si la simulation n'est pas triviale, si on se demande "waou, comment le mec a pu faire ça". Là, son seul génie semble consister à avoir réussi à convaincre tout un tas de gens que son truc pouvait mériter qu'on s'y intéresse…

          • [^] # Re: Intelligence artificielle et jeux de GO et Kasparov

            Posté par  . Évalué à 2.

            Dans une vraie biblitohèque, les pages des livres que tu n'as jamais lu pourraient tout aussi bien être blanches, tu as donc une représentation réaliste de la bibliothèque de Babal, vue du point de vue du lecteur.

            Quid dans le cas où le lecteur feuillète (skim) le livre ?

        • [^] # Re: Intelligence artificielle et jeux de GO et Kasparov

          Posté par  (site web personnel, Mastodon) . Évalué à 1.

          On a essayé l'utilisation d'algorithmes évolutifs de ce genre pour générer des binaires informatiques ou encore du placement/routage électronique sur FPGA. ça ne marche pas très bien, car les programmes ou schémas générés exploitent des choses en dehors du jeu d'entrées/sorties (mémoire non initialisée, instructions CPU non documentées, etc), et du coup, ça peut marcher une fois dans l'environnement de test, mais le résultat n'est pas pour autant exploitable "en vrai".

  • # Conversion décimal<>ASCII

    Posté par  (site web personnel) . Évalué à 4.

    Enfin si tu le cherches, c'est déjà écrit depuis longtemps dans le nombre PI

    • [^] # Re: Conversion décimal<>ASCII

      Posté par  (site web personnel) . Évalué à 5.

      Oui ce sont les nombres univers (il n'est pas démontré que Pi soit un tel nombre même si c'est une forte possibilité). Bref un nombre univers contient toutes les suites de chiffres arbitrairement longues, et ces suites converties en lettres correspondent bien à la biblitohèque de Babel. En revanche je te mets au défit de réussir à trouver une suite quelconque de mots français dans les premiers milliards de décimales de PI.

    • [^] # Re: Conversion décimal<>ASCII

      Posté par  . Évalué à 2. Dernière modification le 29 janvier 2016 à 17:22.

      Que ce qu'il cherche soit dans le nombre PI ou autre, je laisse le soin aux mathématiciens d'en douter.

      Par contre, que ce qu'il chercher soit écrit quelquepart parmis les décimales du nombre Pi, j'ai plus de doutes.

  • # Trop facile

    Posté par  (site web personnel) . Évalué à 4.

    C'est un peu facile. Dans le concept original, ce sont tous les bouquins de 410 pages possibles qui sont considérés. Ici, ce sont toutes les pages possibles : c'est plus facile, beaucoup plus facile, parce qu'il y en a nettement moins. Vous m'objecterez que tout bouquin est une liste finie de pages identifiées, mais à ce compte-là, on pourrait faciliter encore plus le concept : tout bouquin est une liste finie de lettres identifiées, et la liste des lettres, c'est un peu trivial.

    Pas ailleurs, donner un numéro unique à toute page de livre, et générer le contenu de la page correspondant à tout numéro, c'est facile aussi :

    • dans un sens, il suffit de coder la page en UTF-8, et de décoder les bits résultants comme un énorme entier ;
    • dans l'autre sens, il suffit de coder l'énorme entier en binaire et de décoder le résultat comme de l'UTF-8.

    Bon, c'est un peu plus compliqué, il va falloir compléter avec des zéros quelque part, et UTF-8 est un mauvais choix de codage parce que tout code n'est pas de l'UTF-8 valide. Mais abstraction faite de ces détails d'implémentation, l'idée demeure.

    • [^] # Re: Trop facile

      Posté par  (site web personnel) . Évalué à 4.

      En fait la question est de savoir ce que l'on peut connaître avec un esprit limité de quelque chose d'extrêmement grand: une bibliothèque complète, les décimales de Pi, la position de chaque atome de l'univers. Faute de disposer d'un temps infini et d'une mémoire infinie la tâche est impossible et nous sommes tous limités par une sorte d'horizon: nous pouvons tout connaître de presque rien ou presque rien sur un peu tout, bref les limites de l'esprit et du temps forment une sorte d'horizon à notre connaissance du monde.

      La bibliothèque de Babel au contraire est complète, elle contient tout mais elle est par définition impossible à réaliser sauf à disposer d'un nombre de livre plus grand que l'univers lui-même, et même si elle existait aucun être humain, aucune civilisation ne pourrait en avoir une connaissance exhaustive si bien que le savoir contenu ne servirait à rien.

      Pour autant, justement en raison des limites humaines il est possible de construire une simulation informatique réaliste de cette bibliothèque et c'est ce que réalise ce site: je peux me promener dans les hexagones, choisir une page et la lire: le fait que cette page soit créée au moment de sa consultation n'a aucune importance du point de vue de l'utilisateur car tout se passe comme si, pour lui, la page préexistait à sa consultation, et une foi consultée, elle reste dans son état.

      Ainsi nous avons bien une bibliothèque complète du point de vue de l'utilisateur et cette bibliothèque n'est pourtant pas infinie, il est donc possible de créer une simulation informatique d'un objet non pas infini mais extrêmement grand, c'est même relativement trivial d'après certains commentaires, qui pour autant, du point de vue d'un seul utilisateur, aura bien les caractéristiques de la bibliothèque de Babel.

      D'ailleurs cette approche peut être adaptée à tous les systèmes très grands. Exemple: une carte de la forêt amazonienne, je clique sur un point et je trouve un arbre, je clique sur cet arbre je trouve une branche, je clique je trouve une feuille, je clique une cellule, des protéines, des atomes, des protons etc….j'ai donc une carte de la forêt réaliste jusqu'à un nucléon sans pour autant avoir la position de chaque atome dans la forêt.

      • [^] # Re: Trop facile

        Posté par  . Évalué à 6.

        Oui, mais il y a un peu une arnaque à appeler la bibliothèque de Babel une bibliothèque. Je te rassure tout de suite, ma réflexion n'enlève rien à la pertinence de ton propos sur notre rapport à l'immensité. Une bibliothèque est avant tout un système ayant pour but d'organiser une ressource, en l'occurence, pour ce qui est des bibliothèques classiques, de livres. Ces livres sont la condensation sous une forme écrite de la pensée de leur auteurs. Ce n'est pas du hasard. C'est, justement, une organisation intelligente d'informations préalablement organisées de façon intelligente. La bibliothèque, est, en quelque sorte, le livre des livres, un genre de méta-livre. C'est une organisation intelligente de livres.

        Ce qui est intéressant avec les bibliothèques, c'est le fameux adage qui veut qu'un objet puisse avoir des propriétés qui soient différentes de la somme des propriétés des objets qui la compose. En quelque sorte, une bibliothèque, en organisant son substrat de livre, remplis cette fonction. Lorsque je veux nourrir ma réflexion, elle me fait gagner un temps précieux en me dirigeant directement vers les ouvrages qui m'intéresse plutôt que de m'obliger à les lire de façon séquentielle jusqu'aux ouvrages pertinents. Tout ça pour dire qu'une bibliothèque n'est pas seulement un endroit avec un tas de livres dedans, c'est surtout un index et un bibliothécaire. Sans ces deux éléments, la bibliothèque m'a que peu d'utilité. Comme le serait le web sans moteur de recherche.

        L'exemple que tu donne au sujet des cartes est, à ce titre, très pertinent. Une carte n'a pas vocation de représenter de façon exacte les lieux qu'elle décrit. Elle a pour but d'organiser, sous une forme choisie, ces lieux en vue d'orienter ses utilisateurs. Une carte qui serait l'exacte réplique du réel n'aurait aucun intérêt car son utilisateur y serait tout aussi perdu que dans le réel.

        Et cela rejoint l'idée même de logos, qui n'est rien d'autre que cette manie que nous avons d'organiser de l'information dont on est submergé en permanence pour en extraire du sens.

        Faut pas gonfler Gérard Lambert quand il répare sa mobylette.

        • [^] # Re: Trop facile

          Posté par  . Évalué à 3.

          http://www.biblioblog.fr/post/2008/05/06/De-Bibliotheca-Umberto-Eco & https://cybergeo.revues.org/5233 pour les ceussent qui ne connaissent pas.

          Depending on the time of day, the French go either way.

          • [^] # Re: Trop facile

            Posté par  . Évalué à 2.

            Merci, c'est génial car c'est exactement à la nouvelle d'Umberto Eco sur la carte au 1:1 auquel je pensais, sans retrouver vraiment l'origine ! C'est ironique, mais car si j'avais le livre dans ma bibliothèque et si je tenais un bon index, je j'aurais retrouvé. Pour le coup, j'ai utilisé google mais sans succès. Mauvais mots clés. Pour info, c'est tiré du livre : Comment voyager avec un saumon

            Faut pas gonfler Gérard Lambert quand il répare sa mobylette.

        • [^] # Re: Trop facile

          Posté par  (site web personnel) . Évalué à 2.

          Sur l'utilisation du terme bibliothèque je pense que le reproche s'adresse à Borges et je ne suis pas sûr d'être capable de répondre à sa place. Cependant, de mémoire, il me semble que le narrateur de la nouvelle évoque la quête d'une sorte de livre ultime qui résumerait tous les autres et de la vacuité de cette recherche. Toujours est-il que Borges a intitulé sa nouvelle "La Bibliothèque de Babel" ceci implique amha à la foi la notion de complétude mais aussi son caractère inaccessible.

          Le site internet est une simulation de cette "bibliothèque", aucun caractère de chaque page, de chaque livre, n'a de sens en soit. Parfois des lettres forment des mots intelligibles dans une langue ou dans une autre, ces mots peuvent former des phrases etc…. Donc le hasard peut permettre au sens d'émerger du cahot, mais ce sens est en lui-même inaccessible car noyé dans un bruit immense.

          En poussant l'analogie un peu plus loin, on peut voir cette bibliothèque comme une analogie de notre univers ou les atomes seraient remplacés par des lettres dans toutes les combinaisons possibles et nous spectateurs, ressentant intuitivement qu'un sens peut émerger de cette combinatoire, mais restant impuissant à le découvrir.

          Bref une bibliothèque dénuée de sens du fait même de sa complétude, fuyant le logos tout en le contenant, c'est surtout une vision très pessimiste sur la condition humaine confrontée à l'infini.

          En ce sens par delà les considérations informatiques et mathématiques ce site est avant tout une réalisation littéraire.

  • # Trop tard

    Posté par  . Évalué à 7.

    Et moi qui faisait taper mon chien au clavier tous les jours pour sortir un best-seller (ou chopper des bouquins gratuitement)…
    Bah, de toute façon on m'a dit que ça marchait qu'avec les singes (et ils n'écrivent que du Shakespear).

  • # Tout est réécrit!

    Posté par  (site web personnel) . Évalué à 6. Dernière modification le 29 janvier 2016 à 20:12.

    Une autre version par un Grand Ancien (ancien trésorier de l'asso LinuxFr, et joueur de go aussi) il y a déjà plus de 10 ans : https://web.archive.org/web/20050523024453/http://hamete.org/babel/

  • # fzrp pz ,cpui e z ..ze

    Posté par  . Évalué à 1.

    ferkappkdovfdjiog La partie Theory est intéressante et répondra à certaines questions ici posées.. Il explique : greaqb,q piogoe
    - comment Borges a changé l'alphabet et le texte sur la forme de la bibliothèque
    - zoiem f,apc. qscmbvzoiy
    - comment il est parvenu à manipuler des nombres aussi gigantesques
    - l'historique de ce thème
    - quelle fonction il a utilisée pour générer les pages, une séquence de Halton

    Stupide ? Trivial ? Comme bien d'autres nouvelles de Borges, très métaphysiques, c'est stimulant. Et la manière dont s'y est pris l'auteur du site est permet aussi de réfléchir sur le fini, sur comment générer des nombres dans d'autres bases.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.