Le point principal du papier n'est pas inattendu évidemment, c'est juste une preuve mathématique que faire réapprendre un LLM à partir de données générées par un ou d'autres LLM mène inévitablement à un effondrement. C'est valable aussi si la proportion de "nouveauté" d'information correcte injectée à chaque réapprentissage est trop faible.
Je note notamment ce commentairece commentaire de Dan Piponi qui pointe que les modèles récent n'ont pas pour but de reproduire la distribution d'apprentissage initial mais aussi de réaliser des tâches hors distribution, et cite le papier
From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence, qui discute entre autre de comment maximiser l'utilité du modèle à ressource computationnelle contrainte étant donné les jeux d'apprentissages, en disant dépasser les pures notion de théorie de la complexité de l'information utilisées dans l'autre papier.
# Fil mastodon qui discute le papier
Posté par thoasm . Évalué à 5 (+2/-0).
Le point principal du papier n'est pas inattendu évidemment, c'est juste une preuve mathématique que faire réapprendre un LLM à partir de données générées par un ou d'autres LLM mène inévitablement à un effondrement. C'est valable aussi si la proportion de "nouveauté" d'information correcte injectée à chaque réapprentissage est trop faible.
Ce fil Mastodon discute de tout ça.
Je note notamment ce commentairece commentaire de Dan Piponi qui pointe que les modèles récent n'ont pas pour but de reproduire la distribution d'apprentissage initial mais aussi de réaliser des tâches hors distribution, et cite le papier
From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence, qui discute entre autre de comment maximiser l'utilité du modèle à ressource computationnelle contrainte étant donné les jeux d'apprentissages, en disant dépasser les pures notion de théorie de la complexité de l'information utilisées dans l'autre papier.
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.