LinuxFr.org : les contenus de aboulle

ollama et le GPU

2024-04-16T17:06:13+02:00

Bonjour à tous,

lors d'un précédent journal concernant les LLM, poulpatine m'a fait remarquer que je faisais erreur en affirmant que ollama ne fonctionne pas avec les GPU sous linux.
En effet j'avais tort. Enfin, en partie; je m'explique:
- en passant par l'installation standard de ollama, ollama tourne via un service systemd. Dans ce cas, le GPU n'est pas utilisé.
- par contre, en lançant un serveur ollama via une commande ollama serve, l'inférence utilise parfaitement le GPU.

Est-ce que l'un d'entre vous aurait une idée ?

PS pour la modération: si ce journal va mieux dans le forum n'hésitez pas à le déplacer.

Télécharger ce contenu au format EPUB

Commentaires : voir le flux Atom ouvrir dans le navigateur

Introduction pratique aux grands modèles de langage / LLM

2024-03-03T11:22:56+01:00

Sommaire

Dans cet article je me propose de faire une introduction aux grands modèles de langage, et en particulier à leur utilisation en local (i.e., hors ligne). Si vous ne souhaitez pas vous inscrire sur des plateformes en ligne, que vous êtes soucieux de l'utilisation qui est faite de vos données, que vous ne souhaitez pas débourser le prix d'un abonnement, mais que toutefois ces technologies suscitent votre intérêt, alors cet article est peut-être pour vous. Je n'aborderai pas les aspects théoriques/algorithmiques, et je serai amené à faire des simplifications que des experts jugeront probablement excessives. Par ailleurs, ce journal sera truffé d'anglicismes. Bien qu'il existe la plupart du temps des équivalents en français, la majorité des ressources disponibles étant en anglais, pour des raisons pédagogiques il m'a semblé préférable de garder les termes anglophones.

1. Notions de base

1.1 Fonctionnement d'un LLM (Large Language Model)

La tâche d'un LLM est de prédire le prochain mot d'une séquence de mots passée en instruction. De façon schématique un générateur de texte fonctionne de la façon suivante:

le texte entré par l'utilisateur est découpé en tokens. Ces tokens correspondent à des mots, des fractions de mots, des signes de ponctuations, de symboles d'instructions… chaque LLM a son propre système de tokenisation.
les tokens sont vectorisés, c'est-à-dire convertis en vecteurs qui seront ensuite injectés dans le réseau de neurones. L'ensemble de ces vecteurs forme un embedding. Les coordonnées des vecteurs-tokens sont déterminées pendant la phase d'apprentissage du réseau de neurone.
la liste de ces vecteurs (ainsi que la liste de leur position) sont entrés dans le réseau de neurone. Les réseaux de neurones sont basés sur des modèles transformers, inventés par Google [1] et qui constituent la base de tous les outils tels que chatGPT d'openAI et d'autres, notamment la start-up française Mistral qui a réussi à s'imposer comme un acteur majeur du secteur.
la sortie du réseau de neurones est une série de tokens associée à une distribution de probabilité. Une tâche essentielle consiste à choisir un token parmi ceux proposés. C'est le travail du sampler.
dans les modèles de type GPT (Generative pre-trained transformer) la génération d'une grande suite de mot est conduite de façon auto-régressive: le token prédit est ajouté à la séquence d'entrée pour prédire le suivant, et ainsi de suite jusqu'à ce qu'un critère d'arrêt soit vérifié.

1.2 Considérations matérielles

Une des particularités des réseaux de neurones est leur taille imposante. Par exemple le modèle Llama 13B de Meta pèse 25 Go; "13B" signifie ici que le modèle contient 13 milliards de paramètres (poids et biais) ; ces paramètres sont codés sur 16 bits, de sorte que la taille finale du modèle, en octets, est 2 fois le nombre de paramètres.

Pour chaque token généré, l'intégralité du réseau de neurone doit être transféré de la mémoire vers les unités de calculs. Ceci implique que 1) le modèle doit tenir en mémoire, 2) la bande passante doit être suffisante pour ne pas altérer la vitesse de génération, et 3) les unité de calculs doivent pouvoir exécuter le réseau de neurone rapidement.

Exemple concret. Je dispose d'une carte Nvidia Quadro P5000, datant de 2016, avec 16Go de vRAM, FP16 = 138.6 GFLOPS en float 16 et une bande passante de BW = 288.5 Go/s. Le rapport opération par octet (FP16/BW) vaut 0.48. Ceci doit être comparé à la densité arithmétique du réseau de neurone [2]. Pour Llama 13B, une fois le modèle chargé en mémoire, pour une inférence, il y a 0.2Go de données déplacées et 12.8 milliards d'opérations, soit un rapport opération par octet de ~63 ce qui dépasse largement les capacités de la carte (pour le détail des calculs je vous renvoie au site précédent). Dans le cas de ce GPU, nous sommes limités par sa puissance brute. La vitesse théorique de génération de texte, pour une fenêtre de contexte de 5000 tokens (ce terme sera défini plus bas), est de ~11 tokens/s. En réalité celle-ci est plus proche de 17 tokens/s. La raison de cette différence sera abordée plus loin.

À l'inverse pour une RTX 4090 (24Go vRAM, FP16 = 82.6 TFLOPS, BW = 1008 Go/s), le rapport opération par octet vaut 83. Dans ce cas, c'est la bande passante mémoire qui limite la vitesse de génération de texte. Pour un modèle 25 Go, et une fenêtre de contexte de 5000 tokens, la vitesse de génération de texte est donc de 40 tokens/s.

Étant donnés les tarifs très élevés des GPU haut de gamme, évaluer ses besoins en termes de vitesse de génération peut être à prendre en compte avant l’acquisition d’un GPU dédié aux LLM. À noter qu'il est parfaitement possible de faire tourner un LLM sur CPU, avec cependant des vitesses de génération fortement dégradées.

1.3 Compression des modèles et nomenclature

Un lecteur attentif aura sans doute noté que le modèle Llama 13B (25Go) ne devrait pas tenir dans la mémoire vidéo de la carte Quadro P5000 (16 Go), ni dans celle de la carte RTX 4090 (24 Go). En effet, et même si cela parait complètement contre intuitif au premier abord, il est possible de réduire le nombre d'octets sur lesquels sont codés les paramètres sans significativement altérer les performances du modèle. Le terme utilisé est quantization. Le format historique est GGML (GPT-Generated Model Language) qui permet de réduire l'encodage jusqu'à 4 bits. Développé par Georgi Gerganov (également auteur de l'indispensable bibliothèque llama.cpp), ce format est aujourd'hui obsolète et remplacé par GGUF (GPT-Generated Unified Format). Il existe un autre format, GPTQ (Generalized Post-Training Quantization), optimisé pour GPU [3].

Le site incontournable pour trouver ces modèles compressés est huggingface.co, et en particulier le dépôt de TheBloke. Ceci nous amène à décrire la nomenclature de nommage des modèles. Par exemple "codellama-13b-instruct.Q5_K_M.gguf" signifie:

modèle de base: codellama
13b: 13 milliards de paramètres
instruct: modèle optimisé pour les questions/réponses (chat)
Q5_K: 5 bits de quantization
M: taille moyenne
gguf: le format de compression

Avec ce format, le modèle initial de 25Go passe à 9.23Go. TheBloke donne des indications qualitatives sur la dégradation des performances induites par la compression. Par exemple pour Q5_K_M: "large, very low quality loss - recommended". Avec ces formats compressés, il est donc possible d’exécuter des modèles 13B et jusqu'à 30B sur des GPUs "grands publics", avec une amélioration significative des performances (en termes de tokens/s) comparativement aux modèles non compressés.

1.4 Cas d'étude et aparté sur les licences

Il suffit de visiter le site huggingface pour se rendre compte de la quantité pharaonique de modèles disponibles. Dans ce journal je me focaliserai sur des modèles optimisés pour de la génération de code, en particulier Code Llama 13B Instruct, développé par Meta et compressé à 5bits. Stricto sensu les modèles de Meta ne sont pas libres car, même si on a accès au code, qu'on peut le modifier et le redistribuer, l'utilisation commerciale est limitée à 700 millions d'utilisateurs mensuels. Cette restriction ne posera pas de problème pour la plupart des lecteurs, mais les plus puristes pourront préférer, par exemple, StarCoder2, ou encore les modèles de Mistral qui fonctionnent très bien pour de la génération de code et sont distribués sous licence Apache… pour l'instant, puisque leurs derniers modèles ont basculé vers des licences commerciales.

2. LM studio: le point d'entrée

Pour débuter LM studio est parfait. Il est disponible sur toutes les plateformes. Il permet l’exécution locale, sur CPU ou GPU, le téléchargement de modèles sans quitter le programme, les modèles sont bien décrits, LM studio indique s'ils sont compatibles avec le matériel (notamment en termes de vRAM).

Pour chaque modèle LM studio charge des paramètres par défaut (pour le prompt, calcul et sampler) qui fonctionnent, mais qu'il est possible de modifier à loisir, cf. encadré rouge ci-dessous. Comme tout fonctionne out of the box, c'est une bonne occasion d'examiner le rôle des différents paramètres de calcul, de l'inférence et du sampler. Ces paramètres sont accessibles dans le volet de droite du programme (encadré en rouge).

Paramètres de prompt

Preset: format du prompt, à choisir en fonction du modèle
Pre-prompt: permet de guider les réponses du LLM. L'instruction "You are a helpful coding AI assistant" est celle donnée par défaut. J'ai ajouté "Answer in a concise way" afin de réduire la verbosité des réponses.

Paramètres de calcul ("GPU acceleration")

n_gpu_layers : les réseaux de neurones sont formés d'un superposition de couches. Ce paramètre permet d'affecter le calcul d'un certain nombre de couches au GPU. Le reste sera pris en charge par le CPU. Pour Code Llama 13B (9.23 Go), qui compte 40 couches, le modèle tient intégralement dans les 16 Go de vRAM. Dans le cas contraire il aurait fallu mettre un nombre entre 1 et 40. "-1" = affecter toutes les couches au GPU.
n_ctx : la longueur du contexte. C'est le nombre de tokens maximum passé au LLM. Cela va définir la longueur de sa mémoire. Code Llama a été entraîné avec une fenêtre de contexte d'environ 16 000 tokens et peut fonctionner pour des contextes allant jusqu'à 100 000 ! [4]. En pratique, pour des questions/réponses, quelques milliers suffisent.

Paramètres du sampler ("Inference parameters")

temp (température) : détermine la possibilité pour le sampler de sélectionner un token qui n'a pas la probabilité la plus élevée. On parle souvent de "créativité" du LLM ; "variabilité" serait plus approprié… deux réponses successives au même prompt varieront très fortement pour des températures élevées. Traditionnellement la température varie entre 1 et 2. Pour du code on souhaite que la génération soit la plus factuelle possible, donc de très faibles températures sont préférables. La valeur est ici 0.01.
tokens to generate: nombre maximum de token à générer. "-1" = pas de limite.
top_k, top_p et min_p sont similaires et visent à réduire le nombre de tokens parmi lesquels choisir en sortie du réseau de neurone. top_k réduit la liste des tokens possibles aux k les plus probables. top_p, sélectionne les tokens les plus probables dont la somme est égale à top_p. Les tokens de probabilités inférieure à min_p sont exclus.
repeat_penalty: pénalise les tokens répétés. Pour du code, mettre cette valeur au minimum possible = 1.

En tout état de cause, dès lors que la température est proche de 0, les paramètres du sampler n'ont plus d'influence car c'est toujours le token le plus probable qui sera sélectionné.

De plus amples informations sont données ici [5] [6] [7] . La documentation de ollama, fournit une liste très complète des paramètres qu'il est possible de contrôler, et une description de leur rôle. Comme beaucoup d'autres logiciels du même type, LMstudio est basé sur le projet Llama.cpp, mais n'est pas libre. Ceci nous amène donc au logiciel suivant.

3. Oobabooga/text-generation-webui: le couteau suisse

Oobabooga/text-generation-webui est un frontend à de nombreux modèles, écrit en Gradio. La prise en main est plus compliquée, mais tout est paramétrable et la licence est libre. L'installation est automatisée via un script shell, ou peut se faire à la main, ce qui peut être intéressant si une installation de python est déjà présente sur le PC. Première chose à faire, dans l'onglet "Model", télécharger le modèle depuis huggingface, en précisant bien quel niveau de compression pour les modèles GGUF (à droite ci-dessous). Les paramètres de calcul sont à définir dans la partie gauche. Il conviendra de sélectionner le "loader" adapté au model: ici llama.cpp pour codellama-13b. Les captures ci-dessous donnent les paramètres optimisés pour Code Llama. La quantité de paramètres est beaucoup plus importante que pour LM sudio ; la lecture de la documentation est fortement recommandée.

Les paramètres d'inférence, tels que définis précédemment, se règlent dans l'onglet "Parameters". Le menu "Preset" permet de sélectionner des types de personnalités pré-configurées, mais tout est paramétrable.

Les paramètres du prompt se règlent dans le sous-onglet "Parameters/Instruction template". Les paramètres par défaut fonctionnent bien. Ici l'instruction (entre les balises <>) a été modifiée de la même façon que dans le cas de LM studio.

Enfin, l'interaction avec le LLM se passe dans l'onglet "Chat" (ou "Default", ou "Notebook", seule la mise en forme change), en prenant soin de sélectionner le format de prompt adapté au modèle (ici, "instruct"). La réponse fournie par LLM est correcte et rigoureusement identique à celle fournie par LM studio avec le même modèle.

4. Ollama: le client CLI

L'interaction avec un LLM se faisant essentiellement en mode texte, une interface en ligne de commande est particulièrement pertinente. L'un des programmes le plus populaire est ollama. Les principaux LLM, et pas seulement ceux basés sur Llama, sont compatibles avec ollama. Après installation, dans un terminal il suffit d'entrer, par exemple, ollama run codellama:13b-instruct. Si le modèle est déjà présent l'interaction avec le LLM commencera. Si non, ollama téléchargera le modèle, puis initiera l'interaction. Le principal avantage de ollama est sa grande simplicité d'utilisation, permettant de rapidement tester plusieurs LLM.

Celui-ci souffre cependant de deux inconvénients. Sous Linux et Windows ollama n'est (pour l'instant ?) pas compatible avec les GPU. Sous Macos, ollama prend en charge les récentes puces M. Un deuxième problème est la valeur des paramètres par défauts. En particulier la température est trop élevée, ce qui amène ollama à produire des réponses qui ne sont pas identiques pour différentes inférences avec le même prompt. Ollama va jusqu'à produire des liens vers des images qui n'existent pas. Ceci est illustré sur la figure ci-dessous.

Il est néanmoins possible de modifier ces paramètres, mais de façon moins immédiate que pour les précédents programmes. Pour cela il faudra créer un "Modelfile" sur mesure:

FROM codellama:13b-instruct
PARAMETER temperature 0.01
PARAMETER num_ctx 5000
PARAMETER repeat_penalty 1
PARAMETER num_predict -1
PARAMETER top_k 40
PARAMETER top_p 0.95
PARAMETER seed -1
SYSTEM """
You are a helpful coding assistant. Answer in a concise way.
"""

TEMPLATE """[INST] <<SYS>>{{ .System }}<</SYS>>

{{ .Prompt }} [/INST]
"""
PARAMETER rope_frequency_base 1e+06
PARAMETER stop "[INST]"
PARAMETER stop "[/INST]"
PARAMETER stop "<<SYS>>"
PARAMETER stop "<</SYS>>"

Les paramètres SYSTEM et TEMPLATE définissent le format du prompt. Chaque LLM a sa propre syntaxe. Ici il s'agit de celle pour des LLM basés sur llama. Le respect de la syntaxe est crucial, notamment les espaces et les sauts de lignes, faute de quoi le LLM produira des réponses potentiellement absurdes (NB: cette syntaxe a déjà été aperçue dans le cas de Oobabooga).

Il faudra ensuite créer un nouveau modèle contenant ces modifications, avant de pouvoir interagir avec :

> ollama create NomDuModèle -f /chemin/vers/le/fichier/Modelfile
> ollama run NomDuModèle

Avec ces modifications, les réponses de ollama sont parfaitement répétables et sans "hallucinations". Exemple ci-dessous:

5. Développer son propre client CLI

Étant donné les limitations de ollama, en particulier l'absence de compatibilité GPU, il peut être intéressant de développer sa propre interface. La principale bibliothèque pour cela est llama.cpp. Cette bibliothèque est à la base de la plupart des clients existants à l'heure actuelle. Contrairement à ce que son nom pourrait laisser penser, llama.cpp est compatible avec un très grand nombre de modèles de langage. Cette bibliothèque, comme les programmes précédents, permet de fonctionner en mode serveur web qui pourra être interrogé à distance par des clients n'ayant pas les ressources suffisantes pour exécuter un LLM. Ce mode serveur est intégralement compatible avec l'API de Open AI, de sorte qu'une application développée avec l'API d'Open API pourra se brancher sur un serveur hébergé localement.

Autre avantage indéniable, il existe un très grand nombre de bindings pour différents langages. En python, il s'agit de llama-cpp-python, qui s'installe via pip. La prise en charge du GPU nécessite au préalable l’installation des outils CUDA, puis l'installation de llama-cpp-python:

> conda install cudatoolkit-dev
> CMAKE\_ARGS="-DLLAMA\_CUBLAS=on" pip install llama-cpp-python --no-cache-dir

Le simple fichier Test.py ci-dessous :

from llama_cpp import Llama

llm = Llama(model_path="codellama-13b-instruct.Q5_K_M.gguf",
            n_gpu_layers=-1,
            n_ctx=5000,
            n_batch=512,
            n_threads=None,
            n_threads_batch=None,
            verbose = False)

output = llm("Q: plot a sine curve. A:",
           max_tokens=10000,
           temperature=0.01,
           repeat_penalty=1,
           top_p=0.95,
           top_k=20,
           min_p=0,
           echo=False,
           stop=["Q"])

print(output['choices'][0]['text'])

renvoie la réponse suivante:

\begin{code}
plot(sin(x),x=0..2*pi)
\end{code}

Ceci diffère fortement des cas précédents. La raison est que le format du prompt sous la forme de "Q: … A:", ne respecte pas la syntaxe avec laquelle le réseau de neurones a été entraîné. La syntaxe correcte est celle décrite précédemment dans le cas de ollama.

Avec un peu de raffinement, notamment sur la mise en forme du prompt, il est possible d'avoir un client tout à fait acceptable. Pour les lecteurs intéressés, je joins le lien vers mon dépôt github: https://github.com/aboulle/mica

Voilà ce que ça donne:

Évidemment, tracer une sinusoïde n'est pas une tâche très complexe. Cet exemple a servi ici à régler les différents paramètres. Je vous invite à essayer sur des cas plus complexes. Par ailleurs Code Llama et Code Llama instruct, sont multilangages, Code Llama Python étant, comme son nom l'indique, optimisé pour Python. Enfin, seul le modèle instruct, présenté dans cet article, est optimisé pour les questions/réponses. Les autres sont recommandés pour de la complétion de code et du infilling.

Remerciement : la rédaction de ce journal m'a été inspirée par l'excellent Guillaume Poggiaspalla, co-présentateur du non moins excellent et indispensable podcast Tech Café. La qualité de la veille technologique et les efforts de vulgarisation, produits deux fois par semaine, sont tout simplement impressionnants. PS: je ne suis pas du tout affilié avec ce podcast.

Télécharger ce contenu au format EPUB

Commentaires : voir le flux Atom ouvrir dans le navigateur

Le splash screen d’ubuntu empêche le démarrage ?

2022-01-17T20:13:13+01:00

Oui, je sais, ça a l’air complètement idiot.

Voici l’histoire : au boulot je dispose d’une station Dell précision sur laquelle j’ai une kubuntu qui tourne sans problème depuis des années. Depuis quelques mois j’ai constaté un phénomène étrange au démarrage :
Le bios démarre et affiche le logo Dell. S’en suit une tentative de boot, puis un redémarrage, tout ça sans intervention de ma part. Re-bios, et le splash screen d’ubuntu reste indéfiniment à l’écran.

Deuxième tentative: Au reboot je passe en mode recovery; fsck; démarrage non graphique et la ça fonctionne. Si j’essaie de faire ça au premier boot ça ne fonctionne pas.

Par curiosité et voir ce qui se passe au démarrage je décide de booter en mode texte. Je modifie /etc/default/grub et supprime « quiet splash ». Sudo update grub2. Suppression des paquets Plymouth-theme-Ubuntu-text. Et la, miracle ça boote normalement.

Qu’est ce que c’est que ce truc ???

Télécharger ce contenu au format EPUB

Commentaires : voir le flux Atom ouvrir dans le navigateur

Revue (pas du tout exhaustive) de livres orientés machine learning / deep learning

2020-04-21T14:57:32+02:00

Chère linuxfrienne, cher linuxfrien,
voici une petite dizaine d'année que l'"IA" a commencé à diffuser hors de la sphère des scientifiques/développeurs/experts et a commencé à faire la une d'articles plus ou moins grand public.
Étant d'un naturel curieux et, profitant de cette période d'accalmie forcée, je me suis lancé dans lecture d'ouvrages dédiés à l'apprentissage automatique (machine learning) et l'apprentissage profond (deep learning, DL) en Python. Bon en fait j'ai commencé avant, mais on s'en fout.

À toutes fins utiles j'ai pensé partager ici mon ressenti sur ces différents ouvrages. Alors attention, je ne suis pas développeur professionnel et encore moins expert en "IA". De plus il existe une quantité pléthorique de tutoriels, sites web, vidéos, livres dédiés au ML et au DL. Tout ce que suit n'est que mon avis sur un nombre restreint de ressources, mais, cher lecteur, si tu as un profil analogue au mien, à savoir recherche académique + calcul scientifique + un goût prononcé pour le logiciel libre, alors ce qui suit pourrait t’intéresser. Je vais commencer par ceux traitant du machine learning, puis j'aborderai ceux traitant de deep learning.

PS: dans la mesure du possible j'essaye de fournir les liens vers les éditeurs des livres en question ou les sites web orignaux. Bien entendu, la plupart de ces ouvrages sont disponibles chez votre revendeur préféré.

"Data science handbook" par Jake VanderPlas (en anglais):
Livre disponible à l'achat, mais l'auteur le met gracieusement à disposition sur son site, de même que son dépôt git contenant les notebooks Jupyter. Ce livre n'est pas à proprement parler focalisé sur le machine learning, mais ce sujet fait l'objet du dernier chapitre. Le reste de cet ouvrage est excellent pour acquérir les bases du calcul scientifique en Python. Pour ceux déjà familiers du domaine ça fait un bon ouvrage de référence, en complément du très exhaustif SciPy lecture notes. J’ajoute que l’auteur du livre tient également un blog Python de très bon niveau (même si celui-ci semble au point mort depuis 2018).
Machine Learning avec Scikit-Learn par Aurélien Géron (en français), ainsi que Deep Learning avec TensorFlow, du même auteur (en français) ; les deux ouvrages sont disponibles groupés dans une édition mise à jour (en anglais): Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. Je n'ai lu que le premier de ces livres, je ne m'exprimerai donc que sur celui-ci, à savoir celui traitant de la bibliothèque Scikit-Learn. Ici l'auteur propose une revue (non-exhaustive mais déjà très riche) des algorithmes de machine learning appliqués à plusieurs cas très concrets (notamment, mais pas exclusivement, les grands classiques tels que la reconnaissance des chiffres de la base MNIST et la classification des iris sur la base de la longueur et la largeur de pétales). Les notebooks sont très bien faits et disponibles sur le github de l'auteur. Ne pas se laisser déconcerter par les 2 premiers chapitres où l'auteur utilise les algorithmes sans en expliquer le fonctionnement, ce qui risque de donner une impression de boîte noire. L'auteur revient sur le fonctionnement des algorithmes dans les chapitres ultérieurs. Pour ma part je suis resté un peu sur ma faim sur les aspects mathématiques qui sont peu détaillés, mais je suis conscient qu'il est difficile de trouver un équilibre entre la théorie et l'application concrète des algorithmes dans un nombre de page donné, surtout lorsqu'il s'agit d'une bibliothèque aussi massive que Scikit-Learn. En dehors de cette réserve personnelle, ce livre permet rapidement de comprendre les bases du machine learning et de l'appliquer à des cas simples. Je recommande.
Data Science from Scratch par Joel Grus (en anglais). Ce livre est un tour de force dans son genre car, comme son nom l'indique l'auteur ré-implémente tous les algorithmes à partir de zéro en Python pur (!). Étant un habitué de NumPy j'ai abandonné la lecture au bout de 8 chapitres sur les 27, le python pur ne facilitant pas vraiment la lisibilité pour ce qui me concerne. De plus, la réutilisation des algorithmes en question reste limitée car chacun connaît les limites de Python pur en termes de performances. J'ai aussi des réserves sur le côté pédagogique de l'exercice en ce sens qu'il pousse à réinventer la roue plutôt que d'utiliser des bibliothèques bien établies. Je ne recommande pas.

Passons maintentant au deep-learning.
- Deep Learning with Python par François Chollet. L'auteur est le créateur de Keras qui est sans doute la bibliothèque la plus user-friendly pour débuter dans le deep-learning. Keras est en quelque sorte un front-end à d'autres bibliothèques de deep learning telles que TensorFlow ou Theanos. L'auteur a fait le choix délibéré de ne pas détailler les aspects mathématiques et présente le fonctionnement des algorithmes par l'exemple. Pour les maths il faudra aller voir ailleurs. J'y reviens ci-dessous. Là encore, les notebooks sont disponibles. Alors je n'irai pas par quatres chemins ; ce bouquin est tout simplement excellent: très pédagogique, les codes sont expliqués ligne par ligne, et la puissance de Keras est évidente. Chaque conclusion de chapitre et sous-chapitre résume les concepts clés à retenir. Des tableaux pratiques recensant quels algos utiliser dans quels cas sont éalement donnés. J'en suis au 2/3 et ça commence à se corser un peu (ça parle de traitement du langage, ce qui est un peu trop éloigné de mon domaine), mais j'ai bien l'intention d'aller jusqu'au bout. Je recommande.
- complément indispensable au livre précédent pour ceux qui souhaitent comprendre les fondements mathématiques, le livre en ligne Neural Networks and Deep Learning. Tout y est expliqué de façon très pédagogique: les fonctions d'activation, les fonctions de coûts, la rétro-propagation, les techniques de régularisation, jusqu'aux réseaux convolutifs. Les notebooks originaux sont dispos en version Python 2.7 et mis à jour en Python3. A lire absolument !
- j'ai découvert le site précédent en regardant les vidéos de l'excellente chaine 3blue1brown, en particulier la série dédiée aux réseaux de neurones.

En bonus, la bible du deep learning: https://www.deeplearningbook.org/
Pas (encore) lu mais c'est, paraît-il, un incontournable.

Bonne lecture :-)

Télécharger ce contenu au format EPUB

Commentaires : voir le flux Atom ouvrir dans le navigateur

Jupyter dans VS code

2019-10-11T10:06:52+02:00

Ceci est un journal marque-page.

Comme je l'évoquais précédemment, une des critiques que l'on peut formuler à l'encontre de Jupyter est qu'il faille travailler dans un navigateur web, ce qui s'avère peu ergonomique. Il existe certes le programme nteract qui permet d'afficher et d'exécuter les notebooks hors du navigateur, mais on est encore loin d'un éditeur de texte.

Je n'utilise pas cet éditeur de texte en particulier (et j'ignore si il y en a beaucoup sur DLFP), mais Microsoft vient d'annoncer le support des notebooks Jupyter au sein de Visual Studio Code via leur extension Python. Je cite:

You can now directly edit .ipynb files and get the interactivity of Jupyter notebooks with all of the power of VS Code. You can manage source control, open multiple files, and leverage productivity features like IntelliSense, Git integration, and multi-file management (…).

Après un test rapide, ça ne semble pas supporter les ipywidgets, mais je trouve l'initiative intéressante.

Télécharger ce contenu au format EPUB

Commentaires : voir le flux Atom ouvrir dans le navigateur

Créer une application web avec Jupyter, ipywidgets et voilà

2019-10-04T22:30:09+02:00

Vous connaissez sans doute Jupyter, cet outil de développement tournant dans un navigateur qui est particulièrement en vogue chez les scientifiques et plus généralement dans les domaines liés au traitement des données. Aujourdʼhui je vais te parler d’une possibilité offerte par Jupyter qu’il ne me semble pas, sauf erreur de ma part, avoir vu évoquée ici, à savoir le développement dʼapplications web.

lien nᵒ 1 : Journal à l’origine de la dépêche
lien nᵒ 2 : Site de Jupyter
lien nᵒ 3 : Code des exemples de l’article

Sommaire

À propos de Jupyter
Ajouter des composants graphiques avec ipywidgets
Masquer le code avec Appmode ou Voilà
Héberger l’application web
Mot de la fin

À propos de Jupyter

À titre personnel, et peut‐être comme beaucoup des plus anciens (disons 40 ans et plus), j’ai longtemps été très réticent à ce « machin à la mode » ne voyant pas bien ce qu’il pouvait apporter à mon flux de travail habituel basé sur un éditeur de texte et une console, et aussi ne lui trouvais‑je que des inconvénients :

lancer jupyter-notebook dans une console, basculer sur le navigateur, parcourir l’arborescence, juste pour pouvoir visualiser un fichier ipynb me semble très peu ergonomique. Nous sommes en 2019 et ce truc ne gère pas le double clic. Il y a des solutions pour contourner ce problème, par exemple nteract est une application de bureau basée sur electron qui permet de se passer du navigateur ;
le fait que les cellules de code puissent être exécutées dans n’importe quel ordre peut amener à des confusions à la lecture des notebooks ;
le format ipynb (qui est en fait du JSON contenant plus d’informations que le simple code) est nativement peu compatible avec Git : par exemple, le simple fait d’exécuter une cellule modifie la numérotation de celle‑ci et Git détecte une modification, là encore, il y a des solutions pour contourner ça, mais tout de même ;
tout cela a été mieux présenté par d’autres que moi (diapos de la présentation filmée).

Eh bien, j’avais tort.

En effet, Jupyter ne vise pas à remplacer notre bonne vieille console, et encore moins notre éditeur de texte favori, mais se place entre les deux. Je paraphraserai la dépêche Python pour les sciences en disant que Jupyter est une console sous stéroïdes. En effet, Jupyter permet d’exécuter des blocs de code sans avoir à écrire, sauvegarder et exécuter un script en bonne et due forme et, à l’instar de la console iPython dont Jupyter dérive directement, tous les objets sont sauvegardés dans un noyau pour pouvoir être réutilisés ailleurs dans le programme, sans avoir à tout réexécuter. Ceci en fait un excellent outil d’expérimentation et de prototypage de programmes.

Par ailleurs, le fait que les notebooks Jupyter contiennent non seulement le code, mais aussi les graphiques et figures produits, et qu’il soit possible d’y adjoindre du texte enrichi (Markdown, HTML, LaTeX…) les rendent particulièrement intéressants pour l’enseignement et le partage des connaissances (et non pas le partage du code, car comme dit précédemment et comme le font remarquer certains à juste titre, le code est fortement obscurci par le format ipynb).

Il est intéressant de noter que Jupyter est régulièrement évoqué au sein du mouvement open science, mouvement qui vise à faciliter la diffusion au sein de la communauté scientifique et auprès du grand public, non seulement des résultats et connaissances scientifiques, mais aussi des données brutes et des protocoles d’analyse et de traitement de ces données. Voir par exemple ces quelques liens : [1], [2] et [3].

Bien évidemment, ces notebooks Jupyter sont exportables dans différents types de formats (HTML, PDF, etc.) et peuvent également être aisément mis en ligne. Nbviewer permet, par exemple, de partager des notebooks simplement en passant une URL ou l’adresse d’un dépôt Git.

Pour modérer cet enthousiasme débordant, il est, premièrement, bon de rappeler que toutes ces visualisations (y compris sur nbviewer) sont strictement statiques. Il n’est pas possible d’interagir avec celles‑ci et donc de réexécuter tout ou partie du notebook. Deuxièmement, c’est bien joli de partager des notebooks, mais quid des lecteurs qui ne maîtrisent pas bien, voire pas du tout, le langage dans lequel lesdits notebooks ont été développés ? Ce sont ces points que je me propose d’aborder ici.

P.‑S. — Toutes les bibliothèques présentées ci‑dessous sont installables via pip ou conda-forge.
P.‑P.‑S. — Les petits extraits de code donnés ci‑dessous sont disponibles sur mon GitHub.

Ajouter des composants graphiques avec ipywidgets

Ipywidgets désigne un ensemble de composants graphiques pour le langage Python (slider, combo box, boutons, etc.) destinés à rendre les notebooks plus interactifs. En gros, il s’agit d’une architecture permettant de lier un objet Python (le widget), tournant dans le noyau, à sa représentation JavaScript/HTML/CSS tournant dans le navigateur. Par exemple, afficher un slider qui permet de modifier la variable d’entrée d’une fonction et d’en afficher le résultat s’écrit simplement :

from ipywidgets import interact
import ipywidgets as widgets

def f(x):
    return x**2

interact(f, x=10.);

La fonction interact est, en fait, un raccourci vers un ensemble de widgets graphiques avec des choix faits par défaut selon le type d’objet (int, float, bool, list, etc.) passé à la fonction f. Il est possible d’avoir un contrôle beaucoup plus fin en paramétrant le widget à la main. Le code ci‑dessous donne strictement le même résultat :

# définit l’objet slider
mon_slider = widgets.FloatSlider(
    value=10,
    min=-10,
    max=30,
    step=0.1,
    description='x',
    disabled=False,
    continuous_update=True,
    orientation='horizontal',
    readout = True
)

# crée une zone de texte pour l’affichage du résultat
resultat = widgets.Output()

# définit l’action à effectuer lorsque le slider est modifié
def maj_resultat(change):
    with resultat:
        resultat.clear_output()
        print(f(change['new']))

# observe le slider
mon_slider.observe(maj_resultat, names='value')

# affiche les widgets
display(mon_slider,resultat)

C’est, évidemment, beaucoup plus lourd, mais il me semble que cet exemple illustre bien la richesse des potentialités offertes par ipywidgets. La documentation d’ipywidgets est tout simplement excellente, et il est possible de maîtriser cette bibliothèque assez rapidement.

Ipywidgets n’est pas seulement une bibliothèque d’objets graphiques. Il s’agit véritablement d’un cadre de développement sur lequel les développeurs peuvent s’appuyer pour écrire leurs propres bibliothèques de widgets. En voici quelques‑unes :

ipyvuetify, pour celles et ceux qui trouveraient les widgets de base d’ipywidget trop austères, cette bibliothèque apporte à Jupyter les widgets vuetify qui implémentent des composants graphiques obéissants aux spécifications de material design ;
bqplot, un « doit‑avoir » absolu pour quiconque s’intéresse à la visualisation en 2D de données ; je donnerai un exemple d’implémentation ci‑dessous, mais, en bref, dans bqplot chaque élément d’un graphique (axes, légende, données, graduations, etc.) est en fait un widget avec lequel il est possible d’interagir et de modifier les propriétés programmatiquement ;
ipyvolume, même chose, mais pour la visualisation de données en 3D, en s’appuyant sur WebGL ;
ipyleaflet, affichage et manipulation de cartes et données géographiques ;
ipywebrtc, permet de diffuser et manipuler du contenu audio ou vidéo depuis à peu près n’importe quelle source (fichier, webcam, etc.).

Afin d’illustrer la compatibilité entre ipywidgets et d’autres bibliothèques (ici bqplot) le code ci‑dessous permet d’effectuer les actions suivantes :

sélectionner une fonction à tracer via un menu déroulant ;
la figure est mise à jour en fonction du choix (ipywidgets -> bqplot) ;
il est possible de déplacer des points dans la figure ;
les coordonnées des points sont affichées dans un champ texte (bqplot -> ipywidgets).

from ipywidgets import interact, fixed
import ipywidgets as widgets
from bqplot import pyplot as plt
import numpy as np
from numpy.random import rand

# génère des abscisses
x = np.arange(0,10,0.1)

# crée une figure y = f(x)
ma_figure = plt. figure(animation_duration = 300)
mon_tracé = plt.scatter(x, x**2, enable_move=True)
plt.xlabel('Axe des x')

# initialise une zone d’affichage de texte
resultat2 = widgets.Output()

# choix de la fonction à tracer -> crée automatiquement un menu déroulant
# modifie le tracé en fonction de la valeur du widget
# il est possible d’utiliser interact via un décorateur
# il est possible de fixer les variables ne devant pas faire l’objet d’un widget
@interact(fonction=['parabole', 'sinus', 'hasard'], x=fixed(x))
def choix_fonction(fonction, x):
    if fonction=='parabole':
        with mon_tracé.hold_sync():
            mon_tracé.x = x
            mon_tracé.y = x**2
            plt.ylabel('x au carré')
    if fonction=='sinus':
        with mon_tracé.hold_sync():
            mon_tracé.x = x
            mon_tracé.y = np.sin(x)
            plt.ylabel('sin(x)')
    if fonction=='hasard':
        with mon_tracé.hold_sync():
            mon_tracé.x = x
            mon_tracé.y = rand(len(x))
            plt.ylabel('Nombres aléatoires')

# fonction qui lit et affiche les coordonnées d’un point déplacé
def affiche(name, value):
    with resultat2:
        resultat2.clear_output()
        print('Le point n° %i a été déplacé en x = %f y = %f'
              %(value['index'], value['point']['x'],value['point']['y']))

# détecte le déplacement d’un point
mon_tracé.on_drag_end(affiche)     

# crée la GUI
# il est possible de mixer des widgets créés via interact avec d’autre définis « à la main »
widgets.VBox([ma_figure,resultat2])

Toutes ces bibliothèques sont relativement jeunes et il peut arriver que la documentation ne soit pas exhaustive (c’est, par exemple, le cas pour bqplot). Dans ce cas, il peut être très intéressant de cloner ou télécharger le dépôt GitHub et d’aller fouiller dans le répertoire examples. Dans le cas de bqplot, c’est une véritable mine d’or.

Masquer le code avec Appmode ou Voilà

Maintenant que nous savons comment créer une petite interface graphique, pourquoi ne pas cacher tout ce code afin de ne pas effrayer les débutants ? Appmode est une extension pour Jupyter qui permet très exactement de faire cela : l’extension ajoute un bouton Appmode à l’interface de Jupyter qui permet de créer une nouvelle instance du notebook, celui‑ci est alors entièrement exécuté et seules les widgets sont affichées.

Si elle est très efficace, cette extension peut être problématique si le notebook est destiné à être hébergé sur un serveur Jupyter ouvert fourni pas votre entreprise, votre université ou votre école… En effet, le notebook reste entièrement accessible et rien n’interdit l’exécution de code arbitraire. C’est ce problème que solutionne voilà. Ce projet est très jeune puisqu’il n’a été annoncé que cet été dans ce très instructif billet de blog, mais il s’avère déjà particulièrement efficace. En bref, lorsque l’adresse URL du notebook est appelée, celui‑ci s’exécute intégralement et les cellules de résultats (incluant les widgets) sont converties en une page HTML + JavaScript qui est ensuite présentée à l’utilisateur. En principe, il (ou elle) ne peut plus exécuter de code arbitraire. Pour celles et ceux à qui ça parle (dont je ne fais pas partie), ça repose, entre autres, sur tornado.

La galerie de voilà regorge d’exemples, comme celui‑ci où l’on peut jouer avec une fonction gaussienne. En voyant cet exemple, il est utile de rappeler que tout ceci n’est rien d’autre qu’un notebook Jupyter.

Héberger l’application web

Dernière étape pour finaliser notre application web : la mise en ligne. Comme je l’évoquais plus haut, nbviewer est exclu, puisque celui‑ci ne permet pas d’interagir avec les notebooks. Si vous avez la chance d’avoir votre propre serveur Jupyter distant (ou d’avoir des administrateurs et des administratrices compétents et sympas), c’est immédiat. Il vous suffit d’activer l’extension voilà : jupyter serverextension enable voila --sys-prefix, puis de préfixer l’URL du notebook avec « voila ». http://URL_DU_SERVEUR/NOM_DU_NOTEBOOK.ipynb devient http://URL_DU_SERVEUR/voila/NOM_DU_NOTEBOOK.ipynb

Notez qu’il est possible de visualiser le rendu du notebook en local, entrez voila notebook.ipynb dans votre terminal et le rendu sera visible sur localhost:8866.

Si vous n’avez pas de serveur Jupyter ouvert sur le Web, tout n’est pas perdu. Mybinder permet de venir se brancher sur un dépôt Git, puis, à l’aide d’un fichier requirements.txt ou environment.yml listant les dépendances requises, Mybinder va construire une image Docker du dépôt et votre notebook sera servi via un JupyterHub. Le contenu du fichier environment.yml pour les exemples précédents est :

channels:
  - conda-forge
dependencies:
  - numpy
  - ipywidgets
  - bqplot
  - voila

Finalement le notebook est accessible par un lien de la forme :
Deux remarques utiles à ce stade :

la création de l’image Docker peut prendre plusieurs minutes ;
concernant voilà, il existe apparemment un moyen d’atterrir directement sur le rendu HTML du notebook et non le notebook lui‑même en préfixant le nom du notebook avec /voila/render/, mais pour moi cela ne semble pas fonctionner avant la première création de l’image ; il faut donc cliquer sur le bouton « voilà » dans le notebook pour cacher le code source.

Heroku est une solution alternative à mybinder. La procédure de déploiement est cependant moins aisée (mais les tutoriels sont très bons), et les dépendances considérées comme « obscures » par heroku ne sont pas gérées : par exemple, SciPy n’est pas géré, ce qui est handicapant pour des applications techniques ou scientifiques.

Mot de la fin

Pour conclure, et pour illustrer le fait qu’il est possible de créer des applications relativement élaborées, je partage ici un lien vers une application scientifique que j’ai récemment développée et qu’un collègue de notre département TIC a œuvré à mettre en ligne (un grand merci à lui !).

En bref, il s’agit, dans le graphique de droite, de faire coller la courbe calculée (en rouge) sur des mesures de diffraction des rayons X expérimentales. Les graphes de gauche sont manipulables et le rendu des calculs est donné en temps réel dans le graphe de droite. Pour le contexte, l’objectif final est de déterminer les dommages que subissent des matériaux soumis à des radiations. Ces dommages sont quantifiés par l’évolution en profondeur du taux de déformation et de désordre atomique (graphes de gauche). Le calcul est paramétré par les différents widgets. C’est encore expérimental, la stabilité n’est donc pas garantie ; de plus, il est possible que l’URL change dans les jours à venir.

Si ça vous intéresse, voici les sources.

Télécharger ce contenu au format EPUB

Commentaires : voir le flux Atom ouvrir dans le navigateur

Créer une application web avec Jupyter, ipywidgets et voilà

2019-10-04T09:11:23+02:00

Sommaire

À propos de Jupyter
Ajouter des composants graphiques avec ipywidgets
Masquer le code avec Appmode ou Voilà
Héberger la webapp
Mot de la fin

Cher journal,
tu connais sans doute Jupyter, cet outil de développement tournant dans un navigateur qui est particulièrement en vogue chez les scientifiques et plus généralement dans les domaines liés au traitement des données. Aujourd'hui je vais te parler d'une possibilité offerte par Jupyter qu'il ne me semble pas, sauf erreur de ma part, avoir vu évoquée ici, à savoir le développement d'applications web.

À propos de Jupyter

A titre personnel, et peut-être comme beaucoup des plus anciens (disons 40 ans et plus), j'ai longtemps été très réticent à ce "machin à la mode" ne voyant pas bien ce qu'il pouvait apporter à mon flux de travail habituel basé sur un éditeur de texte et une console, et aussi ne lui trouvais-je que des inconvénients:

lancer jupyter-notebook dans une console, basculer sur le navigateur, parcourir l’arborescence, juste pour pouvoir visualiser un fichier ipynb me semble très peu ergonomique. Nous sommes en 2019 et ce truc ne gère pas le double clic. Il y a des solutions pour contourner ce problème, par exemple nteract est une application de bureau basée sur electron qui permet de se passer du navigateur.
le fait que les cellules de code puissent être exécutées dans n'importe quel ordre peut amener à des confusions à la lecture des notebooks.
le format ipynb (qui est en fait du json contenant plus d'informations que le simple code) est nativement peu compatible avec git : par exemple le simple fait d'exécuter une cellule modifie la numérotation de celle-ci et git détecte une modification. La encore, il y a des solutions pour contourner ça, mais tout de même.
tout cela a été mieux présenté par d'autres que moi par exemple ici (diapos de la présentation).

Et bien, cher journal, j'avais tort.

En effet, Jupyter ne vise pas à remplacer notre bonne vieille console, et encore moins notre éditeur de texte favori, mais se place entre les deux. Je paraphraserai cette dépêche en disant que Jupyter est "une console sous stéroïdes". En effet, Jupyter permet d'exécuter des blocs de code sans avoir à écrire / sauvegarder / exécuter un script en bonne et due forme et, à l'instar de la console iPython dont Jupyter dérive directement, touts les objets sont sauvegardés dans un noyau pour pouvoir être réutilisés ailleurs dans le programme sans avoir à tout ré-exécuter. Ceci en fait un excellent outil d'expérimentation et de prototypage de programmes. Par ailleurs, le fait que les notebooks Jupyter contiennent non seulement le code, mais aussi les graphiques et figures produits, et qu'il soit possible d'y adjoindre du texte riche (markdown, html, LaTeX…) les rendent particulièrement intéressants pour l'enseignement et le partage des connaissances (et non pas le partage du code, car comme dit précédemment et comme le font remarquer certains à juste titre, le code est fortement obscurci par le format ipynb). Il est intéressant de noter que Jupyter est régulièrement évoqué au sein du mouvement open science, mouvement qui vise à faciliter la diffusion, non seulement des résultats et connaissances scientifiques, mais aussi des données brutes et des protocoles d'analyses et de traitements de ces données, au sein de la communauté scientifique et auprès du grand public. Voir par exemple ces quelques liens: [1] [2] [3].
Bien évidemment ces notebooks Jupyter sont exportables dans différents types de formats (html, pdf, etc) et peuvent également être aisément mis en ligne. Nbviewer permet, par exemple, de partager des notebooks simplement en passant une URL ou l'adresse d'un dépôt git.

Pour modérer cet enthousiasme débordant il est premièrement bon de rappeler que toutes ces visualisations (y compris sur nbviewer) sont strictement statiques. Il n'est pas possible d'interagir avec ceux-ci et donc de ré-exécuter tout ou partie du notebook. Deuxièmement, c'est bien joli de partager des notebooks, mais quid des lecteurs qui ne maîtrisent pas bien, voire pas du tout, le langage dans lequel lesdits notebooks ont été développés? Ce sont ces points que je me propose d'aborder ici.

PS1 : toutes les bibliothèques présentées ci-dessous sont installables via pip ou conda-forge.
PS2 : Les petits extraits de code donnés ci-dessous son disponibles sur mon github.

Ajouter des composants graphiques avec ipywidgets

Ipywidgets désigne un ensemble de composants graphiques pour le langage python (slider, combo box, boutons, etc.) destinés à rendre les notebooks plus interactifs. En gros il s'agit d'une architecture permettant de lier un objet python (le widget), tournant dans le noyau, à sa représentation JavaScript/HTML/CSS tournant dans le navigateur. Par exemple, afficher un slider qui permet de modifier la variable d'entrée d'une fonction et d'en afficher le résultat s'écrit simplement

from ipywidgets import interact
import ipywidgets as widgets

def f(x):
    return x**2

interact(f, x=10.);

La fonction interact est en fait un raccourci vers un ensemble de widgets graphiques avec des choix faits par défaut selon le type d'objet (int, float, bool, list, etc.) passé à la fonction f. Il est possible d'avoir un contrôle beaucoup plus fin en paramétrant le widget à la main. Le code ci-dessous donne strictement le même résultat :

#définit l'objet slider
mon_slider = widgets.FloatSlider(
    value=10,
    min=-10,
    max=30,
    step=0.1,
    description='x',
    disabled=False,
    continuous_update=True,
    orientation='horizontal',
    readout = True
)

#créé un zone de texte pour l'affichage du résultat
resultat = widgets.Output()

#définit l'action à effectuer lorsque le slider est modifié
def maj_resultat(change):
    with resultat:
        resultat.clear_output()
        print(f(change['new']))

#observe le slider
mon_slider.observe(maj_resultat, names='value')

#affiche les widgets
display(mon_slider,resultat)

C'est évidemment beaucoup plus lourd, mais il me semble que cet exemple illustre bien la richesse des potentialités offertes par ipywidgets. La documentation de ipywidgets est tout simplement excellente, et il est possible de maîtriser cette bibliothèque assez rapidement.

Ipywidgets n'est pas seulement une bibliothèque d'objets graphiques. Il s'agit véritablement d'un cadre de développement sur lesquels les développeurs peuvent s'appuyer pour écrire leurs propres widgets. En voici quelques uns:
- ipyvuetify: pour celles et ceux qui trouveraient les widgets de base de ipywidget trop austères, cette bibliothèque apporte à Jupyter les widgets vuetify qui implémentent des composants graphiques obéissants aux spécifications de material design.
- bqplot : un "doit-avoir" absolu pour quiconque s’intéresse à la visualisation en 2D de données. Je donnerai un exemple d'implémentation ci-dessous, mais, en bref, dans bqplot chaque élément d'un graphique (axes, légende, données, graduations, etc.) est en fait un widget avec lequel il est possible d'interagir et de modifier les propriétés programmatiquement.
- ipyvolume : même chose mais pour la visualisation de données en 3D, s'appuyant sur WebGL.
- ipyleaflet : affichage et manipulation de cartes et données géographiques.
- ipywebrtc : permet de diffuser et manipuler du contenu audio ou video depuis à peu près n'importe quelle source (fichier, webcam, etc.)

Afin d'illustrer la compatibilité entre ipywidgets et d'autres bibliothèques (ici bqplot) le code ci-dessous permet d'effectuer les actions suivantes:
- sélectionner une fonction à tracer via un menu déroulant
- la figure est mise à jour en fonction du choix (ipywidgets -> bqplot)
- il est possible de déplacer des points dans la figure
- les coordonnées des points sont affichées dans un champs texte (bqplot -> ipywidgets)

from ipywidgets import interact, fixed
import ipywidgets as widgets
from bqplot import pyplot as plt
import numpy as np
from numpy.random import rand

#génère des abscisses
x = np.arange(0,10,0.1)

#créé une figure y = f(x)
ma_figure = plt.figure(animation_duration = 300)
mon_tracé = plt.scatter(x, x**2, enable_move=True)
plt.xlabel('Axe des x')

#initialise une zone d'affichage de texte
resultat2 = widgets.Output()

#choix de la fonction à tracer -> créé automatiquement un menu déroulant
#modifie le tracé en fonction de la valeur du widget
#il est possible d'utiliser interact par un décorateur
#il est possible de fixer les variables ne devant pas faire l'objet d'un widget
@interact(fonction=['parabole', 'sinus', 'hasard'], x=fixed(x))
def choix_fonction(fonction, x):
    if fonction=='parabole':
        with mon_tracé.hold_sync():
            mon_tracé.x = x
            mon_tracé.y = x**2
            plt.ylabel('x au carré')
    if fonction=='sinus':
        with mon_tracé.hold_sync():
            mon_tracé.x = x
            mon_tracé.y = np.sin(x)
            plt.ylabel('sin(x)')
    if fonction=='hasard':
        with mon_tracé.hold_sync():
            mon_tracé.x = x
            mon_tracé.y = rand(len(x))
            plt.ylabel('Nombres aléatoires')

#fonction qui lit et affiche les coordonnées d'un point déplacé
def affiche(name, value):
    with resultat2:
        resultat2.clear_output()
        print('Le point n° %i a été déplacé en x = %f y = %f'
              %(value['index'], value['point']['x'],value['point']['y']))

#détecte le déplacement d'un point
mon_tracé.on_drag_end(affiche)     

#créé la gui
#il est possible de mixer des widgets créés via interact avec d'autre définis "à la main"
widgets.VBox([ma_figure,resultat2])

Tous ces projets sont relativement jeunes et il peut arriver que la documentation ne soit pas exhaustive (c'est par exemple le cas de bqplot). Dans ce cas, il peut être très intéressant de cloner ou télécharger le dépôt github et d'aller fouiller dans le répertoire 'examples'. Dans le cas de bqplot c'est une véritable mine d'or.

Masquer le code avec Appmode ou Voilà

Maintenant que nous savons comment créer une petite interface graphique, pourquoi ne pas cacher tout ce code afin de ne pas effrayer les débutants ? Appmode est une extension pour Jupyter qui permet très exactement de faire cela : l'extension ajoute un bouton 'Appmode' à l'interface de Jupyter qui, lorsqu'il est cliqué, créé une nouvelle instance du notebook, celui-ci est alors entièrement exécuté et seuls les widgets sont affichés.

Si elle est très efficace, cette extension peut être problématique si le notebook est destiné à être hébergé sur un serveur Jupyter ouvert hébergé par votre entreprise / université / école… En effet le notebook reste entièrement accessible et rien n'interdit l'exécution de code arbitraire. C'est ce problème que solutionne voilà. Ce projet est très jeune puisqu'il n'a été annoncé que cet été dans ce très instructif billet de blog mais il s'avère déjà particulièrement efficace. En bref, lorsque l'URL du notebook est appelée, celui s'exécute intégralement et les cellules de résultats (incluant les widgets) sont converties en une page HTML+JavaScript qui est ensuite présentée à l'utilisateur. En principe, l'utilisateur ne peut plus exécuter de code arbitraire. Pour ceux à qui ça parle (dont je ne fais pas partie), ça repose, entre autres, sur tornado.
La galerie de voilà regorge d'exemples. Par exemple celui-ci où on peut jouer avec une fonction gaussienne: lien. En voyant cet exemple il est utile de rappeler que tout ceci n'est rien d'autre qu'un notebook Jupyter.

Héberger la webapp

Derniére étape de finalisation de notre webapp : la mise en ligne. Comme je l'évoquais plus haut, nbviewer est exclu puisque celui-ci ne permet pas d'interagir avec les notebooks. Si vous avez la chance d'avoir votre propre serveur Jupyter distant (ou d'avoir des admins compétents et sympas), c'est immédiat. Il vous suffit d'activer l'extension voilà:

jupyter serverextension enable voila --sys-prefix

puis de préfixer l'URL du notebook avec 'voila' ; par exemple
http://URL_DU_SERVEUR/NOM_DU_NOTEBOOK.ipynb
devient
http://URL_DU_SERVEUR/voila/NOM_DU_NOTEBOOK.ipynb

Notez qu'il est possible de visualiser le rendu du notebook en local simplement en entrant dans votre terminal
voila notebook.ipynb et le rendu sera visible sur localhost:8866.

Si vous n'avez pas de serveur Jupyter ouvert sur le web, tout n'est pas perdu. Binder permet de venir se brancher sur un dépôt git, puis, à l'aide d'un fichier requirements.txt ou environment.yml listant les dépendances requises, Binder va construire une image Docker du dépôt et votre notebook sera servi via un JupyterHub. Le contenu du fichier environment.yml pour les exemples précédents est :

channels:
  - conda-forge
dependencies:
  - numpy
  - ipywidgets
  - bqplot
  - voila

Finalement le notebook est accessible par un lien de la forme :
Deux remarques utiles à ce stade:
- La création de l'image Docker peut prendre plusieurs minutes.
- Concernant voilà, il existe apparemment un moyen d’atterrir directement sur le rendu html du notebook et non le notebook lui-même en préfixant le nom du notebook avec /voila/render/, mais pour moi cela ne semble pas fonctionner avant la première création de l'image. Il faut donc cliquer sur le bouton 'voilà' dans le notebook pour cacher le code source.

Une solution alternative à mybinder est heroku. La procédure de déploiement est cependant moins aisée (mais les tutoriels sont très bons), et les dépendances considérées comme "obscures" par heroku ne sont pas gérées : par exemple SciPy n'est pas géré, ce qui est handicapant pour des applications techniques ou scientifiques.

Mot de la fin

Pour ceux que ça intéresserait, les sources se trouvent ici : https://github.com/aboulle/RaDMaX-webapp

En bref il s'agit dans le graphique de droite de faire coller la courbe calculée (en rouge) sur des mesures de diffraction des rayons X expérimentales. Les graphes de gauches sont manipulables et le rendu des calculs est donné en temps réel dans le graphe de droite. Pour le contexte, l'objectif final est de déterminer les dommages que subissent des matériaux soumis à des radiations. Ces dommages sont quantifiés par l'évolution en profondeur du taux de déformation et de désordre atomique (graphes de gauche). Le calcul est paramétré par les différents widgets. C'est encore expérimental, la stabilité n'est donc pas garantie ; de plus, il est possible que l'URL change dans les jours à venir.

Merci de m'avoir lu jusqu'ici :-)

Télécharger ce contenu au format EPUB

Commentaires : voir le flux Atom ouvrir dans le navigateur

Jupyter et la gestion des caractères de fin de ligne dans les URL de données par Firefox vs Chromium

2019-09-19T18:45:47+02:00

Cher journal,
n'étant pas développeur web ce qui suit est peut-être largement connu ; aussi excuse-moi si j'enfonce des portes ouvertes.

J'ai constaté un comportement étrange de Firefox concernant la gestion des caractères de fin de ligne/nouvelle ligne (\n) lorsque ceux-ci sont inclus dans des URL de données. Pour le contexte, il peut arriver, lorsqu'on travaille sur des serveurs Jupyter distants, que l'utilisateur n'ait pas accès à l'espace de fichier où sont stockés les notebooks. Dans ce cas, un des moyens dont dispose le développeur desdits notebooks pour permettre aux utilisateurs de récupérer les données issues de calculs effectués sur le serveur, est de les inclure directement dans une URL de données. Voir cette discussion ou ce billet par exemple (il parait que cela pose des problèmes de sécurité mais ceci dépasse très largement mes compétences).
Donc, ma solution (pompée sur stackoverflow comme il se doit) pour récupérer des arrays Numpy est la suivante:
1. convertir les arrays en chaine de caractères
2. inclure cette chaine de caractères dans le lien de données

En python ça nous fait :

import numpy as np
from IPython.display import HTML
mon_tableau = np.array([[1,2,3],[4,5,6]])
mon_str = np.array2string(mon_tableau)
lien = "<a download='mon_fichier.txt' href='data:text/csv;charset=utf-8;ascii,"
        + mon_str + "'>texte_du_lien</a>"
HTML(lien)

Surprise: dans les données téléchargées avec Firefox il n'y a pas de saut de ligne. Ça apparait comme ça dans Kate :

[[1 2 3] [4 5 6]]

Alors que les mêmes données, téléchargées avec un navigateur basé sur Chromium, s'affichent correctement (toujours dans Kate) :

[[1 2 3]
[4 5 6]]

Il parait que c'est normal et que ce n'est pas possible d'inclure des sauts de ligne lorsque l'encodage est en autre chose que base64 (cf. cette discussion). Bon, soit ! Je m'exécute et je convertis en base64, ce qui, (i) est très moche, (ii) augmente inutilement la longueur du lien (ce qui peut être problématique en particulier si le tableau contient beaucoup de données). Et donc on obtient :

import base64
import numpy as np
from IPython.display import HTML
mon_tableau = np.array([[1,2,3],[4,5,6]])
mon_str = np.array2string(mon_tableau)
mon_str = base64.b64encode(mon_str.encode('ascii')) #conversion vers base64
mon_str = str(mon_str).replace("'","").replace("b","") #supprime le préfixe b (byte) et les guillemets
lien = "<a download='mon_fichier.txt' href='data:text/csv;charset=utf-8;base64,"
        + mon_str + "'>texte_du_lien</a>"
HTML(lien)

En effet ça fonctionne maintenant avec Firefox. Alors, outre le fait que ces conversions string -> base64 -> string m'arrachent l'oeil (je suis preneur d'une solution plus élégante), je m'interroge: pourquoi ça marche dans les navigateurs basés sur Chromium (par exemple Vivaldi ou Chromium lui-même) et pas dans mon navigateur préféré ?

Télécharger ce contenu au format EPUB

Commentaires : voir le flux Atom ouvrir dans le navigateur

Python haute performance et cristallographie

2019-09-02T14:54:19+02:00

Cher journal,

À l'instar de l'ami omc qui te partageait ses polycops de cours sur "Python for science", je vais moi aussi te parler de Python à travers le prisme de la cristallographie. Mais qu'est ce donc que la cristallographie vas-tu me demander. Historiquement il s'agit d'une discipline qui vise à déterminer la structure atomique (nature et ordonnancement des atomes) de la matière. Cette discipline est en fait à l'intersection d'un très grand nombre de domaines (physique, chimie, biologie,…) comme en témoigne, par exemple, la variété des prix Nobels décernés en lien avec cette discipline (découverte du graphène, de la structure de l'ADN, de la diffusion des neutrons, etc. etc.).

Sans être un expert, on peut aisément voir arriver la complexité calculatoire : nous avons affaire à des atomes et leur distribution dans l'espace, ce qui, même pour des objets tout petits (par exemple quelque micromètres cubes) en représente un nombre colossal. À titre d'exemple, un processeur Intel Xeon contient 10 000 milliards de milliards d'atomes de silicium. Évidemment, au cours de l'histoire plusieurs approximations ont permis de modéliser la matière sans avoir à explicitement prendre en compte autant d'atomes simultanément. Néanmoins, la tendance ces dernières années est de s'affranchir progressivement de ces approximations, tendance rendue possible par la démocratisation de processeurs et co-processeurs de plus en plus performants.

J'en viens maintenant à Python. Ce langage, associé aux bibliothèques NumPy et SciPy (ainsi que les innombrables scikits spécialisés), est devenu le standard de fait pour le calcul scientifique dans un très grand nombre de domaines. Pour ce qui concerne le calcul scientifique, le principal inconvénient de Python vanilla est le coté typage dynamique/interprété qui annihile complètement les performances. NumPy permet d'en atténuer les conséquences en introduisant le calcul vectoriel et ainsi s'affranchir de l'écriture de boucles. Cependant, pour de très grands vecteurs, ou tout simplement pour des cas où le code ne peut être vectorisé, NumPy n'est pas d'une grande aide. C'est là où interviennent des compilateurs dont l'objectif est de transformer le code python en "code natif" typé statiquement. Dans l'article que j'ai le plaisir de partager ici ( https://hal.archives-ouvertes.fr/hal-02194025v2 ) nous abordons 4 de ces compilateurs:
- NumExpr
- Numba
- Pythran
- Cython

Je suis d'autant plus flatté de parler de ce sujet ici car, du fait de sa syntaxe simple et ses excellentes performances, Pythran est de loin mon favori, et je sais que son créateur traîne ses guêtres par ici. L'article fait une comparaison systématique de ces compilateurs pour 4 exemples qui parleront aux cristallographes, mais pas seulement : évaluation de séries de Fourier, de distances euclidiennes, etc. L'article est accompagné de notebooks Jupyter qui permettront aux lecteurs intéressés de reproduire les calculs. L'idée est de fournir une base de démarrage pour les nouveaux venus à la programmation Python et au calcul haute performance au sein de notre laboratoire (étudiants ou doctorants principalement). Mais cela peut peut-être être utile à un public plus varié, d'où ce journal.

Pour résumer les conclusions de l'article :
- NumExpr: syntaxe très simple (proche de Numpy), performances moyennes (meilleures que Numpy mais moins bonnes que les autres)
- Numba & Pythran: syntaxe simple, excellentes performances. Bonus pour pour Pythran qui présente des performances plus stables et plus reproductibles.
- Cython : excellentes performances et probablement le plus versatile, mais syntaxe lourde (pour un simple scientifique)

Télécharger ce contenu au format EPUB

Commentaires : voir le flux Atom ouvrir dans le navigateur