SpaceFox a écrit 1853 commentaires

# Nom de code « Foncier Innovant »

Posté par SpaceFox (site web personnel, Mastodon) le 10 février 2024 à 11:47. En réponse au journal Combien pour un algorithme de détection de piscines sur les photos aériennes ?. Évalué à 6.

Le petit nom du projet est « Foncier Innovant ». Il avait commencé avec Accenture puis a été déplacé chez Google via Capgemini.

Je n'ai pas réussi à retrouver les appels d'offres ou les cahiers des charges, mais ce document https://www.scsfip.fr/medias/files/fiche-n-4-evolutions-applicatives.pdf donne plus de détails que juste le « retrouver les piscines » qu'on voit dans la plupart des articles :

4. Le recours à l’intelligence artificielle et au datamining pour la fiabilisation des bases fiscales et topographiques : le projet Foncier innovant

Afin de renforcer l'exhaustivité et la fiabilité des bases fiscales et topographiques, le projet Foncier innovant, fondé sur l'intelligence artificielle (IA), le datamining et l'utilisation des prises de vues aériennes, vise notamment à :
- détecter sur les photographies aériennes les biens potentiellement taxables (bâtis, piscines…) à l’aide d’algorithmes et s'assurer, par l'interrogation des bases de données de la DGFiP, que ces biens font l'objet d'une taxation aux impôts locaux ;
- alimenter le système d'information et notamment le processus de surveillance/relance des détections opérées (Surf) ;
- mettre à jour le plan cadastral informatisé (PCI) en y reportant graphiquement les bâtis identifiés sur leurs parcelles d'assise avec un minimum d'intervention humaine ;
- identifier les biens dont la valeur locative – qui sert de base d'imposition aux impôts locaux – est minorée ou majorée.
Les services locaux disposeront d'une interface permettant aux agents d'accéder aux résultats obtenus et à toutes les informations nécessaires à leurs travaux d'identification et d'évaluation des locaux.
Ce projet, qui bénéficie d’un financement du Fonds pour la transformation de l’action publique (FTAP), repose sur des expérimentations menées ces trois dernières années avec trois directions départementales des finances publiques. Il facilitera les travaux des agents des
services fonciers et des géomètres en leur apportant une aide à la décision. L'interface de visualisation leur permettra d'interagir et de valider les résultats obtenus permettant ainsi une co-construction et une amélioration constante de ce nouvel écosystème.

Alors qu’il était initialement envisagé de confier à un prestataire la conception et la réalisation globales de ce projet, une solution plus intégrée dans l’écosystème DGFiP a été finalement adoptée, s'appuyant sur, d’une part, les compétences et expériences métier et techniques
acquises par la DGFiP dans le cadre des expérimentations préalables et en matière de valorisation de données (création du datalab et module cartographique d'aide à la fiabilisation des bases fiscales de l'application Icad) et, d’autre part, le recours à un prestataire pour la composante de traitement des images, dans le cadre de marchés existants.
Après une phase de cadrage au dernier quadrimestre 2020, les premiers travaux avec le prestataire pour la conception des algorithmes seront lancés début 2021. Les premiers résultats pourraient être mis à disposition des services au cours du dernier quadrimestre 2021, via l’interface Icad qui évoluera à cette fin.
À compter de fin 2022, le projet pourrait s’interfacer avec les composants fonciers du projet « Gérer mes biens immobiliers ».

La connaissance libre : https://zestedesavoir.com
[^] # Un problème classique sous Windows

Posté par SpaceFox (site web personnel, Mastodon) le 09 février 2024 à 11:32. En réponse au journal Sudo natif sur Windows. Évalué à 10.

C’est un gag classique sous Windows.

Par exemple, sous Powershell, on a accès à curl et à wget.

Ou pas : en fait c’est des alias vers Invoke-WebRequest… et donc s’attendent à être utilisés comme ce dernier, et donc sont compatibles avec à peu près aucune des options de curl et wget. J’ai toujours pas compris comment quelqu’un a pu trouver que c’était une bonne idée, et comment ça a pu être validé jusqu’à la mise en production.

La connaissance libre : https://zestedesavoir.com
# Deux jours, d’accord, mais sur quelle cible ?

Posté par SpaceFox (site web personnel, Mastodon) le 09 février 2024 à 10:07. En réponse au journal Combien pour un algorithme de détection de piscines sur les photos aériennes ?. Évalué à 9.
J’avais discuté de la problématique avec un ami qui travaillait sur ce genre de chose (et pas du tout dans le cadre du contrat CapGemini, d’ailleurs c’était même pas en France métropolitaine), et qui m’expliquait qu’avec les outils disponibles il y a peu, l’exercice semblait simple mais ne l’était pas du tout. Si j’ai bien retenu, on peut facilement « détecter des piscines », mais :
- Il y a beaucoup de faux positifs (bâches, reflets, panneaux solaires, places de parking handicapé, etc) ;
- Il y a beaucoup de faux négatifs (piscines de formes ou couleurs bizarres, effets des caractéristiques des images satellites, piscines partiellement ou totalement couvertes ;
- Le croisement avec les données cadastrales (pour savoir qui n’a pas déclaré, dans ce cas) n’est pas trivial (notamment à cause desdites données) ;
- Il faut aussi filtrer selon la taille de la piscine ;
- Etc.
C’est un peu comme de la reconnaissance de texte : c’est assez facile de faire un programme qui va atteindre 80 %, voire 90 % de reconnaissance correcte, sauf qu’on parle de volumes tels que 10 % à 20 % d’erreurs rendent le résultat inexploitable (ou plus exactement : inintéressant par rapport à un traitement manuel) à cause de la masse de correction à faire.

Je suis à peu près persuadé que la facture est énorme pour le service rendu (il y a une astuce : c’est toujours le cas sur ce genre de contrat). Par contre je serais curieux de savoir quel est le cahier des charges de ce contrat, et de le comparer avec ce qui a été réalisé « en deux jours » (en réalité plus, car c’est l’adaptation d’un algorithme proche).

La connaissance libre : https://zestedesavoir.com
[^] # Re: Il n’y a presque que de l’argent magique !

Posté par SpaceFox (site web personnel, Mastodon) le 09 février 2024 à 09:57. En réponse au journal Combien pour un algorithme de détection de piscines sur les photos aériennes ?. Évalué à 5.

Je suis tout à fait preneur de d’explications sur ce que pourrait raconter Heu?Reka comme conneries, je n’ai pas les compétences pour les détecter.

Pour compléter ce qui a déjà bien été dit plus haut, je fais (et c’est une opinion personnelle qui ne vaut que ça) une différence entre les connaissances liées à l’étude d’un champ disciplinaire (typiquement : la recherche) et son application pratique au quotidien (typiquement : l’industrie). Dans certains domaines, comme l’informatique, les deux sont assez fortement dissociés, et quelqu’un de bon et pertinent dans l’un ne le sera pas forcément dans l’autre. Conséquence : on se retrouve avec des arguments qui paraissent contradictoires, alors que c’est simplement que les arguments s’appliquent en réalité à des concepts et des réalités différentes. En informatique, la théorie des types est un bon exemple de ce genre de cas.

En ce qui concerne Heu?Reka, c’est d’autant plus compliqué qu’il a pas mal de contenus qui ont l’air « théoriques » mais qu’il présente toujours du point de vue pratique (dans le sens : l’économie telle qu’elle fonctionne réellement) ; et il tape régulièrement sur des théories économiques qu’il présente comme acceptées par le milieu mais qui reposent sur des hypothèses complètement invalides en réalité. J’imagine que, pour quelqu’un qui vient du milieu académique, ça doit souvent paraitre absurde.

La connaissance libre : https://zestedesavoir.com
[^] # Il n’y a presque que de l’argent magique !

Posté par SpaceFox (site web personnel, Mastodon) le 08 février 2024 à 16:41. En réponse au journal Combien pour un algorithme de détection de piscines sur les photos aériennes ?. Évalué à 6.

En réalité, beaucoup d’opérations bancaires – et en premier lieu tous les crédits – impliquent de « l’argent magique ».

Si ce que je dit vous étonne, alors vous devriez lire des livres comme « Tout sur l'économie (ou presque) » de Gilles Mitteau (le livre a été largement mis à jour début 2024) ; ou si vous préférez, ses vidéos (elles sont aussi disponible sur Peertube, mais impossible de remettre la main sur une liste générale…)

La connaissance libre : https://zestedesavoir.com
[^] # Re: Optimisation

Posté par SpaceFox (site web personnel, Mastodon) le 05 février 2024 à 11:12. En réponse à la dépêche VenC 3.1.1 | Un nouveau générateur de site statique. Évalué à 3.

Personnellement je ne serais pas si affirmatif.

Je prends le cas de ce site (un peu mort) que je génère avec Hugo. L’un des avantages (et des arguments mis en avant) de Hugo est qu’il est très rapide, et peut se passer de ce genre de cache. Sauf que je ne génère pas que du HTML, j’ai aussi du ePub et du PDF. Le ePub est encore assez rapide ; mais le PDF passe par LaTeX, qui est extrêmement lent… et là, je serais très heureux d’avoir de la compilation incrémentale.

La connaissance libre : https://zestedesavoir.com
# Sauvegarder de l’audio numérique sur cassettes VHS

Posté par SpaceFox (site web personnel, Mastodon) le 30 janvier 2024 à 14:01. En réponse au lien La sauvegarde de données sur cassettes vhs. Évalué à 4.

Les cassettes VHS ont aussi servi à stocker de l’audio numérique (non compressée) : https://www.youtube.com/watch?v=xSnrQBfBCzY (un peu long et en anglais, mais intéressant).

La connaissance libre : https://zestedesavoir.com
[^] # Re: Ça ne fonctionne pas sous LibreOffice 7.2 :(

Posté par SpaceFox (site web personnel, Mastodon) le 28 janvier 2024 à 19:15. En réponse au lien [Youtube] Un processeur 16-Bit dans Excel. Évalué à 2.

Pas sur Ubuntu 22.04 :)

La connaissance libre : https://zestedesavoir.com
# Ça ne fonctionne pas sous LibreOffice 7.2 :(

Posté par SpaceFox (site web personnel, Mastodon) le 28 janvier 2024 à 15:54. En réponse au lien [Youtube] Un processeur 16-Bit dans Excel. Évalué à 6. Dernière modification le 28 janvier 2024 à 15:54.
Ça ne fonctionne pas sous LibreOffice 7.2, j’ai essayé :(

De ce que je comprends du comportement obtenu, c’est que le système de calcul pas-à-pas sur des références circulaires n’est pas le même que dans Excel, résultat, même en désactivant le calcul automatique (dans Données -> Calculer) et en mettant le calcul de références circulaires à 1 itération (dans Options -> LibreOffice Calc -> Calcul) :
- Le rafraîchissement avec F9 ne fait rien, même l’horloge reste fixe.
- Forcer le recalcul de la feuille entière provoque des erreurs 523 un peu partout.
LibreOffice est donc condamné à rester un pare-feu.

La connaissance libre : https://zestedesavoir.com
[^] # Re: Cool la vidéo

Posté par SpaceFox (site web personnel, Mastodon) le 22 janvier 2024 à 16:37. En réponse au lien Les contraintes techniques qui désavantagent les cyclistes.. Évalué à 3.

Haaaa c’est une règle Suisse, je pensais qu’elle était Belge et n’arrivait pas à la retrouver. Merci !

La connaissance libre : https://zestedesavoir.com
[^] # Re: Cool la vidéo

Posté par SpaceFox (site web personnel, Mastodon) le 22 janvier 2024 à 14:31. En réponse au lien Les contraintes techniques qui désavantagent les cyclistes.. Évalué à 10.

+1, si la route est trop étroite pour être doublé en sécurité, c’est beaucoup plus sûr et moins dangereux de rouler au milieu, justement pour éviter d’être doublé. C’est particulièrement vrai dans les rond-points à une voie large, parce que si tu laisses les véhicules te doubler en restant bien à droite, le classique c’est la personne qui va te dépasser par la gauche (normal) puis te couper la route en sortant à droite alors que tu continues sur le rond-point.

La connaissance libre : https://zestedesavoir.com
[^] # Re: expérience

Posté par SpaceFox (site web personnel, Mastodon) le 18 janvier 2024 à 14:12. En réponse au lien Des hommes draguent un bot parce qu’il a un nom féminin . Évalué à 3. Dernière modification le 18 janvier 2024 à 14:15.

En l’occurrence, la scène est assez moderne, puisque c’est Leporello qui se fout de la gueule de Don Giovanni et fait comprendre à Elvira que son maitre n’est pas vraiment recommandable.

https://www.youtube.com/watch?v=LQxs8TYgakI

La connaissance libre : https://zestedesavoir.com
[^] # Re: Mouais

Posté par SpaceFox (site web personnel, Mastodon) le 16 janvier 2024 à 16:39. En réponse au lien Expérimentation scheduler Linux en Rust avec des promesses de gain pour les jeux. Évalué à 3.

Les réponses à tes questions semblent être dans ce dépôt et sa documentation : https://github.com/sched-ext/scx/

La connaissance libre : https://zestedesavoir.com
[^] # Re: Futur de Subversion

Posté par SpaceFox (site web personnel, Mastodon) le 14 janvier 2024 à 02:40. En réponse au journal github et subversion c'est fini (ou de l'importance d'une bonne communication). Évalué à 8. Dernière modification le 14 janvier 2024 à 02:40.

Et que même si git rend brillant le poil des mamans ours, svn conserve quelques avantages potentiellement utiles, à savoir : la centralisation, et surtout la possibilité de ne pas avoir à télécharger l’ensemble d’un dépôt pour faire une modification sur un ou quelque fichier.

Rien n'interdit d'utiliser Git de manière centralisée, c'est même courant.
Et surtout, Git évolue aussi et prends en compte les cas que tu décris, avec des outils comme https://github.blog/2020-01-17-bring-your-monorepo-down-to-size-with-sparse-checkout/, https://github.blog/2021-11-10-make-your-monorepo-feel-small-with-gits-sparse-index/ ou https://github.blog/2020-12-21-get-up-to-speed-with-partial-clone-and-shallow-clone/ (billets Github mais ce sont bien des fonctionnalités Git).

La connaissance libre : https://zestedesavoir.com
[^] # Re: Sans vouloir défendre Github (ou MS)

Posté par SpaceFox (site web personnel, Mastodon) le 14 janvier 2024 à 00:45. En réponse au journal github et subversion c'est fini (ou de l'importance d'une bonne communication). Évalué à 7.

0.02 % (le chiffre d’utilisation de SVN sur Github, donc celui qui nous intéresse ici), c’est 100 fois plus que 2 %. C’est donc pas le même genre de prise en compte.

Cela dit, Github aurait pu faire un effort et au moins enlever la mention de SVN dans l’interface – parce que ça, ils devront le faire un jour ou l’autre de toutes façons. Et mettre une phrase de notice que renvoie vers cette page par exemple, c’est pas ça qui coutait cher en développement.

La connaissance libre : https://zestedesavoir.com
[^] # Re: Le monopole du moteur

Posté par SpaceFox (site web personnel, Mastodon) le 12 janvier 2024 à 16:59. En réponse au lien Terrible Maps : The most popular browser 2012 vs 2022. Évalué à 6.

Ici, le monopole du moteur, couplé au fait que celui-ci soit principalement piloté par Google, est un problème y compris pour les acteurs tiers, parce que les décisions de Google ont un impact critique sur ce que peuvent faire ou non les éditeurs tiers.

Par exemple, aucun éditeur tiers n’a annoncé être capable de maintenir le manifeste d’extensions v2, donc tout le monde va être impacté par les restrictions massives de possibilités de la v3.

La connaissance libre : https://zestedesavoir.com
# Le monopole du moteur

Posté par SpaceFox (site web personnel, Mastodon) le 12 janvier 2024 à 15:37. En réponse au lien Terrible Maps : The most popular browser 2012 vs 2022. Évalué à 9.

Les quatre navigateurs nommés sur la carte en 2012 utilisaient quatre moteurs différents.

Les trois navigateurs nommés sur celle de 2022 sont – quoique pas tout à fait pour Safari – Chrome avec une moustache, et il en est de même pour la version actuelle d’Opera mentionnée par orfenor dans l’autre commentaire.

La connaissance libre : https://zestedesavoir.com
[^] # Re: varchar(n)

Posté par SpaceFox (site web personnel, Mastodon) le 10 janvier 2024 à 14:22. En réponse au journal PostgreSQL : ne faites pas ça !. Évalué à 4.

Merci, je sais, et honnêtement je m’en fiche, c’est un journal écrit sur un coin de table en 5 minutes, dont le seul but est que les gens aillent voir le lien. Donc tant pis s’il jargonne (parce que dans ce contexte on est plus dans du jargon que dans un vrai contresens).

Par exemple, la répétition dans «  cette structure du SQL a des comportements particulièrement contre-intuitifs, en particulier dès que des valeurs null sont en jeu. » me gêne davantage. Dans un texte vaguement soigné, les deux auraient été corrigés.

La connaissance libre : https://zestedesavoir.com
# La source

Posté par SpaceFox (site web personnel, Mastodon) le 10 janvier 2024 à 10:25. En réponse au lien Linus au sommet de la Fondation Linux « Rust fait sens d’un point de vue technique ». Évalué à 8.

L’article semble être une traduction (parfois assez étrange) de cet article sur LWM (lien en fin de texte). Si vous lisez l’anglais, la VO sera sans doute plus claire.

Un enseignement intéressant, c’est que, d’après ce compte-rendu, même des discussions ultra-techniques de gens très expérimentés comme les intervenants du Kernel Maintainers Summit sont percluses de préférences personnelles et d’autres considérations plus politiques que techniques. C’est pas étonnant – ça reste des humains – mais toujours un bon rappel.

La connaissance libre : https://zestedesavoir.com
[^] # Re: varchar(n)

Posté par SpaceFox (site web personnel, Mastodon) le 09 janvier 2024 à 16:37. En réponse au journal PostgreSQL : ne faites pas ça !. Évalué à 4.

Du coup, garder un bon contrôle de la taille maximum d'un enregistrement reste utile. Et c'est plus facile avec varchar(n) qu'avec varchar.

Pour moi il faut surtout comprendre que, dans le cas général, utiliser varchar plutôt que varchar(n) est préférable. D’ailleurs la règle est « Don't use varchar(n) by default » et pas « Don't use varchar(n) » ; et donc que sauf cas particuliers, une conception à base de varchar ou text sans limites avec des varchar(n) là ou c’est nécessaire posera moins de problèmes (en général, pas seulement de performance) qu’une conception avec des varchar(n) partout. Le wiki parle ici d’éviter une « optimisation prématurée » , si le cas que tu décris peut poser de réels problèmes de performances, soit les concepteurs l’ont pris en compte en amont en connaissance de cause, soit il va être mesurable et corrigé.

Comme d’habitude avec les pages de conseils (à faire ou à éviter) des documentations, ça n’est pas une liste de règles à appliquer sans réfléchir. D’ailleurs la plupart des règles données ont une section « quand utiliser quand même cette fonctionnalité » qui contient autre chose que « jamais ».

La connaissance libre : https://zestedesavoir.com
[^] # Re: Et donc…

Posté par SpaceFox (site web personnel, Mastodon) le 09 janvier 2024 à 16:26. En réponse au lien Git Koans. Évalué à 1.

Bravo, tu es passé complètement à côté du propos de mon billet.

La connaissance libre : https://zestedesavoir.com
[^] # Re: varchar(n)

Posté par SpaceFox (site web personnel, Mastodon) le 08 janvier 2024 à 20:09. En réponse au journal PostgreSQL : ne faites pas ça !. Évalué à 2. Dernière modification le 08 janvier 2024 à 20:10.

PPS : un autre aspect de l’efficacité, c’est que PostgreSQL ne fait pas de différence de traitement selon la taille des chaines de caractères, contrairement à par exemple Oracle qui a un fonctionnement très différent sur les chaines de moins de 4000 (VARCHAR2) et de plus de 4000 caractères (CLOB) (en admettant que cette limitation soit encore d’actualité ?). Donc, ça peut avoir du sens de limiter Oracle (à 4000 si tu veux vraiment mettre une limite haute), mais pas PostgreSQL, du moins pas sur ce critère là. De même, mettre une limite ne permet pas de gagner en espace de stockage (en admettant un frontal correct qui va interdire de stocker n’importe quoi dans ces champs).

La connaissance libre : https://zestedesavoir.com
[^] # Re: varchar(n)

Posté par SpaceFox (site web personnel, Mastodon) le 08 janvier 2024 à 19:59. En réponse au journal PostgreSQL : ne faites pas ça !. Évalué à 4. Dernière modification le 08 janvier 2024 à 20:01.

Je pensais que que la question des performances était évoquée dans ce wiki et en fait non, c’était dans cette réponse, et j’avoue ne pas être allé éplucher tous les lien ni refaire des tests poussés pour savoir ce qu’il en est.

PS : la notion d’efficacité n’est pas équivalente à celle de performances. L’efficacité inclus les performances, mais aussi la maintenabilité, la stabilité à long terme (cf la liste de problèmes induits par varchar(n) et les bugs corrigés à ce sujet), etc. D’autre part, si impact il y a en terme de performances, je soupçonne que c’est à l’insertion/mise à jour et pas à la sélection qu’il est visible.

La connaissance libre : https://zestedesavoir.com
[^] # Re: Et alors ?

Posté par SpaceFox (site web personnel, Mastodon) le 04 janvier 2024 à 16:21. En réponse au journal jeu libre Covid-25 !. Évalué à 10.

Il y a même un XKCD pour ça :

Source : https://xkcd.com/1217/

La connaissance libre : https://zestedesavoir.com
# Ont-ils bien modélisé les milliers de morts dus à l'Hydroxychloroquine ?

Posté par SpaceFox (site web personnel, Mastodon) le 03 janvier 2024 à 14:46. En réponse au journal jeu libre Covid-25 !. Évalué à 5.

16990 morts minimum entre mars et juillet 2020 :

In conclusion, the number of HCQ-related deaths is estimated at 16990, even though this number is probably underestimated because of the lack of data from most countries. More importantly, this study illustrates the limitations of treatment-effect extrapolation from chronic to severe conditions without accurate data and the need to produce quickly high-level evidence from RCTs in case of emergent diseases.

Source : https://www.sciencedirect.com/science/article/pii/S075333222301853X

Pour rappel :

Le Mediator est accusé d’avoir causé la mort de 1 500 à 2 100 personnes en France, sans compter celles qui souffrent des conséquences des effets secondaires.

Source : https://fr.m.wikipedia.org/wiki/Affaire_du_Mediator

La connaissance libre : https://zestedesavoir.com