Je regarde le code désassemblé avec objdump et je n'y comprends rien. Pour find_int_c le code machine est exactement le même entre default et core2, à partir de haswell add $0x1,%rcx est remplacé par inc %rcx mais ce n'est pas ce qui fait la différence. Pareil pour find_int_sse2, à partir de sandybridge les instructions SSE2 sont remplacées par leurs équivalents AVX, mais il n'y a aucune différence entre broadwell et skylake. Des idées sur ce qui peut se passer ?
Pour la boucle déroulée sur core2, au moins je vois des différences : des instructions sont réordonnées par rapports aux autres architectures.
Je me demandais quelle était l'influence de -march=... pour ce genre d'algo. J'ai testé ton benchmark chez moi (i5-9600k) avec g++ seulement (la flemme d'installer d'autres compilateurs). Sans changer les options, je trouve des résultats similaires aux tiens sauf que benchmark_cpp est plus rapide que benchmark_c_unrolled.
Avec -march=native ou -march=skylake, benchmark_c devient aussi bon que benchmark_c_unrolled. benchmark_c_unrolled et benchmark_cpp ne bougent pas. benchmark_sse2 devient plus lent ! (plus lent que benchmark_cpp mais toujours plus rapide que benchmark_c_unrolled)
Avec -march=core2, benchmark_c est tout autant accéléré, benchmark_c_unrolled va encore un peu plus vite, benchmark_cpp et benchmark_sse2 sont aussi rapide que sans l'option.
Donc -march est bien important, mais g++ ne semble pas très bon pour les architectures récentes et sabote même l'algo sse2.
Ça devrait aider pour généraliser, je vois que le code utilise des rapports HID hardcodés avec des index qui peuvent changer pour chaque appareil (mais qu'il te donne si tu lui demandes poliment).
Google et Facebook ne sont pas devenus riches parce que la publicité est efficace, mais parce que ceux qui paient pour l'espace publicitaire pensent qu'elle est efficace. Le meilleur vendeur dans cette histoire c'est celui qui te vend de la publicité, pas celui qui te vend ce que présente la publicité.
si la mobilisation aux centres de vaccination n'avait pas faibli
Elle a faibli ? Sur VaccinTracker, je vois un plateau depuis début juin. Au rythme actuel, on aura vacciné tout le monde cet automne, ce qui me semble assez bon en fait.
Tu peux t'attendre au même genre de problème avec std::shared_ptr puisque s'il est créé avec std::make_shared ou std::allocate_shared, la mémoire pour les données propres au pointeur partagé et celle pour l'objet lui-même sont généralement allouées en un seul bloc. C'est en fait un fonctionnement assez proches des std::string copy-on-write puisque la mémoire était aussi partagée (jusqu'à la première écriture).
Je crée des tableaux de taille COUNT(1) jusqu'à COUNT(800), puis 1000 de plus avec COUNT(100). J'utilise g++ 11.0.1 et clang++ 12.0.0. Les temps sont des moyennes pifométriques calculées après quelques essais.
g++: TEMPLATE → 530ms, FUNCTION → 450ms, FOLD → 15s
clang++: TEMPLATE → 540ms, FUNCTION → 600ms, FOLD → instantiating fold expression with 257 arguments exceeded expression nesting limit of 256
Ce genre d'utilisations de fold expressions est clairement une mauvaise idée. Entre variable et fonction, la différence est moins nette et dépend du compilateur, donc pas de vainqueur.
Donc sur PC, seulement Windows 10. Je veux dire que c'est très relatifs, selon quelles plateformes comptent le plus pour toi. Et, personnellement, pour un jeu comme Minecraft, je n'imagine pas y jouer sur autre chose que PC (clavier/souris).
Là je suis curieux, parce que quand tu vas sur le site de Minecraft, il est explicitement mentionné que la version Java (celle qui tourne sous Linux & Mac, mais tout de même dispo sous Windows) te met dans un monde isolé de toutes les autres plateformes, avec des restrictions comparé au multi-plateformes (pas de mini-jeux, par exemple).
C'est le contraire, c'est la version Windows 10 qui te met dans un monde isolé de toutes les autres plateformes (tu ne peux pas jouer avec ceux sous Linux/Mac/vieux Windows).
Méfie-toi de la façon dont c'est présenté, Microsoft veut mettre en avant sa version la plus verrouillée.
Si tu veux aider un projet de RPG à s'améliorer, OpenMW essaie de créer une suite d'exemple. Ce projet à réimplémenté le moteur d'elder scroll III, et est déjà bien meilleur que l'original sur pas mal de points (je suppose qu'il en reste ou il est au maximum equivalent…) notamment graphiques.
Ils ont également un éditeur de carte de leur cru, qui semble nécessiter encore du travail mais être utilisable (mieux que l'original? Pas sûr), et avec lequel il est prévu de faire cette fameuse suite d'exemple.
Je n'ai aucun doute que personne n'aura rien contre transformer une telle suite d'exemple en jeu complet, il faut "juste" faire le taf. En attendant, openmw est un bon moyen de jouer à morrowind, en y mettant au passage le contenu de tamriel rebuilt, si la licence des fichiers de jeu ne te dérange pas trop.
Le moteur de jeu lui-même est largement supérieur au moteur original. C'est par rapport à MGE XE qu'il y a des retards graphiques (post-traitements et, à mon goût, la qualité des effets atmosphériques mais ce dernier est peut-être déjà faisable en modifiant les shaders). Le gros retard d'OpenMW est surtout sur l'éditeur de niveau, qui n'est pas complet. En particulier, il manque un éditeur de dialogue (à moins que ça n'ait été ajouté très récemment).
Mais que l'état de l'éditeur ne décourage pas ceux qui voudrait créer un RPG libre avec OpenMW, il y a suffisamment de travail d'écriture et de créations d'assets avec ce genre de projet pour être occupé jusqu'à ce que l'éditeur soit complet (mais c'est peut-être justement l'ampleur de ce travail qui décourage beaucoup de libristes).
Mais si on a un pseudo, c'est plus comme faire un tag sur un mur quelconque. Les passants peuvent le lire mais ne savent pas qui est vraiment l'auteur (à part celui qui a accès à la caméra de surveillance qui t'a filmé en train de taguer : l'admin du site/service).
Ça semble possible avec la nouvelle syntaxe mais je ne garantie pas le qualité de ce que j'ai écrit. Ça marche avec GCC et clang, mais MSVC ne semble pas encore supporter la nouvelle syntaxe. Donc en pratique, pour l'instant, c'est pas mieux que l'extension GNU mais ça pourrait être le futur.
Il me semble que la syntaxe des littéraux que tu utilises pour _kw est une extension GNU et pas du C++14 standard.
Je me souviens avoir essayé de créer des littéraux du même genre (chaîne dans un type) et de ne rien avoir trouvé de pratique et standard. Peut-être que C++20 améliore ça, je ne connais pas encore très bien.
J'ai pas essayé coc, ça a l'air un peu trop gros pour moi. Pour pouvoir utiliser LSP, j'ai installé LanguageClient-neovim. Il y a juste à lui dire quel serveur utiliser pour chaque langage, pas besoin d'installer nodejs.
Oui c'est comme ça qu'il y a des consoles libres à base de microcontroleurs 8bits. Mais c'est du temps processeur de pris donc ça peut facilement ramer si le jeu a un rafraichissement rapide ou exige beaucoup de changements de pixels par image. C'est l'une des raisons de la disponibilité de différents modes d'affichage sur les vieux ordis.
Sinon pas nécessaire d'aller si bas niveau pour une console virtuelle conçue pour des ordinateurs actuels de 32bit ou plus qui possédent tous un GPU gérant au minimum OpenGLES.
On est quand même sur du dessin très simple : rotations à 90 degrés et étirements par des facteurs entiers pour les opérations les plus complexes. On a surtout besoin de copier des pixels un peu partout, un CPU n'est pas si mauvais pour ça.
Et OpenGL, c'est aussi du temps CPU pour envoyer les données et commandes à chaque image. Et sur un eeepc avec une implémentation logiciel d'OpenGL, on doit se retrouver avec un surcoût énorme comparé à un rendu logiciel naïf qu'on aurait pu écrire soi-même.
La NES et la SMS
Des machines avec des processeurs très très faibles mais compensés par des GPU spécialisés dans le dessin de sprites. J'aurais plutôt comparé aux vieux jeux DOS qui faisaient mieux que le TIC-80 mais sans accélération matérielle.
Vu le type de dessin, ça devrait être possible de faire ce genre de rendu en logiciel sur n'importe quel processeur du 21ème siècle, non ?
À une époque j'ai pas mal programmé sur TI-89 (Motorola 68k à 12MHz, 256Ko de RAM), il n'y avait pas d'accélération matériel graphique mais ça ne posait pas trop de problèmes pour faire des jeux 2D simples. Ce n'était que du monochrome mais avec la différence de puissance des processeurs on devrait quand même pouvoir passer à 16 couleurs.
Il est bizarre ce logiciel libre : je n'ai pas trouvé de lien vers le code source sur le site. La seule version Linux est un paquet Debian, j'ai donc besoin de compiler pour ma distribution exotique (fedora). On trouve bien des liens vers github pour les bugs ou le wiki, mais rien vers le code lui-même.
[^] # Re: -march
Posté par Clément V . En réponse au journal Recherche de valeur dans un tableau et l'écosystème des compilateurs C++. Évalué à 2.
Chez moi la valeur par défaut est
x86-64
(amd64 avec extensions jusqu'à sse2 si j'ai bien compris).Mes résultats plus détaillés sont :
Je regarde le code désassemblé avec objdump et je n'y comprends rien. Pour
find_int_c
le code machine est exactement le même entre default et core2, à partir de haswelladd $0x1,%rcx
est remplacé parinc %rcx
mais ce n'est pas ce qui fait la différence. Pareil pourfind_int_sse2
, à partir de sandybridge les instructions SSE2 sont remplacées par leurs équivalents AVX, mais il n'y a aucune différence entre broadwell et skylake. Des idées sur ce qui peut se passer ?Pour la boucle déroulée sur core2, au moins je vois des différences : des instructions sont réordonnées par rapports aux autres architectures.
# -march
Posté par Clément V . En réponse au journal Recherche de valeur dans un tableau et l'écosystème des compilateurs C++. Évalué à 5.
Je me demandais quelle était l'influence de
-march=...
pour ce genre d'algo. J'ai testé ton benchmark chez moi (i5-9600k) avec g++ seulement (la flemme d'installer d'autres compilateurs). Sans changer les options, je trouve des résultats similaires aux tiens sauf quebenchmark_cpp
est plus rapide quebenchmark_c_unrolled
.Avec
-march=native
ou-march=skylake
,benchmark_c
devient aussi bon quebenchmark_c_unrolled
.benchmark_c_unrolled
etbenchmark_cpp
ne bougent pas.benchmark_sse2
devient plus lent ! (plus lent quebenchmark_cpp
mais toujours plus rapide quebenchmark_c_unrolled
)Avec
-march=core2
,benchmark_c
est tout autant accéléré,benchmark_c_unrolled
va encore un peu plus vite,benchmark_cpp
etbenchmark_sse2
sont aussi rapide que sans l'option.Donc
-march
est bien important, mais g++ ne semble pas très bon pour les architectures récentes et sabote même l'algo sse2.[^] # Re: Réglages des couleurs
Posté par Clément V . En réponse au journal Clavier Logitech G213 Prodigy. Évalué à 3.
Le protocole est partiellement documenté : https://drive.google.com/folderview?id=0BxbRzx7vEV7eWmgwazJ3NUFfQ28
Ça devrait aider pour généraliser, je vois que le code utilise des rapports HID hardcodés avec des index qui peuvent changer pour chaque appareil (mais qu'il te donne si tu lui demandes poliment).
[^] # Re: Technologie et utilisation de la technologie
Posté par Clément V . En réponse au journal Rendez moi mon futur!. Évalué à 10.
Google et Facebook ne sont pas devenus riches parce que la publicité est efficace, mais parce que ceux qui paient pour l'espace publicitaire pensent qu'elle est efficace. Le meilleur vendeur dans cette histoire c'est celui qui te vend de la publicité, pas celui qui te vend ce que présente la publicité.
[^] # Re: Pléonasme
Posté par Clément V . En réponse au lien Pétition contre le passe sanitaire ET pour la vaccination. Évalué à 1.
Elle a faibli ? Sur VaccinTracker, je vois un plateau depuis début juin. Au rythme actuel, on aura vacciné tout le monde cet automne, ce qui me semble assez bon en fait.
# shared_ptr
Posté par Clément V . En réponse au journal Alignement chaotic neutre. Évalué à 2.
Tu peux t'attendre au même genre de problème avec
std::shared_ptr
puisque s'il est créé avecstd::make_shared
oustd::allocate_shared
, la mémoire pour les données propres au pointeur partagé et celle pour l'objet lui-même sont généralement allouées en un seul bloc. C'est en fait un fonctionnement assez proches desstd::string
copy-on-write puisque la mémoire était aussi partagée (jusqu'à la première écriture).[^] # Re: Ed(1)
Posté par Clément V . En réponse à la dépêche LSP (Language Server Protocol). Évalué à 2.
Étrange, c'est souvent dans le système de base. Sur Fedora, c'est le paquet
ed
.Normal, ex c'est vi et, de nos jours, vi c'est vim.
À éditer des textes sans s'encombrer de fonctionnalités inutiles comme voir le texte qu'on est en train d'éditer.
[^] # Re: et avec les fold-expressions ?
Posté par Clément V . En réponse au journal Constexpr versus template. Évalué à 3.
Je tente un petit benchmark vite fait, et au passage je compare aussi variable template vs. fonction.
Je crée des tableaux de taille COUNT(1) jusqu'à COUNT(800), puis 1000 de plus avec COUNT(100). J'utilise g++ 11.0.1 et clang++ 12.0.0. Les temps sont des moyennes pifométriques calculées après quelques essais.
instantiating fold expression with 257 arguments exceeded expression nesting limit of 256
Ce genre d'utilisations de fold expressions est clairement une mauvaise idée. Entre variable et fonction, la différence est moins nette et dépend du compilateur, donc pas de vainqueur.
[^] # Re: et avec les fold-expressions ?
Posté par Clément V . En réponse au journal Constexpr versus template. Évalué à 4.
Comme l'a fait remarquer SChauveau, les fold-expressions utilisent des packs. Il faut donc en créer un, par exemple avec make_integer_sequence :
Mais ça utilise des templates avec plein de paramètres, sûrement très lourds. Alors qu'on pourrait simplement utiliser une boucle for.
Mais je n'ai pas fait de benchmarks pour comparer, peut-être que je me trompe.
[^] # Re: question naïve
Posté par Clément V . En réponse au journal Battle royal et adolescence…. Évalué à 1.
Donc sur PC, seulement Windows 10. Je veux dire que c'est très relatifs, selon quelles plateformes comptent le plus pour toi. Et, personnellement, pour un jeu comme Minecraft, je n'imagine pas y jouer sur autre chose que PC (clavier/souris).
[^] # Re: question naïve
Posté par Clément V . En réponse au journal Battle royal et adolescence…. Évalué à 9.
C'est le contraire, c'est la version Windows 10 qui te met dans un monde isolé de toutes les autres plateformes (tu ne peux pas jouer avec ceux sous Linux/Mac/vieux Windows).
Méfie-toi de la façon dont c'est présenté, Microsoft veut mettre en avant sa version la plus verrouillée.
[^] # Re: pas tout seul
Posté par Clément V . En réponse au journal Nostalgie d'Internet des années 2000.. Évalué à 2.
Le moteur de jeu lui-même est largement supérieur au moteur original. C'est par rapport à MGE XE qu'il y a des retards graphiques (post-traitements et, à mon goût, la qualité des effets atmosphériques mais ce dernier est peut-être déjà faisable en modifiant les shaders). Le gros retard d'OpenMW est surtout sur l'éditeur de niveau, qui n'est pas complet. En particulier, il manque un éditeur de dialogue (à moins que ça n'ait été ajouté très récemment).
Mais que l'état de l'éditeur ne décourage pas ceux qui voudrait créer un RPG libre avec OpenMW, il y a suffisamment de travail d'écriture et de créations d'assets avec ce genre de projet pour être occupé jusqu'à ce que l'éditeur soit complet (mais c'est peut-être justement l'ampleur de ce travail qui décourage beaucoup de libristes).
[^] # Re: Beaucoup de "solutions"
Posté par Clément V . En réponse au journal Jouer à distance avec du logiciel libre. Évalué à 1.
Steam Link, ce n'est ni payant, ni du cloud. Tu utilises ton propre ordinateur pour lancer le jeu. Mais c'est proprio et nécessite un compte en ligne.
# VirtualGL
Posté par Clément V . En réponse au journal Jouer à distance avec du logiciel libre. Évalué à 5.
https://www.virtualgl.org/
C'est du X11 à distance mais le rendu 3D est effectué sur le serveur puis envoyé au client sous forme d'images.
[^] # Re: La part des choses...
Posté par Clément V . En réponse au journal Ados et réseaux sociaux. Évalué à 3.
Mais si on a un pseudo, c'est plus comme faire un tag sur un mur quelconque. Les passants peuvent le lire mais ne savent pas qui est vraiment l'auteur (à part celui qui a accès à la caméra de surveillance qui t'a filmé en train de taguer : l'admin du site/service).
[^] # Re: Mainteneurs
Posté par Clément V . En réponse au lien Trouver facilement un téléphone compatible avec LineageOS. Évalué à 4.
Il faut comparer ça à la version d'Android pour le même matériel qui a sûrement 0 mainteneurs.
[^] # Re: Fichier mp3 bien « taggé » mais toujours galère à récupérer
Posté par Clément V . En réponse au lien [Matinale France Culture] Pourquoi les logiciels libres intéressent-ils les Etats ?. Évalué à 1.
Je m'étais fait un script greasemonkey mais il a cassé. Je l'ai réparé, c'est un peu moche, mais ça marche au moins (pour l'instant) :
[^] # Re: Moui
Posté par Clément V . En réponse au journal Toujours plus proche du Python avec C++. Évalué à 2.
J'imagine que reference_wrapper doit passer.
[^] # Re: Littéraux non-standard
Posté par Clément V . En réponse au journal Toujours plus proche du Python avec C++. Évalué à 4.
J'ai tenté un bricolage en C++20 : https://gcc.godbolt.org/z/MxExbc
Ça semble possible avec la nouvelle syntaxe mais je ne garantie pas le qualité de ce que j'ai écrit. Ça marche avec GCC et clang, mais MSVC ne semble pas encore supporter la nouvelle syntaxe. Donc en pratique, pour l'instant, c'est pas mieux que l'extension GNU mais ça pourrait être le futur.
# Littéraux non-standard
Posté par Clément V . En réponse au journal Toujours plus proche du Python avec C++. Évalué à 2.
Il me semble que la syntaxe des littéraux que tu utilises pour
_kw
est une extension GNU et pas du C++14 standard.Je me souviens avoir essayé de créer des littéraux du même genre (chaîne dans un type) et de ne rien avoir trouvé de pratique et standard. Peut-être que C++20 améliore ça, je ne connais pas encore très bien.
# LanguageClient
Posté par Clément V . En réponse au journal Transformer vim en IDE avec LSP et DAP. Évalué à 6.
J'ai pas essayé coc, ça a l'air un peu trop gros pour moi. Pour pouvoir utiliser LSP, j'ai installé LanguageClient-neovim. Il y a juste à lui dire quel serveur utiliser pour chaque langage, pas besoin d'installer nodejs.
[^] # Re: Solution technique à un problème économique
Posté par Clément V . En réponse au journal Gemini et Solid, deux alternatives au Web (qu'il faut qu'on m'explique). Évalué à 3.
SGML est une syntaxe trop horrible, l'XHTML2 c'était bien.
[^] # Re: Config
Posté par Clément V . En réponse à la dépêche Sortie de TIC‑80 version 0.80 . Évalué à 2.
On est quand même sur du dessin très simple : rotations à 90 degrés et étirements par des facteurs entiers pour les opérations les plus complexes. On a surtout besoin de copier des pixels un peu partout, un CPU n'est pas si mauvais pour ça.
Et OpenGL, c'est aussi du temps CPU pour envoyer les données et commandes à chaque image. Et sur un eeepc avec une implémentation logiciel d'OpenGL, on doit se retrouver avec un surcoût énorme comparé à un rendu logiciel naïf qu'on aurait pu écrire soi-même.
Des machines avec des processeurs très très faibles mais compensés par des GPU spécialisés dans le dessin de sprites. J'aurais plutôt comparé aux vieux jeux DOS qui faisaient mieux que le TIC-80 mais sans accélération matérielle.
[^] # Re: Config
Posté par Clément V . En réponse à la dépêche Sortie de TIC‑80 version 0.80 . Évalué à 2.
Vu le type de dessin, ça devrait être possible de faire ce genre de rendu en logiciel sur n'importe quel processeur du 21ème siècle, non ?
À une époque j'ai pas mal programmé sur TI-89 (Motorola 68k à 12MHz, 256Ko de RAM), il n'y avait pas d'accélération matériel graphique mais ça ne posait pas trop de problèmes pour faire des jeux 2D simples. Ce n'était que du monochrome mais avec la différence de puissance des processeurs on devrait quand même pouvoir passer à 16 couleurs.
[^] # Re: PICO-8 vs TIC-80
Posté par Clément V . En réponse à la dépêche Construisez et programmez votre console de jeux open source. Évalué à 2.
Il est bizarre ce logiciel libre : je n'ai pas trouvé de lien vers le code source sur le site. La seule version Linux est un paquet Debian, j'ai donc besoin de compiler pour ma distribution exotique (fedora). On trouve bien des liens vers github pour les bugs ou le wiki, mais rien vers le code lui-même.
Donc je mets le lien vers la page github pour ceux que ça intéresse : https://github.com/nesbox/TIC-80