Journal Javascript plus rapide que python ! (une suite possible)

Posté par hocwp (site web personnel) le 07 juillet 2010 à 02:10.

Étiquettes : aucune

juil.

2010

Bonjour, suite au journal de Kopec et au commentaire d'Axioplase ıɥs∀, je me suis amusé à tester l'algorithme pour trouver des nombres amis avec plusieurs langages : Python, C, Lisp, Lua et forth.

Voici les résultats que j'ai obtenu.

C                                            0.466      1


sbcl (compilé, optim, sans cons)             0.468      1


sbcl (compilé, optimisation)                 0.511      1.09


sbcl (compilé, sans optimisation)            0.878      1.88


gforth-fast                                  1.025      2.19


sbcl (sans optimisation)                     1.59       3.41


gforth                                       2.761      5.92


lua                                          7.377     15.8


python                                      29.877     64.1

Ce qu'on peut voir, c'est que le Lisp peut-être aussi rapide que le C avec quelques déclarations de types pour garantir au compilo que le type des nombres ne changera pas. Le Forth ne s'en tire vraiment pas mal pour un langage interprété. Et Lua commence à être un peu plus lent.

Là dessus, gaaaaaAab sort un nouvel algo en python qui écrase tout le monde ! Qu'a cela ne tienne testons le en C et en Lisp (flemme pour la version en Forth et Lua :) ). Voila les résultats :

C                                            0.002           1


sbcl (compil)                                0.000           0 ?!?


python                                       0.073         36.5

Et là, les versions en C et en Lisp sont 36 fois plus rapide que la version en Python. Et surprise, on ne voit rien avec la version en Lisp.
On prend alors une loupe en exécutant le code 100 fois de suite.

                                                           C ref    Lisp ref


C                                            0.061           1         1.56


sbcl (compil)                                0.039           0.64      1


python                                       3.037           49.8     77.8

Et la grosse surprise : la version en Lisp est presque 2 fois plus rapide que la version en C !!!

Bon, je sais, c'est juste un cas particulier et on ne teste que la vitesse d'exécution mais comme Axioplase ıɥs∀, je suis content d'utiliser le Common Lisp : un langage de haut niveau et qui déchire sa race pardon : qui peut-être très rapide :)

J'ai mis le code et les résultats ici : http://hocwp.free.fr/friend_bench.tar.gz . Pour verifier que j'ai pas fais n'importe nawak.

Pis, je serais vraiment curieux de voir ce que ça donne avec d'autres langages. Si quelqu'un n'a pas trop la flemme :)

PS : On n'est pas vendredi mais c'est les vacances pour certains == tous les jours vendredi.

# Correction mineure

Posté par hocwp (site web personnel) le 07 juillet 2010 à 02:15. Évalué à 0.

Avant que les puristes me tombent dessus, c'est dans un forum que la discution s'est déroulée.
# Pour le code lua

Posté par téthis le 07 juillet 2010 à 03:52. Évalué à 5.

http://lua-users.org/wiki/OptimisingUsingLocalVariables

Il faut utiliser les variables locales pour gagner en vitesse.

Sur ma machine, avec utilisation de variables locales :
real 0m18.339s
user 0m17.366s
sys 0m0.003s

Sans :
real 0m21.045s
user 0m20.059s
sys 0m0.007s
The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein
- [^] # Re: Pour le code lua
  
  Posté par téthis le 07 juillet 2010 à 04:14. Évalué à 6.
  
  Puis pour mettre un peu de JIT, LuaJIT (http://luajit.org/) en version 1.1.6.
  
  Variables locales :
  real 0m3.440s
  user 0m2.623s
  sys 0m0.003s
  
  Sans :
  real 0m4.894s
  user 0m3.556s
  sys 0m0.007s
  
  Il faudrait voir ce que ça donne sur la machine qui a fait les benchs. :)
  The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein
  - [^] # Re: Pour le code lua
    
    Posté par hocwp (site web personnel) le 07 juillet 2010 à 11:36. Évalué à 2.
    
    Avec les variables locales, je passe de 7.099 à 5.891 et avec le luajit 1.716 sans les variables locales et 1.337 avec.
    On obtient des résultats vraiment intéréssants.
    - [^] # Re: Pour le code lua
      
      Posté par ZankFrappa le 09 juillet 2010 à 12:48. Évalué à 2.
      
      Surtout le dernier.
# Un bench vaut ce qu'il vaut

Posté par Maclag le 07 juillet 2010 à 09:22. Évalué à 10.

Et on ne peut donc jamais en tirer de vraie conclusion sur la vie réelle.
Il faut savoir garder la tête froide devant ce genre de résultat. Je dirais que l'important c'est la différence de perfs sur les parties d'une application qui réclament normalement le plus de temps, là on peut voir les intérêts des différents langages.

Si ce test avait été fait proprement, il aurait démontré qu'en fait c'est OCaml le plus rapide!

--------------->[ ]
- [^] # Re: Un bench vaut ce qu'il vaut
  
  Posté par hocwp (site web personnel) le 07 juillet 2010 à 11:40. Évalué à 2.
  
  Oui, un bench ne donne qu'une petite idée du langage. Celui la ne dit rien sur l'occupation en mémoire du programme ou la vitesse avec laquelle on peut développer une application plus complexe.
  Par contre je serais curieux de voir ce que donne OCaml sur ce genre d'algo (chouette je sens que je vais apprendre des choses :) .
- [^] # Re: Un bench vaut ce qu'il vaut
  
  Posté par JoeltheLion (site web personnel) le 07 juillet 2010 à 12:44. Évalué à 5.
  
  Ce genre de commentaire revient à chaque fois que quelqu'un réalise un bench, mais il me semble qu'il n'apporte rien.
  
  Certes, un bench vaut ce qu'il vaut, et les résultats peuvent ne pas être extrapolables d'une application à l'autre. Cependant, comme on ne peut pas développer toutes les applications dans tous les langages, c'est souvent le meilleur outil disponible pour estimer la performance d'un compilateur/interpréteur au moment de faire des choix technologiques.
  
  D'autre part, les résultats des nombreux benchmarks que j'ai pu voir sont remarquablement réguliers (du moins pour ceux qui sont bien réalisés), ce qui semble indiquer que les performances des différents environements sont assez stables d'une application à l'autre.
- [^] # Re: Un bench vaut ce qu'il vaut
  
  Posté par Perthmâd (site web personnel) le 07 juillet 2010 à 13:47. Évalué à 3.
  
  J'ai fait le bench avec OCaml, et le code natif est plus rapide que le C compilé avec gcc sans optimisations, par contre il y a un facteur deux en faveur du C avec -O3.
  
  let entries = 10000 let loop entries = let d = Array.make entries 1 in for i = 2 to pred (entries / 2) do let j = ref (2 * i) in while !j < entries do d.(!j) <- d.(!j) + i; j := !j + i done done; for i = 0 to entries - 1 do if d.(i) < entries && d.(d.(i)) = i && i <= d.(i) then Printf.printf "%i %i\n" i d.(i) done let () = for i = 0 to 100 do loop entries done
  
  Par contre c'est clairement pas une manière fonctionnelle d'écrire les choses, et habituellement, je n'utilise jamais les boucles for et while en OCaml.
  - [^] # Re: Un bench vaut ce qu'il vaut
    
    Posté par Dr BG le 07 juillet 2010 à 16:12. Évalué à 3.
    
    Et tu n'as pas utilisé d'optimisation avec OCaml ?
    - [^] # Re: Un bench vaut ce qu'il vaut
      
      Posté par ZankFrappa le 09 juillet 2010 à 12:50. Évalué à 1.
      
      Le compilateur OCaml ne sait quasiment rien faire à ce niveau.
  - [^] # Re: Un bench vaut ce qu'il vaut
    
    Posté par hocwp (site web personnel) le 08 juillet 2010 à 02:23. Évalué à 3.
    
    Merci beaucoup. Sur ma machine, j'obtiens
    
    Pour 10000 éléments : 0.049s en Ocaml, 0.039s en Lisp, 0.058 en C et 0.017 en C(O3)
    Pour 100000 éléments : 0.674s en Ocaml, 0.531s en Lisp, 0.799s en C et 0.412s en C(O3)
    Pour 1000000 éléments : 41.512s en Ocaml, 41.483s en Lisp, 43.523s en C et 43.449s
    
    Pour 10000000 éléments sans la boucle x100:
    Fatal error en Ocaml, 5.480s en Lisp et segfault en C
    - [^] # Re: Un bench vaut ce qu'il vaut
      
      Posté par téthis le 08 juillet 2010 à 03:30. Évalué à 2.
      
      $ time lua friend.lua 6 6 28 28 220 284 496 496 1184 1210 2620 2924 5020 5564 6232 6368 8128 8128 10744 10856 12285 14595 17296 18416 63020 76084 66928 66992 67095 71145 69615 87633 79750 88730 100485 124155 122265 139815 122368 123152 141664 153176 142310 168730 171856 176336 176272 180848 185368 203432 196724 202444 280540 365084 308620 389924 319550 430402 356408 399592 437456 455344 469028 486178 503056 514736 522405 525915 600392 669688 609928 686072 624184 691256 635624 712216 643336 652664 667964 783556 726104 796696 802725 863835 879712 901424 898216 980984 947835 1125765 998104 1043096 1077890 1099390 1154450 1189150 1156870 1292570 1175265 1438983 1185376 1286744 1280565 1340235 1328470 1483850 1358595 1486845 1392368 1464592 1466150 1747930 1468324 1749212 1511930 1598470 1669910 2062570 1798875 1870245 2082464 2090656 2236570 2429030 2652728 2941672 2723792 2874064 2728726 3077354 2739704 2928136 2802416 2947216 2803580 3716164 3276856 3721544 3606850 3892670 3786904 4300136 3805264 4006736 4238984 4314616 4246130 4488910 4259750 4445050 4482765 5120595 4532710 6135962 4604776 5162744 5123090 5504110 5147032 5843048 5232010 5799542 5357625 5684679 5385310 5812130 5459176 5495264 5726072 6369928 5730615 6088905 5864660 7489324 6329416 6371384 6377175 6680025 6955216 7418864 6993610 7158710 7275532 7471508 7288930 8221598 7489112 7674088 7577350 8493050 7677248 7684672 7800544 7916696 7850512 8052488 8262136 8369864 8619765 9627915 9071685 9498555 9199496 9592504 9339704 9892936 9363584 9437056 real 2m3.019s user 1m44.610s sys 0m4.500s
      
      :)
      The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein
    - [^] # Re: Un bench vaut ce qu'il vaut
      
      Posté par téthis le 08 juillet 2010 à 03:48. Évalué à 3.
      
      Le 2ème algo. en neko [http://nekovm.org/index]
      
      var NB_ENTRIES = 10000000 var HALF_NB_ENTRIES = NB_ENTRIES / 2 var d = $amake(NB_ENTRIES) var i = 2 while (i <= HALF_NB_ENTRIES) { var j = 2 * i while (j <= NB_ENTRIES) { if (d[j] == null) d[j] = 1 + i else d[j] += i j += i } i += 1 } i = 1 while (i <= NB_ENTRIES) { if (d[i] < NB_ENTRIES && d[d[i]] == i && i <= d[i]) $print(i, " ", d[i], "\n") i += 1 }
      
      real 0m48.915s
      user 0m39.157s
      sys 0m0.327s
      
      Erf…
      
      PS: J'ai ajouté HALF_NB_ENTRIES parce que j'ai vu dans le bytecode que NB_ENTRIES/2 était calculé à chaque itération.
      The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein
      - [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par téthis le 08 juillet 2010 à 04:08. Évalué à 2.
        
        Ch'uis chaud. La température dans l'apart. aussi.
        
        Comme j'avais l'impression que l'affichage des résultats prenait pas mal de temps, j'ai commenté la dernière boucle pour avoir une idée du temps nécessaire afin de remplir la table.
        
        real 0m36.748s
        user 0m36.238s
        sys 0m0.243s
        
        Pratiquement un tiers en plus pour l'affichage. :/
        
        On arrive à un temps légèrement supérieur (5s de plus avec l'affichage), sur un nombre de calculs dix fois plus grand et sur une machine moins puissante que celle qui a servie à exécuter les programmes (Archlinux sur un Celeron Tualatin 1,2 GHz).
        
        Je suis pris d'un doute soudainement.
        The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par Gniarf le 08 juillet 2010 à 15:41. Évalué à 2.
        
        > Pratiquement un tiers en plus pour l'affichage. :/
        
        on progresse, on progresse
        
        bientot tu prendras l'heure avant et après la partie intéressante de ton bout de programme et tu nous donneras la différence plutot qu'utiliser la commande time.
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par khivapia le 08 juillet 2010 à 15:56. Évalué à 2.
        
        Et pour gagner encore plus de temps, on pourra aussi segmenter le crible en différents morceaux qui tiennent dans le cache L1 plutôt que de faire des accès tous les "i"ièmes éléments ! (aucune proximité spatiale ni temporelle sauf pour les petits i).
        
        par exemple, un code de crible d'Eratosthene http://joux.biz/algcrypt/PROGRAMS/Sieve_4-2.html à comparer avec le crible naïf http://joux.biz/algcrypt/PROGRAMS/Sieve_4-1.html
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par téthis le 08 juillet 2010 à 19:02. Évalué à 2.
        
        > on pourra aussi segmenter le crible en différents morceaux qui tiennent dans le cache L1
        
        Ce qu'il faut c'est un alignement des données (+padding) afin que le CPU n'ait pas à décaler des octets pour accéder aux éléments et un code assez compact. Le code généré à partir du C doit être tout riquiqui, donc il ne pose pas problème. On doit, à vue de nez, tenir sur une trentaine d'instructions assembleur max pour l'algo.
        
        L'optimisation -O3 est tentante mais elle se fait battre assez (trop ?) souvent par -Os.
        
        ÀMHA le problème à résoudre ici est surtout un problème de pénalités suite à l'adressage d'une quantité importante de mémoire.
        
        Si il me restait de la motivation pour ces choses là, j'aurais tenté de faire des tronçons de 100 000 éléments (à voir et à expérimenter) avec les données dans le code, puis stocker les résultats à la fin de tout les calculs du tronçon. Ça sur n boucles, sans malloc(), sans free(), il me semble que ça donnerait quelque chose d'assez intéressant.
        The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par khivapia le 08 juillet 2010 à 20:53. Évalué à 3.
        
        Oui il s'agit bien de gérer les accès au cache de données, le cache d'instructions étant comme tu le dis sans doutes très petit.
        
        Déjà on peut faire un calcul simple : si le cache L1 de données fait 32 KB (processeurs Intel) ou 64 KB (processeurs AMD), sachant qu'un entier fait 32 bits soit 4 octets, il faut segmenter le crible en tableaux de taille 32 768/4 = 8192 ou 65536/4 = 16 384 éléments.
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par khivapia le 08 juillet 2010 à 20:56. Évalué à 3.
        
        s/le cache d'instructions/le code généré/ mais vous aurez rectifiés de vous-même.
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par khivapia le 08 juillet 2010 à 21:05. Évalué à 2.
        
        d'ailleurs je viens de regarder ce que ça donne dans valgrind : valgrind --tool=cachegrind ./a.out > /dev/null
        
        avec 100 000 éléments dans le tableau, j'ai environ 120 M accès au cache L1/D et parmi ces accès, 71 M de cache miss, soit 60% de miss environ, ce qui fait plutôt beaucoup. Le taux augmente quand on passe à 1M éléments.
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par téthis le 09 juillet 2010 à 01:38. Évalué à 3.
        
        Ah oui, effectivement, je pensais naïvement – je suis resté bloqué à l'époque de mon valeureux P3 sauvé d'une destruction imminente alors qu'il était encore plein de vie – que le cache L1 avait subit une croissance au moins proportionnelle à celle du cache L2. J'avais donc écrit 10.000 éléments que j'ai modifié en 100.000.
        
        C'est sûr que ça ne le fait pas à 100.000 éléments avec un cache à 32KB. Ni même à 10.000, d'ailleurs.
        
        Ah, la joie d'aller combattre les cache-misses sur les CPU. Tout fout l'camp. :D
        
        Merci pour les infos.
        The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par téthis le 09 juillet 2010 à 02:12. Évalué à 4.
        
        Je viens de retrouver le site qui m'avait servi de lecture de chevet il y a quelques paires d'années : http://www.agner.org/optimize/
        
        Rhââ, de jolies histoires d'opimisation de boucles, de register stall…
        The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par khivapia le 09 juillet 2010 à 11:23. Évalué à 3.
        
        Merci pour le site, il a l'air de contenir plein de petits bouts de code intéressants.
        
        Sinon dans le genre il y a le "What every programmer should know about memory" par Ulrich Drepper, le développeur principal de la libc.
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par hocwp (site web personnel) le 10 juillet 2010 à 00:58. Évalué à 2.
        
        De même, merci pour le site.
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par barmic le 08 juillet 2010 à 21:52. Évalué à 2.
        
        J'ai pas regarder l'algo mais je pense qu'il faut aussi garder la place pour le résultat.
        Les variables intermédiaires, si elles sont assez petites pourront être dans des registres.
        Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par téthis le 08 juillet 2010 à 16:59. Évalué à 2.
        
        Correction: je n'avais pas commenté la seconde boucle, juste la sortie à l'affichage.
        
        Il y a maintenant récupération de la date* (je ne sais pas faire autrement avec ce langage que je n'ai pratiquement jamais utilisé, la précision à la seconde devrait suffire) en trois lieux :
        – entrée de la première boucle
        – entrée de la seconde boucle
        – sortie du programme.
        
        J'ai fait tourner le programme dans une application VTE (sakura) et en console TTY.
        
        Dans Sakura, il y a 41 secondes pour la première boucle et 10 secondes la boucle de l'affichage (+ vérification des conditions). Dans un autre test il y a eu 10 secondes pour l'affichage et 42 secondes pour le calcul. On est pas à un arrondi de seconde près.
        
        En TTY, 41 secondes pour les calculs et 4 secondes pour l'affichage. Idem lors d'un deuxième test.
        
        C'est cohérent. J'essaierai de refaire les tests à la fraîche car il commence à faire horriblement chaud, ce afin de voir si ça revient aux 36 secondes de cette nuit.
        
        * http://nekovm.org/doc/view/date
        The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein
        
        [^] # Re: Un bench vaut ce qu'il vaut
        
        Posté par hocwp (site web personnel) le 08 juillet 2010 à 16:27. Évalué à 2.
        
        Ben oui, on test tout en même temps : affichage, temps de chargement, algorithme en lui même... C'est pour ça que ce test ne veux pas dire grand chose il donne juste une petite indication sur le langage.
    - [^] # Re: Un bench vaut ce qu'il vaut
      
      Posté par Florent Fourcot le 08 juillet 2010 à 16:57. Évalué à 1.
      
      En OCaml tu peux tenter d'augmenter l'inline et virer la vérification sur les tableaux (qui sur ce genre de programmes doit prendre du temps).
      
      Ce sont les options -inline et -unsafe de ocampopt (après tout si on compile en -O3 pour le C, autant tricher aussi en OCaml...)
# Plus d’infos !

Posté par nicolas le 07 juillet 2010 à 09:23. Évalué à 9.

Quels sont les compilateurs et optimisations ?

Parce qu’en restant en C :
nicolas:~/data/friend_bench% gcc toto2.c;time ./a.out>/dev/null;gcc -O3 toto2.c;time ./a.out>/dev/null
./a.out > /dev/null 0,08s user 0,00s system 97% cpu 0,078 total
./a.out > /dev/null 0,03s user 0,00s system 95% cpu 0,029 total
- [^] # Re: Plus d’infos !
  
  Posté par hocwp (site web personnel) le 07 juillet 2010 à 11:43. Évalué à 3.
  
  J'ai utiliser gcc tout seul sans optimisations. Je test avec O3 dès que j'ai un peu plus de temps.
  - [^] # Re: Plus d'infos !
    
    Posté par calandoa le 07 juillet 2010 à 14:14. Évalué à 2.
    
    T'aurais pu attendre un peu avant de vendre la mèche! J'étais à deux doigts de tester chez moi...
- [^] # Re: Plus d’infos !
  
  Posté par hocwp (site web personnel) le 07 juillet 2010 à 17:59. Évalué à 1.
  
  Bon ben avec O3, j'ai la même chose que sans pour la première version de l'algo.
  Par contre pour le deuxième algo je passe de 0.058 à 0.017. La version en Lisp reste à 0.038 donc elle se place entre le C sans optimisation et le C avec optimisation.
# code php :

Posté par Marc Quinton le 07 juillet 2010 à 09:49. Évalué à 5.

code python porté à l'identique ; la version perl ne doit pas être bien différente à mon avis.
<?php error_reporting(E_ALL); for($a=2;$a<=20000;$a++) { $sa=1; for($d=2;$d<=$a-2;$d++) {if ($a%$d==0) $sa=$sa+$d;} $b=$sa ; $sb=1; for($d=2;$d<=$b-2;$d++) {if ($b%$d==0) $sb=$sb+$d;} if ($sb==$a && $a<=$b) printf("a = $a ; b = $b\n"); } ?>

marc@lucid:~/Bureau/Dev/php$ /usr/bin/time php -q bench.php a = 6 ; b = 6 a = 28 ; b = 28 a = 220 ; b = 284 a = 496 ; b = 496 a = 1184 ; b = 1210 a = 2620 ; b = 2924 a = 5020 ; b = 5564 a = 6232 ; b = 6368 a = 8128 ; b = 8128 a = 10744 ; b = 10856 a = 12285 ; b = 14595 a = 17296 ; b = 18416 41.68user 0.02system 0:41.73elapsed 99%CPU (0avgtext+0avgdata 81808maxresident)k 0inputs+0outputs (0major+5548minor)pagefaults 0swaps
- [^] # Re: code php :
  
  Posté par Marc Quinton le 07 juillet 2010 à 09:55. Évalué à 3.
  
  la version compilée avec hiphop : http://wiki.github.com/facebook/hiphop-php/building-and-inst(...)
  
  malheureusement, ma machine est installée en 32 bits. Le process de compilation me refuse d'aller plus loin. GRRRR
# "x100 pour y voir clair"

Posté par gUI (Mastodon) le 07 juillet 2010 à 10:36. Évalué à 10.

Petite question sur ton x100 : as-tu lancé 100x l'exécutable (ou le script), ou as-tu rajouté à l'intérieur de l'algo une boucle x100 ?

En effet, je pense que ça change pas mal : le résultat est largement influencé par le temps de lancement du runtime (ou et des libs ou des machines) de chaque langage dans le premier cas, et en fait totalement abstraction sur le 2nd.

Il n'y a pas de bonne ou mauvaise solution (tout dépend de ce que tu veux mesurer), mais il serait intéressant d'avoir cette info.
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
- [^] # Re: "x100 pour y voir clair"
  
  Posté par hocwp (site web personnel) le 07 juillet 2010 à 11:50. Évalué à 3.
  
  J'ai rajouté une boucle dans l'algo parce que j'était curieux de voir la vitesse du langage et non la vitesse à laquelle il se lance. D'ailleurs sur ce terrain là le Lisp est clairement perdant. Mais bon, la REPL permet de compenser ce temps de démarrage.
  - [^] # Re: "x100 pour y voir clair"
    
    Posté par thoasm le 07 juillet 2010 à 13:00. Évalué à 4.
    
    Sinon si tu veux augmenter les temps de calcul pour y voir plus clair et rendre un peu moins important le temps de démarrages, tu peux augmenter le nombre de paires amicales à trouver, les algos sont rarement linéaires donc ça peut grossir les écarts assez facilement.
    - [^] # Re: "x100 pour y voir clair"
      
      Posté par hocwp (site web personnel) le 07 juillet 2010 à 19:44. Évalué à 4.
      
      Très bonne idée. Voila ce que j'obtiens pour 100000 éléments pour le 1er algorithme.
      Python : 48m7.524s
      Lisp : 46.021s
      C : 46.012s
      - [^] # Re: "x100 pour y voir clair"
        
        Posté par thoasm le 07 juillet 2010 à 20:22. Évalué à 2.
        
        Un facteur 60, comme tes premiers résultats à peu prêt, c'est cohérent.
        
        [^] # Re: "x100 pour y voir clair"
        
        Posté par hocwp (site web personnel) le 08 juillet 2010 à 01:53. Évalué à 1.
        
        Bon voila en poussant un peu plus loin le nombre d'éléments.
        
        Avec le 2eme algorithme :
        
        Pour 100000: Lisp = 0.005s C = 0.009s C(O3) = 0.006s
        Pour 1000000: Lisp = 0.409s C = 0.432s C(O3) = 0.407s
        Pour 10000000: Lisp = 5.469s C = Segmentation fault (normal à cause des indices du tableau)
        Pour 100000000: Lisp = 68.193s C = Segmentation fault
        Pour 1000000000: Lisp = Plein de warning à la compilation : on atteint la limite de l'implémentation actuelle et des fixnum qui est à 536870911.
        
        Je n'ai rien changer au code en Lisp (juste incrémenté nb-entries). Pour le code en C, je pense qu'il faut passer au malloc à la main et changer le type des indices.
        
        Sinon, voila les derniers nombres amis trouvé avec 100000000 éléments testés :
        
        (89477984 92143456)
        (90437150 94372450)
        (91996816 93259184)
        (93837808 99899792)
        (95629904 97580944)
        (96304845 96747315)
        (97041735 97945785)
        
        [^] # Re: "x100 pour y voir clair"
        
        Posté par hocwp (site web personnel) le 08 juillet 2010 à 02:02. Évalué à 1.
        
        Petite précision : ceci est fait sans la boucle fois 100. Le programme prend déjà assez de temps comme ça.
  - [^] # Re: "x100 pour y voir clair"
    
    Posté par hocwp (site web personnel) le 08 juillet 2010 à 02:30. Évalué à 2.
    
    Correction le Lisp n'est pas si perdant que ça à condition de lui compiler le code avant. Ce que j'ai fais avec les dernières mesures que j'ai donné au dessus.
    En deux passes:
    $ sbcl Lisp> (compile-file "toto.lisp") $ time sbcl --noinform --load toto.fasl
    On obtient les temps donnés ici par exemple : http://linuxfr.org/comments/1142006.html#1142006
# Rosetta Code

Posté par Naha (site web personnel) le 07 juillet 2010 à 14:53. Évalué à 3.

Apparemment ce problème n'est pas encore sur Rosetta Code [http://rosettacode.org/], ça pourrait être intéressant de l'y ajouter.
# Python et psyco

Posté par gnibu le 07 juillet 2010 à 15:20. Évalué à 1.

Psyco booste pas mal les performances de python

time python toto.py 17,45s user 0,01s system 97% cpu 17,903 total

time python toto_psyco.py 0,69s user 0,00s system 88% cpu 0,790 total
- [^] # PyPy (was Re: Python et psyco)
  
  Posté par pipo_molo le 07 juillet 2010 à 15:56. Évalué à 2.
  
  Et pout info, avec PyPy, j'obtiens quasiment le même temps d'exécution qu'avec psyco.
  - [^] # Re: PyPy (was Re: Python et psyco)
    
    Posté par claudex le 07 juillet 2010 à 16:41. Évalué à 2.
    
    Avec le JIT ou sans?
    « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
# Code lua toto2

Posté par téthis le 07 juillet 2010 à 15:59. Évalué à 5.

local nb_entries = 10000 local d = {} local i, j for i=2,nb_entries/2 do for j=2*i,nb_entries,i do d[j]= (d[j] or 1) + i end end for i=1,#d do if d[i] ~= nil and d[i] < nb_entries and d[d[i]] == i and i <= d[i] then print(i,d[i]) end end

real 0m0.099s
user 0m0.050s
sys 0m0.007s

Ça roxe du ponayz, sachant que l'approche naïve (toto.lua) mettait 21 secondes sur la même machine.
The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein
- [^] # Re: Code lua toto2
  
  Posté par hocwp (site web personnel) le 07 juillet 2010 à 18:02. Évalué à 2.
  
  C'est ça qui est rigolo : on s'extasie sur le premier algo avec le javascript plus rapide que le python, puis le Lisp plus rapide que les 2. Et tout le monde est mis d'accord avec un changement d'algo qui place le python en 1er loin devant les autres. Et enfin le Lisp et le C qui se tire la bourre laissant le python derrière.
  Tout ça pour dire que l'algo est vraiment le point central !
  - [^] # Re: Code lua toto2
    
    Posté par gaaaaaAab le 07 juillet 2010 à 21:53. Évalué à 2.
    
    vi. Pas la peine d'optimiser le code tant qu'on a pas poussé l'approche algorithmique dans ses derniers retranchements.
    
    à noter qu'il y a un appel à sorted inutile dans mon code python, scorie pas nettoyée d'une version intermédiaire.
    - [^] # Re: Code lua toto2
      
      Posté par MsieurHappy le 08 juillet 2010 à 00:13. Évalué à 3.
      
      Tu peux également utiliser enumerate() dans la dernière ligne, ce qui donne:
      print [(i, v) for i, v in enumerate(d) if v < NB_ENTRIES and d[v] == i and i <= v]
      - [^] # Re: Code lua toto2
        
        Posté par gaaaaaAab le 08 juillet 2010 à 02:23. Évalué à 2.
        
        oué !
        je ne connaissais pas (encore) enumerate. C'est plus lisible, je vais m'en servir très vite :)
        
        sinon, précision utile pour le lecteur de passage, msieur_happy répond en fait au commentaire que j'ai posté dans l'entrée du forum sur le sujet :)
        (cf lien dans le corps du journal)
    - [^] # Re: Code lua toto2
      
      Posté par hocwp (site web personnel) le 08 juillet 2010 à 02:36. Évalué à 2.
      
      > à noter qu'il y a un appel à sorted inutile dans mon code python, scorie pas nettoyée d'une version intermédiaire.
      Oui. Sans le tri, on obtient 0.068s au lieu de 0.073s
# code perl - + benchmarks

Posté par krapule le 07 juillet 2010 à 17:18. Évalué à 2.

De mon côté en recompilant je ne trouve pas vraiment la même chose:

(En bouclant 100 fois)

C (gcc -O3 toto2.c; time ./toto2 >out ) 0.017s 1
lisp (toto4.lisp with loop) 0.037 2
perl (time ./toto2.pl >out2 1.566s 92
python (time python toto2_with_loop.py ) 1.807s 106

toto2.pl
#! /usr/bin/env perl

use strict;
use warnings;

my $NB_ENTRIES = 10000;
my $NB_LOOPS = 100;

test() foreach ( 1..$NB_LOOPS);

sub test {

my @d = (1)x $NB_ENTRIES;
my $mid = int($NB_ENTRIES / 2);
my ($i, $j);

for ($i = 2; $i < $mid; $i++) {
for ($j = $i*2; $j < $NB_ENTRIES; $j += $i) {
$d[$j] += $i;
}
}

my $di;
for ($i = 0; $i < $NB_ENTRIES; $i++) {
$di = $d[$i];
print "$i $di\n" if $di < $NB_ENTRIES && $d[$di] == $i && $i <= $di;
}

}

# go !

Posté par gaaaaaAab le 08 juillet 2010 à 02:20. Évalué à 4.

soyons modernes :)

package main

import "fmt"

const n int = 10000

func main() {
        var d [n] int;

        for i := 0; i < n; i++ {
                d[i] = 1
        }

        for i := 2; i < n / 2; i++ {
                for j := 2 * i; j < n; j += i {
                        d[j] += i
                }
        }

        for i := 2; i < n; i ++ {
                if (d[i] < n) && (i <= d[i]) {
                        if d[d[i]] == i {
                                fmt.Print("(", i, d[i], "), ")
                        }
                }
        }
        fmt.Print("\n")
}

bon, pas sûr qu'on puisse pas faire mieux, c'est limite mon premier essai en go. Chez moi, en faisant 50 itérations sur des entiers jusqu'à 1000000, go prend 15%/20 % de temps de plus que le C. (100 boucles sur 10000, c'est trop court, les fluctuations entre 2 essais sont trop importantes) Aussi, j'utilise le compilo go qui avait été fourni genre à l'annonce officielle du langage, la dernière version fait peut-être mieux

# Scala

Posté par hsyl20 (site web personnel) le 08 juillet 2010 à 11:15. Évalué à 4.

J'ai traduit littéralement les 2 versions Python en Scala:

Version 1 :

#!/usr/bin/env scala
!#

class Toto {
for (a <- Range(2,100000)) {
var sa = 1
for (d <- Range(2,a-2))
if (a%d == 0)
sa += d
var (b,sb) = (sa, 1)
for (d <- Range(2,b-2))
if (b%d == 0)
sb += d
if (sb == a && a < b)
println(a+","+b)
}
}

new Toto

Version 2 :

#!/usr/bin/env scala
!#

class Toto {
//Pour ajouter la fonction "sort" à (x,y) comme dans le code Python
implicit def tupl(t:Tuple2[Int,Int]) = new {
def sort = if (t._1 > t._2) t.swap else t
}

val NB_ENTRIES = 1000000
val d = Array.fill(NB_ENTRIES)(1)

for (i <- Range(2, NB_ENTRIES / 2))
for (j <- Range(2 * i, NB_ENTRIES, i))
d(j) += i

println ( for (i <- Range(0, d.length) if d(i) < NB_ENTRIES && d(d(i)) == i && i <= d(i)) yield (i, d(i)).sort )
}

new Toto

Là ce sont les versions "script". Pour avoir une version pré-compilée en bytecode, enlever l'entête et remplacer "new Toto" par:

object Pouet {
def main(args:Array[String]) {
new Toto
}
}

Compiler avec scalac Toto.scala
Exécuter avec scala Pouet

Résultats avec 1M éléments :
Python V1 : j'ai arrêté après 14 minutes
Python V2 : entre 3.7s et 4s
Scala V1 : environ 50 minutes
Scala V2 : entre 1.3s et 1.6s
Scala V2 compilé : entre 0.60s et 0.66s

J'espère que ça va donner envie aux programmeurs Python qui voudraient passer à un langage qui a au moins la même expressivité que Python et qui est plus rapide et plus fiable (typage statique...) ;-)
- [^] # Re: Scala
  
  Posté par barmic le 08 juillet 2010 à 12:29. Évalué à 2.
  
  Généralement les programmeurs python adorent le duck typing...
  Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)
  - [^] # Re: Scala
    
    Posté par hsyl20 (site web personnel) le 08 juillet 2010 à 18:38. Évalué à 2.
    
    Justement. Si on compare les deux versions (en indentant comme il faut), on peut voir qu'à quelques conversions syntaxiques près, on a le "même" code qu'en Python. On peut même se passer de la création d'une classe dans la version "script" en Scala.
    
    Exemples de conversion Python => Scala :
    "in" => "<-"
    "xrange" => "Range"
    indentation => accolades
    ...
    
    Et on gagne le typage statique, la compatibilité avec les biblio Java/Scala/autres langages sur la JVM, la rapidité, etc. tout en conservant le Duck Typing.
    - [^] # Re: Scala
      
      Posté par zul (site web personnel) le 08 juillet 2010 à 21:01. Évalué à 2.
      
      Typage statique et duck typing en même temps ? C'est pas un poil contradictoire ?
      - [^] # Re: Scala
        
        Posté par thoasm le 08 juillet 2010 à 22:44. Évalué à 2.
        
        Non. Typage statique c'est qu'une variable reste du même type tout au long de son cycle de vie. Typage dynamique c'est qu'une variable peut être réaffectée à n'importe quel type.
        
        Le duck typing c'est encore autre chose : le type est défini par un l'ensemble des méthodes et/ou attributs et leur signature d'un objet.
        
        Deux objets sont compatibles au niveau des types si ils sont compatibles au niveau de la signatures des méthodes, par exemple si t'as une fonction, ce qui est requis pour "variable" c'est d'avoir un type qui fournit la méthode cacul, et rien de plus. Son type est défini par ça -> elle fournit une méthode cacul.
        Ça peut être du typage statique si tu peux plus lui réaffecter n'importe quoi derrière, et c'est du "duck typing".
        
        fun fonction(variable) -> retourne variable.calcul()
        
        Regarde aussi inférence de types, c'est une technique qui permet de typer statiquement une variable à la compilation, même si quand tu écris ta méthode tu ne précise pas le type de ses paramètres. C'est une manière de faire de la généricité.
        
        [^] # Re: Scala
        
        Posté par hsyl20 (site web personnel) le 09 juillet 2010 à 03:18. Évalué à 2.
        
        En Scala si tu veux utiliser le Duck typing, tu fais :
        
        def pouet(a: {def yeah}) {
        a.yeah
        }
        
        C'est-à-dire que la méthode "pouet" prend en argument n'importe quel objet ayant une méthode "yeah" (ne prenant pas d'argument et ne renvoyant rien, dans cet exemple).
        
        Après on utilise très rarement ce genre de code en pratique. Là où Scala ressemble à un langage de script, c'est principalement grâce à son système d'inférence de type, qui est très bien fait, et aussi grâce aux implicits qui permettent d'étendre des classes déjà existantes (à la Ruby).
        
        [^] # Re: Scala
        
        Posté par zul (site web personnel) le 09 juillet 2010 à 13:19. Évalué à 1.
        
        Le problème vient probablement de définitions divergeantes sur la chose. Tout dépend de ce qu'on appelle type, typage statique et dynamique et duck typing. D'après la définition de Wikipedia, (que je partage), le duck typing est une technique utilisée dans les langages dynamiques, où l'on utilise sa liste de méthodes plutôt qu'un hierarchie de classes / mixin / interface autre pour déterminer si l'appel est valide ou pas.
        
        La programmation générique, et / ou l'inférence de type (qui n'est pas vraiment l'apanage des langages de script vu que ça vient plutôt de ML / haskell ...) sont si tu veux du "duck typing static", mais font pour moi partie du système de typage (voir typeclass en Haskell, feu concept en C++) . De plus, en général, la notion de typeclass / concept est un peu plus riche que l'existence d'une "méthode", et en générale une plus forte connotation sémantique. Ça permet d'éviter des choses étranges parce que des objets différents ont un nom de méthode en commun, mais avec des sémantiques absolument pas cohérentes.
        
        [^] # Re: Scala
        
        Posté par thoasm le 09 juillet 2010 à 13:29. Évalué à 2.
        
        Pas vraiment, si je me trompe pas en Haskell la sémantique des méthodes n'est cohérente que si tu le veux bien, et par convention : les monades sont supposées repecter certains axiomes, mais rien dans le langage ne peut t'interdire de ne pas les respecter, faudrait que les axiomes soient explicitement déclarés dans le langage et qu'il existe un moteur de preuve.
        
        Sinon, j'ai simplifié, ce n'est pas simplement un nom de méthode, le duck typing, c'est aussi la signature, même si la signature est forcément moins informative que dans un système à typage plus contraignant.
        
        [^] # Re: Scala
        
        Posté par zul (site web personnel) le 09 juillet 2010 à 14:27. Évalué à 1.
        
        La signature dans un langage dynamique, ça se limite à peu près à l'arité de la fonction ce qui nous amène pas bien loin.
        
        Pour les typeclass, on peut évidemment se tirer une balle dans le pied mais bon, on y peut pas grand chose (à par oui peutêtre rajouter un moteur de preuve dans le compilateur et un générateur de claque). Mais ça reste moins erreur prone puisqu'on explicite qu'on veut que ce "type" réponde à un certain typeClass (donc à une certaine sémantique), en l'implémentant d'une certain façon.
        
        [^] # Re: Scala
        
        Posté par thoasm le 09 juillet 2010 à 14:35. Évalué à 2.
        
        Tu peux faire le même genre de truc avec du duck typing dynamique, des gens ont implémentés des monades en python, par exemple.
        
        [^] # Re: Scala
        
        Posté par zul (site web personnel) le 09 juillet 2010 à 16:02. Évalué à 1.
        
        Je n'en doute pas, enfin l'intérêt premier des monade c'est de garantir par le système de typage la présence (et surtout l'absence) de certaines action impures. Je ne vois pas vraiment sur de l'intérêt en python (à par pour montrer qu'on puisse le faire, ou rigoler sur la théorie des catégories)).
        
        [^] # Re: Scala
        
        Posté par hsyl20 (site web personnel) le 15 juillet 2010 à 00:23. Évalué à 1.
        
        Ça tombe bien, Josh Suereth vient de publier un article qui explique comment implémenter l'équivalent des "type classes" d'Haskell en Scala : http://suereth.blogspot.com/2010/07/monkey-patching-duck-typ(...) Ça se fait en combinant les "structural types" :
        scala> def pouet(a:{def ping: String}) = println("kekidi? " + a.ping) pouet: (a: AnyRef{def ping: String})Unit scala> class Yop { | def ping = "checku" | } defined class Yop scala> val truc = new Yop truc: Yop = Yop@1c45484a scala> pouet(truc) kekidi? checku
        Avec les traits :
        scala> trait MyTypeClass { | def ping: String | } defined trait MyTypeClass scala> def pouet(a:MyTypeClass) = println("kekidi? " + a.ping) pouet: (a: MyTypeClass)Unit scala> pouet(truc) :14: error: type mismatch; found : Yop required: MyTypeClass pouet(truc) ^
        Et avec les implicits. Si Yop supporte la type-class MyTypeClass, alors on définit un implicit comme ça :
        scala> implicit def yop_mtc(a:Yop): MyTypeClass = new MyTypeClass { | def ping = a.ping | } yop_mtc: (a: Yop)MyTypeClass
        Ce qui permet ensuite d'écrire, sachant que truc est de type Yop :
        scala> pouet(truc) kekidi? checku
- [^] # Re: Scala
  
  Posté par Yakulu le 09 juillet 2010 à 09:43. Évalué à 1.
  
  J'espère que ça va donner envie aux programmeurs Python qui voudraient passer à un langage qui a au moins la même expressivité que Python et qui est plus rapide et plus fiable (typage statique...)
  
  Ou alors ils peuvent utiliser Cython [http://cython.org/] pour certains morceaux de leur programme (typage statique possible et même conseillé pour obtenir des performances assez proches du C il parait).
  
  Cela dit, Scala semble être un langage intéressant, que je n'ai regardé que de loin sans le pratiquer. En fait, le soucis avec les langages sur la JVM me semble du côté de la consommation mémoire [http://shootout.alioth.debian.org/u32/benchmark.php?test=all(...)]. Constatation réelle ou non significative ?
  - [^] # Re: Scala
    
    Posté par hsyl20 (site web personnel) le 15 juillet 2010 à 00:01. Évalué à 1.
    
    Sur shootout, la version 2.7.7 de Scala est utilisée. Elle commence à dater. Il faudrait voir ce que ça donne avec la 2.8.
    
    L'utilisation mémoire de la JVM et le garbage collector utilisé se configurent. Si jamais la consommation mémoire devient un problème, il est possible de regarder de ce côté là.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.