FXB a écrit 1 commentaire

  • [^] # Re: creation des threads + cache

    Posté par  . En réponse au message Parallelisation d'une boucle (théoriquement) trivialement parallélisable. Évalué à 1.

    +1 pour la réponse.

    Bonjour

    J'ai fait le test de l'auteur avec OPENMP, je l'ai porté en FORTRAN et utilisé un compilateur INTEL 11.1 qui est réputé comme un compilateur performant (openmp 3.0)

    Dans ce cas, je voudrais signaler que j'observe le même comportement que lui avec pthreads

    - J'ai fait attention d'exécuter le job plusieurs fois et de ne pas compter le premier appel. (les threads sont créées)

    - Pour répondre à la localisation des données, j'ai utilisé une fonction du compilateur (variable d'envirronnement KMP_AFFINITY) qui permet de choisir de balancer les threads entre processeurs ou de remplir d'abord un processeur avant d'en remplir un suivant. J'ai bien sur désactivé l'hyperthreading pour ne pas véroler les performances.

    J'ai donc une question pour vous. Pensez-vous que la vitesse du cache peut être en cause?

    ...et même une deuxième question: Avez-vous pu reproduire son problème sur vos machines?

    Amicalement.