La sortie de la nouvelle version majeure du compilateur GCC du projet GNU a été annoncée le 2 mai 2017. Écrit à l’origine par Richard Stallman, le logiciel GCC (GNU Compiler Collection) est le compilateur de référence du monde du logiciel libre. Il accepte des codes sources écrits en C, C++, Objective-C, Fortran, Java, Go et Ada et fonctionne sur une multitude d’architectures.
La suite de la dépêche vous propose une revue de certaines améliorations et nouvelles fonctionnalités de cette nouvelle version.
Sommaire
- Mais que veut dire GCC ?
- Collection de langages de programmation
- Schéma de version
- Nouveautés spécifiques à un ou des langages
- Diagnostics
- Délestage
- Divers
Mais que veut dire GCC ?
En août 1987, GCC signifiait GNU C Compiler (compilateur C de GNU) car il ne prenait en charge que le langage de programmation C. Mais dès décembre 1987, la prise en charge expérimentale du C++ a été intégrée (stabilisée avec GCC 2 publié en 1992). Six autres langages de programmation seront pris en charge progressivement (Objective-C, Objective-C++, Fortran, Java, Ada, et Go).
Le divergence (fork) EGCS a commencé à avoir du succès. Après une longue période de négociation, les deux projets se sont finalement réunifiés en avril 1999 pour donner un nouveau nom : GNU Compiler Collection, en conservant le même acronyme que le projet original. La première version du nouveau projet fut GCC 2.95.
Donc, depuis 1999, GCC signifie GNU Compiler Collection et prend en charge neuf langages de programmation (et bien d’autres expérimentalement ou avec des extensions).
Collection de langages de programmation
- C, avec
gcc
; - C++, avec
g++
; - Objective-C ;
- Objective-C++ ;
-
Fortran, avec
gfortran
; - Java, avec
gcj
(qui est mort) ; - Ada, avec GNAT ;
- Go, avec
gccgo
; - OpenMP (c’est un langage qui étend d’autres langages de programmation) ;
- Cilk Plus ;
- OpenACC ;
- Unified Parallel C avec le GCC UPC compiler (expérimental).
Des logiciels tiers (third parties) permettent la prise en charge d’autres langages :
- Pascal, avec
gpc
; - Modula (2 et 3) ;
- PL/I ;
- D, avec
gdc
; - VHDL, avec
ghdl
.
Schéma de version
Le projet GCC a modifié son schéma de version en août 2014 pour faire coïncider l’année 2015
à la version GCC 5
et ainsi de suite pour donner : 2016
→ GCC 6
, puis 2017
→ GCC 7
. Attention, nous devrions donc avoir GCC 10
en 2020
.
Détail des versions avec le nouveau schéma :
Branche de
développement (2014-04-11)
de GCC 4.10
|
|
GCC 4.10 renommée (2014-08-13)
GCC 5.0
|
|
Branche de
développement
de GCC 5
|
+-------- Branche de livraison
| GCC 5.x (2015-04-12)
| |
| v
| GCC 5.1 (2015-04-22)
| |
| v
Branche GCC 5.2 (2015-07-16)
de dév. |
GCC 6 v
| GCC 5.3 (2015-12-04)
| |
| v
| GCC 5.4 (2016-06-03)
|\
| \
| `----- Branche de livraison
| GCC 6.x (2016-04-15)
| |
| v
| GCC 6.1 (2016-04-27)
| |
Branche v
de dév. GCC 6.2 (2016-08-22)
GCC 7 |
| v
| GCC 6.3 (2016-12-21)
|\
| \
| `----- Branche de livraison
| GCC 7.1 (2017-05-02)
| |
v |
Branche v
de dév. Branche de correction
GCC 8 de bogues sur GCC 7
Nouveautés spécifiques à un ou des langages
Ada
Sur les plates‐formes les plus courantes, les programmes Ada n’ont plus besoin que la pile soit exécutable pour fonctionner correctement.
BRIG (HSAIL)
Prise en charge de BRIG 1.0. BRIG est un format binaire pour HSAIL (Heterogeneous System Architecture Intermediate Language).
Famille C/C++
Les langages C et C++ partagent les améliorations suivantes :
- en cas d’erreur (de frappe) sur le nom d’une variable membre, GCC 6 pouvait déjà suggérer un nom correct. GCC 7 va encore plus loin et détectant des noms mal orthographiés de fonctions, macros, types, énumérations, etc. ;
- le préprocesseur suggère aussi une correction si une directive est mal écrite ;
- ajout des contrôles de débordement pour les opérations arithmétiques,
__builtin_add_overflow_p
,__builtin_sub_overflow_p
et__builtin_mul_overflow_p
; contrairement à leurs équivalents sans le_p
final, ceux‐ci ne demandent pas d’argument pour ranger le résultat de l’opération.
Améliorations spécifiques au langage C
-
-fopenmp
comprend le mot‐clef_Atomic
de C11 ; - ajouts des types flottants étendu,
FloatN
etFloatNx
; la disponibilité de ces types dépend de l’architecture utilisée.
Améliorations spécifiques au langage C++
- prise en charge expérimentale de C++17 (
-std=c++1z
) ; -
l’ordre d’évaluation des expressions peut être activé hors C++17 (
-fstrong-eval-order
) ou désactivé pour ce dernier (-fno-strong-eval-order
) ; - implémentation des fonctionnalités C++17 au sein de la libstdc++.
Fortran
La version 4.5 de la spécification OpenMP est maintenant partiellement gérée par le compilateur Fortran.
Go
- il y a une implémentation complète des paquets utilisateurs de Go 1.8.1 ;
- par rapport à la chaîne de compilation de Go 1.8.1, le ramasse‐miettes est plus conservateur et moins concurrent ;
-
-fgo-optimize-allocs
et-fgo-debug-escape
Java
Java (GCJ) n’existe plus (mais le code est toujours disponible via le gestionnaire de versions).
Diagnostics
Pour aider à la correction de bogues, GCC 7 apporte ces directives intéressantes :
-
-fdiagnostics-parseable-fixit
: les suggestions de correction sont diffusées sous un format plus lisible et capable d’être mieux digéré par les EDI ; -
fdiagnostics-generate-patch
: produit un fichier correctif dans le format unifié (patch -u
) à la fin du diagnostic.
Délestage
Depuis la version 5, deux implémentations sont proposées pour délester, complètement ou partiellement, l’exécution de code par un processeur externe (c.‐à‐d. un ou plusieurs processeurs graphiques) : OpenACC et OpenMP.
Cette version améliore la prise en charge des spécifications OpenACC 2.0A et autorise le délestage de régions openMP par les processeurs graphiques NVIDIA (PTX).
Ces deux interfaces sont accessibles via la bibliothèque libgomp.
Divers
- les extensions Cilk+ pour C et C++ sont considérées obsolètes ;
- pour les nouvelles cibles, un nouveau LRA (Local Register Allocator) est utilisé par défaut.
Aller plus loin
- Liste des changements de GCC 7 (465 clics)
- Un article introductif sur le site LWN (133 clics)
- La précédente dépêche pour la version 6.1 (93 clics)
- Un article sur le blog Red Hat au sujet de la nouvelle alerte warning -Wimplicit-fallthrough (116 clics)
- Guide de migration vers GCC 7 (139 clics)
# Délester ?
Posté par Antoine . Évalué à 7.
En général, quand on se lâche du lest, il se perd dans la nature… Plutôt que délester, j'aurais donc dit déléguer l'exécution de code à un GPU.
[^] # Re: Délester ?
Posté par David Marec . Évalué à 2.
Si l'on veut rester pédant dans la définition, «déléguer» ne convient pas non plus: il n'est pas question là d' autorité ou de représentation.
GCC n'est pas l'initiateur: c'est un choix du développeur.
GCC est débarrassé d'une charge, comme un axe routier se retrouve soulagé par un itinéraire de délestage.
[^] # Re: Délester ?
Posté par Antoine . Évalué à 6. Dernière modification le 25 juin 2017 à 11:51.
D'après le Larousse en ligne :
« Envoyer quelqu'un au nom d'un groupe, de quelqu'un d'autre, dans un but déterminé, avec une mission définie ». Bon, le GPU n'est pas une personne, mais à part ça, la définition colle : le GPU se voit confier, au nom du CPU (qui conserve son rôle de chef d'orchestre), l'exécution d'une mission définie.
[^] # Re: Délester ?
Posté par ZeroHeure . Évalué à 10.
Au contraire, c'est correct : délester prend le sens de décharger : retirer une partie de la charge — de quelqu'un ou quelque chose. Qui a donné par suite délestage, dans itinéraire de délestage. On ne jette donc pas du lest, mais on emprunte une autre voie. Le terme est judicieux.
"La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay
[^] # Re: Délester ?
Posté par Jean-Baptiste Faure . Évalué à 3.
Le mot délester ne me choque pas ici, par contre c'est c'est l'emploi de par dans "délester par …" qui sonne bizarrement pour moi. J'aurais plutôt écrit "délester vers".
[^] # Re: Délester ?
Posté par steph1978 . Évalué à 4.
En anglais on dirait "offload", donc plutôt "décharger".
Où simplement "déplacer".
# Performances
Posté par Foutaises . Évalué à 8. Dernière modification le 01 juillet 2017 à 01:46.
Outre le fait que GCC ait mis en exergue un gros bug qui fait que sous certaines conditions de charge CPU, les processeurs Intel Skylake et Kabylake peuvent crasher et planter complètement le système (Linux comme Windows), j'ai vu passer un tableau de benchmarks qui m'a interpellé.
En effet, dans le cadre de l'annonce de la gamme Epyc d'AMD, le site Heise.de a procédé à différents tests comparatifs pour l'évaluer, et l'un d'entre eux consistait à comparer — sous Linux — les performances SPEC CPU 2006 de différents processeurs, avec des programmes compilés avec différents compilateurs (enfin, me semble-t-il, je ne pane rien à l'allemand).
Si je comprends bien le tableau, cela veut-il dire que — dans ce test précis — GCC 6.3-02 est significativement moins performant qu'Open64 v4.5.2.1 et Intel 2016 ?
Si tel était le cas, GCC 7.1 améliore-t-il la chose ?
[^] # Re: Performances
Posté par Albert_ . Évalué à 3.
Je ne connais pas open64 (compilateur pour architecture un peu particuliere et qui en fin de vie) par contre il est bien connu que le compilo intel est bien plus optimise que GCC et … bien plus bugge… ou disons bien moins respectueux des normes. Si ton code passe a la compilation cela peut etre cool mais bon il y a souvent du boulot d'adaptation a faire pour contourner les problemes.
[^] # Re: Performances
Posté par khivapia . Évalué à 10.
Dans l'article cité, les auteurs utilisent GCC avec l'optimisation au niveau 2 (-O2) et non pas 3 (-O3). Cela peut expliquer largement la différence de performance.
Ensuite, ils devraient utiliser le flag -Ofast pour le code en virgule flottante : le compilateur d'Intel n'est pas aussi strict sur la norme que GCC. En particulier, il considère par défaut que les opérations sont commutatives (a + b = b + a) et associatives (a + (b + c) = (a + b) + c), ce qui n'est pas vrai en virgule flottante… et permet de nombreuses optimisations !
En outre, ils précisent qu'ils n'ont pas spécifié d'architecture (flag -march=native par exemple).
Dans ce cas, GCC optimise de sorte à se comporter convenablement sur un ensemble de processeurs cible. Ainsi, il optimise bien moins le code pour Ryzen qu'avec une architecture spécifique.
Le compilateur d'Intel détecte l'architecture automatiquement (fut un temps ils se comportaient moins bien, délibérément, pour les processeur d'AMD).
Open64 a été maintenu par AMD, c'est normal qu'il se comporte bien sur les processeurs d'AMD.
Ce serait intéressant de comparer GCC en activant la détection d'architecture (ou en spécifiant carrément l'architecture du processeur ciblé) et un niveau d'optimisation comparable vis-à-vis des normes !
# Divergence
Posté par NumOpen . Évalué à 1. Dernière modification le 10 juillet 2017 à 18:33.
On dit « Le divergence » ou « Le dérivé » ?
[^] # Re: Divergence
Posté par Pol' uX (site web personnel) . Évalué à 2.
Wikipédia énonce :
L'« embranchement » me semble approprié ici comme formulation. Mais ça fait moins Holywood.
Adhérer à l'April, ça vous tente ?
# Changement non mentionné
Posté par ariasuni . Évalué à 2.
Je ne l’ai pas trouvé dans les changements de GCC 7 ou 7.1, mais avr-gcc est plus strict dans certains cas et empêche du code de compiler du code qui était accepté auparavant. J’ai dû corriger le code de QMK pour pouvoir le compiler avec la dernière version de GCC.
Écrit en Bépo selon l’orthographe de 1990
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.