Journal Conversion de fichiers Excel vers PDF en Python

Posté par  . Licence CC By‑SA.
Étiquettes :
-4
17
mar.
2026

Sommaire

Dans les flux de travail de gestion documentaire et de rapports d'entreprise, la conversion de feuilles de calcul Excel au format PDF représente une opération fondamentale. Le format PDF préserve fidèlement la mise en page, empêche les modifications accidentelles et garantit un affichage cohérent sur différents appareils et plateformes. Cet article explore les méthodes efficaces pour convertir des fichiers Excel en PDF à l'aide de Python, tout en maintenant la qualité du formatage et en contrôlant divers paramètres de conversion.

Pourquoi convertir Excel en PDF

Les feuilles de calcul Excel excellent dans l'analyse et l'édition de données, mais elles présentent certaines limitations lors de la distribution :

  • Préservation de la mise en page : Les PDF maintiennent exactement le formatage des cellules, les largeurs de colonnes et la disposition des pages, quel que soit le système du lecteur
  • Protection des données : Les PDF sont plus difficiles à modifier accidentellement, protégeant ainsi les calculs et données sensibles
  • Visualisation universelle : Les destinataires peuvent consulter les PDF sans avoir besoin d'Excel ou d'un logiciel de tableur
  • Prêt à imprimer : Les PDF sont optimisés pour l'impression avec des sauts de page et des marges cohérents
  • Présentation professionnelle : Les PDF offrent une apparence soignée et finale pour les rapports et états financiers

L'automatisation de cette conversion avec Python permet le traitement par lots de rapports financiers, la génération automatique de factures et l'intégration dans des pipelines de données plus vastes.

Configuration de l'environnement

Avant de commencer, vous devez installer une bibliothèque Python prenant en charge les opérations Excel. Spire.XLS for Python fournit des API complètes pour gérer les classeurs au format XLSX, y compris les fonctionnalités de conversion PDF.

pip install Spire.XLS

Une fois installée, importez les modules pertinents dans votre script Python :

from spire.xls import *
from spire.xls.common import *

Processus de conversion de base

Les étapes principales pour convertir un fichier Excel en PDF sont simples : créer un objet classeur, charger le fichier Excel et enregistrer au format PDF. Voici un exemple minimal fonctionnel :

La méthode la plus directe pour convertir un fichier Excel consiste à utiliser l'objet Workbook qui gère automatiquement la structure du document. Cette approche fonctionne parfaitement pour des conversions rapides où vous souhaitez préserver l'intégralité du contenu et du formatage d'origine sans configuration supplémentaire :

from spire.xls import *
from spire.xls.common import *

# Définir les chemins d'entrée et de sortie
inputFile = "tableau.xlsx"
outputFile = "resultat.pdf"

# Créer un objet classeur
workbook = Workbook()

# Charger le fichier Excel depuis le disque
workbook.LoadFromFile(inputFile)

# Configurer l'ajustement des feuilles pour un meilleur rendu PDF
workbook.ConverterSetting.SheetFitToPage = True

# Enregistrer au format PDF
workbook.SaveToFile(outputFile, FileFormat.PDF)

# Libérer les ressources
workbook.Dispose()

Ce code illustre le flux de conversion le plus élémentaire. L'objet Workbook gère le chargement et la gestion du fichier Excel, tandis que SaveToFile() avec FileFormat.PDF spécifie le PDF comme format de sortie. Le paramètre SheetFitToPage garantit que les feuilles de calcul sont correctement mises à l'échelle pour tenir dans les pages PDF.

Conformité PDF/A pour l'archivage

Pour l'archivage documentaire à long terme, le PDF/A constitue une version normalisée ISO du PDF conçue pour la préservation numérique. Convertir Excel en PDF/A assure que les documents resteront accessibles pendant des décennies :

Lorsque vos documents Excel contiennent des données financières, des registres légaux ou toute information nécessitant une conservation à long terme, il est essentiel d'utiliser le standard PDF/A. Cette norme garantit que tous les éléments visuels et texturaux sont intégrés dans le fichier, éliminant toute dépendance aux polices ou ressources externes :

from spire.xls import *
from spire.xls.common import *

inputFile = "donnees_financieres.xlsx"
outputFile = "copie_archivage.pdf"

workbook = Workbook()
workbook.LoadFromFile(inputFile)

# Définir le niveau de conformité PDF sur PDF/A-1B
workbook.ConverterSetting.PdfConformanceLevel = PdfConformanceLevel.Pdf_A1B

# Enregistrer en PDF conforme PDF/A
workbook.SaveToFile(outputFile, FileFormat.PDF)
workbook.Dispose()

Le paramètre PdfConformanceLevel offre plusieurs options :

  • Pdf_A1B : Conformité PDF/A-1 Niveau B - adaptée à la plupart des besoins d'archivage
  • Pdf_A2B : Conformité PDF/A-2 Niveau B - prend en charge des fonctionnalités plus modernes
  • Pdf_A3B : Conformité PDF/A-3 Niveau B - permet l'intégration de fichiers arbitraires

La conformité PDF/A est essentielle pour les documents juridiques, les registres financiers et tout contenu nécessitant une préservation à long terme.

Conversion de plages de cellules spécifiques

Parfois, vous n'avez besoin d'exporter qu'une plage de données spécifique plutôt que des feuilles de calcul entières. Cette approche s'avère utile pour créer des résumés ou extraire des indicateurs clés :

Dans de nombreux scénarios professionnels, seul un sous-ensemble des données doit être partagé. Plutôt que de distribuer un classeur complet, vous pouvez isoler une section pertinente et la convertir indépendamment. Cette technique permet de générer des vues ciblées adaptées à différents publics ou objectifs :

from spire.xls import *
from spire.xls.common import *

inputFile = "rapport_trimestriel.xlsx"
outputFile = "section_resumé.pdf"

workbook = Workbook()
workbook.LoadFromFile(inputFile)

# Ajouter une nouvelle feuille de calcul pour la plage sélectionnée
workbook.Worksheets.Add("resume")

# Copier la plage de cellules spécifique vers la nouvelle feuille
workbook.Worksheets[0].Range["A9:E15"].Copy(
    workbook.Worksheets[1].Range["A9:E15"], 
    False,  # Ne pas copier les formules
    True    # Copier le formatage
)

# Ajuster automatiquement les largeurs de colonnes pour une meilleure apparence
workbook.Worksheets[1].Range["A9:E15"].AutoFitColumns()

# Enregistrer uniquement la plage sélectionnée en PDF
workbook.Worksheets[1].SaveToPdf(outputFile)
workbook.Dispose()

Cette approche s'avère particulièrement utile lorsque :
- Vous créez des résumés exécutifs à partir de rapports détaillés
- Vous extrayez des tableaux de données spécifiques pour des présentations
- Vous générez des vues ciblées de grands ensembles de données
- Vous partagez des portions sélectionnées sans révéler les feuilles de calcul complètes

Ajustement du contenu à la largeur de page

Les feuilles de calcul Excel s'étendent souvent sur plusieurs colonnes qui peuvent ne pas bien s'adapter aux tailles de page standard. Vous pouvez configurer la mise en page pour forcer le contenu à tenir dans des dimensions spécifiées :

Lorsque vos tableaux Excel comportent de nombreuses colonnes, il est crucial de configurer correctement l'aperçu avant impression. Sans ajustement approprié, certaines colonnes pourraient être coupées ou apparaître sur des pages séparées, rendant la lecture difficile. La propriété FitToPagesWide résout ce problème en compressant horizontalement le contenu :

from spire.xls import *
from spire.xls.common import *

inputFile = "donnees_etendues.xlsx"
outputFile = "rapport_ajuste.pdf"

workbook = Workbook()
workbook.LoadFromFile(inputFile)

# Configurer chaque feuille de calcul
for sheet in workbook.Worksheets:
    # Tenir sur une page de large (pas de limite d'échelle horizontale)
    sheet.PageSetup.FitToPagesWide = 1

    # Pas de limite verticale (autoriser plusieurs pages en hauteur)
    sheet.PageSetup.FitToPagesTall = 0

# Enregistrer avec la mise en page appliquée
workbook.SaveToFile(outputFile, FileFormat.PDF)
workbook.Dispose()

Les paramètres de mise en page fonctionnent comme suit :

  • FitToPagesWide = 1 : Force toutes les colonnes à tenir dans une seule largeur de page
  • FitToPagesTall = 0 : Autorise un nombre illimité de pages verticalement (pas d'échelle verticale)
  • FitToPagesTall = 1 : Forcerait la feuille entière sur une seule page

Cette configuration garantit que les feuilles de calcul larges restent lisibles sans défilement horizontal excessif ni tailles de police minuscules.

Exemple pratique : Système automatisé de distribution de rapports

En combinant ces techniques, vous pouvez construire un système automatisé de distribution de rapports :

Pour illustrer l'application concrète de ces concepts, imaginons un scénario où vous devez générer régulièrement des rapports départementaux à partir d'un classeur maître. Un tel système nécessite non seulement la conversion en PDF, mais aussi l'organisation des fichiers, le suivi des versions et la personnalisation selon les destinataires :

import os
from datetime import datetime
from spire.xls import *
from spire.xls.common import *

class DistributeurRapportsExcel:
    def __init__(self, racine_rapports="rapports"):
        self.racine_rapports = racine_rapports
        if not os.path.exists(racine_rapports):
            os.makedirs(racine_rapports)

    def generer_rapport_mensuel(self, fichier_excel, departement=None):
        """Générer un rapport PDF à partir d'un fichier Excel"""

        # Créer un sous-répertoire pour le département
        if departement:
            dossier_dept = os.path.join(self.racine_rapports, departement)
            if not os.path.exists(dossier_dept):
                os.makedirs(dossier_dept)
        else:
            dossier_dept = self.racine_rapports

        # Générer un nom de fichier avec horodatage
        horodatage = datetime.now().strftime("%Y%m_%H%M%S")
        nom_base = os.path.splitext(os.path.basename(fichier_excel))[0]
        nom_pdf = "{0}_{1}.pdf".format(nom_base, horodatage)
        chemin_pdf = os.path.join(dossier_dept, nom_pdf)

        # Effectuer la conversion
        workbook = Workbook()
        workbook.LoadFromFile(fichier_excel)

        # Optimiser pour la sortie PDF
        workbook.ConverterSetting.SheetFitToPage = True

        # Appliquer la mise en page à toutes les feuilles
        for sheet in workbook.Worksheets:
            sheet.PageSetup.FitToPagesWide = 1
            sheet.PageSetup.FitToPagesTall = 0

        workbook.SaveToFile(chemin_pdf, FileFormat.PDF)
        workbook.Dispose()

        return chemin_pdf

    def distribuer_feuilles_classeur(self, fichier_excel, dossier_sortie):
        """Extraire et enregistrer chaque feuille en PDF séparé"""

        if not os.path.exists(dossier_sortie):
            os.makedirs(dossier_sortie)

        workbook = Workbook()
        workbook.LoadFromFile(fichier_excel)

        fichiers_exportes = []
        for sheet in workbook.Worksheets:
            nom_pdf = sheet.Name + ".pdf"
            chemin_pdf = os.path.join(dossier_sortie, nom_pdf)

            sheet.SaveToPdf(chemin_pdf)
            fichiers_exportes.append(chemin_pdf)
            print("Feuille exportée : {0}".format(chemin_pdf))

        workbook.Dispose()
        return fichiers_exportes

# Exemple d'utilisation
distributeur = DistributeurRapportsExcel("rapports_mensuels")
rapport_pdf = distributeur.generer_rapport_mensuel(
    "donnees_ventes.xlsx", 
    departement="ventes"
)
print("Rapport généré : {0}".format(rapport_pdf))

Ce système de distribution offre :
- Une organisation par département
- Un suivi par horodatage pour le contrôle de version
- Une exportation flexible en fichier unique ou feuilles multiples
- Une optimisation automatique des pages

Problèmes courants et solutions

Problème 1 : Contenu coupé dans le PDF

Ajustez la mise en page pour adapter correctement le contenu :

sheet.PageSetup.FitToPagesWide = 1
sheet.PageSetup.FitToPagesTall = 0

Problème 2 : Mauvaise qualité d'impression

Assurez-vous d'activer les paramètres de haute qualité :

workbook.ConverterSetting.SheetFitToPage = True

Problème 3 : Erreurs dans les formules

Si vous copiez des plages, décidez s'il faut copier les formules ou les valeurs :

# Copier uniquement les valeurs (sans les formules)
range.Copy(target_range, False, True)

Problème 4 : Tailles de fichier importantes

Pour des besoins d'archivage où la taille compte, envisagez un PDF standard plutôt que PDF/A :

workbook.ConverterSetting.PdfConformanceLevel = PdfConformanceLevel.None

Résumé

La conversion de fichiers Excel en PDF constitue une compétence essentielle pour la génération automatique de rapports et la gestion documentaire. Tout au long de cet article, nous avons appris :

  1. Comment charger et convertir des fichiers Excel à l'aide de l'objet Workbook
  2. Créer des documents conformes PDF/A pour l'archivage à long terme
  3. Exporter des plages de cellules spécifiques pour des rapports ciblés
  4. Configurer la mise en page pour adapter le contenu de manière appropriée
  5. Construire des systèmes de conversion par lots pour une utilisation en production

Ces techniques s'appliquent directement à la reporting financier, à la génération automatique de factures, aux tableaux de bord d'intelligence économique et aux flux de travail de conformité réglementaire. Après avoir maîtrisé la conversion de base, vous pouvez explorer des fonctionnalités avancées telles que la protection par mot de passe, les signatures numériques et les filigranes personnalisés pour construire des solutions d'automatisation documentaire complètes.

  • # Spam ?

    Posté par  (site web personnel) . Évalué à 4 (+2/-0).

    Bonjour.

    Ce n'est pas clairement préciser : il s'agit d'un produit propriétaire et soumis à licence annuelle.

    Le ton du journal est très (trop) froid.

    Ça ressemble à du spam ciblé.

    • [^] # Re: Spam ?

      Posté par  (site web personnel) . Évalué à 3 (+0/-0).

      Incroyablement mal ciblée alors. Parce qu'ici, il reste quelques partisans des logiciels libre ou des formats ouverts qui peuvent modérément apprécier un discours qui commence par chanter les louanges d'un concurrent plus que médiocre à Libreoffice Calc sans même le mentionner, pour ensuite oublier de mentionner pandas…

      « IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace

Envoyer un commentaire

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.