1. Produits
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Avis sur le fichier FOSS pour Python

Lisez, parcourez et exportez des fichiers Microsoft OneNote (.one) à partir de Python – gratuit et open source, sans besoin de Microsoft Office.

Bibliothèque Python open source pour les fichiers OneNote

Aspose.Note FOSS pour Python est une bibliothèque 100 % gratuite, sous licence MIT, qui vous permet de lire les fichiers Microsoft OneNote (.one) entièrement depuis Python, sans Microsoft Office, sans automatisation COM et sans runtime propriétaire requis. Elle expose une API publique propre (aspose.note.*) modelée sur l’interface familière Aspose.Note pour .NET, soutenue par un analyseur binaire MS-ONE/OneStore intégré écrit en pur Python.

Installez depuis PyPI avec pip install aspose-note (ou pip install "aspose-note[pdf]" pour activer l’export PDF). Nécessite Python 3.10 ou ultérieur.

La bibliothèque convient aux scripts d’automatisation de documents, aux pipelines d’indexation de contenu, aux outils d’archivage, et à tout flux de travail côté serveur qui doit consommer du contenu OneNote sans dépendance à Microsoft Office.

Lire et parcourir les documents OneNote

  • **Pour charger des fichiers .one : **Ouvrez toute section OneNote à partir d’un chemin de fichier ou d’un flux binaire via ‘Document’.
  • **Poursuivre le DOM complet : ** Naviguer vers ‘Document → Page → Outline → OutlineElement → RichText / Image / Table / Fichier joint’.
  • ** Extraction de texte riche : ** Lire le texte brut via ‘RichText.Text’ ou inspecter les segments ‘TextRun’ pour les métadonnées bold, italic, font, couleur et hyperlien.
  • **Parsing de table: ** Traverse les hiérarchies de tableau → tableau → tableauCell avec des largeurs de colonne et une visibilité de limite.
  • **Vérification des balises : **Lire les métadonnées de « NoteTag » (forme, étiquette, couleur, état de finition) sur les nœuds de texte, d’image et de table.

Où Aspose.Note FOSS peut être utilisé

  • ** Indexage du contenu : ** Extrait et indexation de tout le texte des archives OneNote pour les pipelines de recherche.
  • ** Migration de document : Convertir les sections OneNote en PDF, texte simple ou données structurées.
  • ** Outils d’archivage : ** Enregistrer les images et les pièces jointes intégrées sur disque à partir des fichiers .one.
  • **Flux de travail CI/CD : ** Valider ou traiter le contenu OneNote dans les conteneurs Docker.
  • **Pipelines de base de connaissances: ** Extrait du contenu structuré à partir des blocs-notes OneNote de l’équipe.

Exportation, images et pièces jointes

  • **Exportation PDF : ** Enregistrez tout document téléchargé en PDF en utilisant le format « Document.Save(path, SaveFormat.Pdf) ».
  • **Options PDF: **Customiser la gamme de pages, le répertoire des icônes de balises, la taille des icônes et l’écart via ‘PdfSaveOptions’.
  • **Image export: ** Itérer les nœuds ‘Image’ pour récupérer les octets bruts, le nom de fichier, les dimensions et le texte alt.
  • ** Sauvegarde d’attachement : ** Itérer les nœuds ‘AccédéFile’ pour enregistrer les pièces jointes de fichiers embarqués sur le disque.
  • **Pour le chargement en flux : **Ouvrez les fichiers .one à partir d’un flux binaire (par exemple, .io.BytesIO) sans écrire sur le disque.

Expérience développeur

Aspose.Note FOSS installe avec une seule commande pip install aspose-note. Le paquet de base n’a pas de dépendances facultatives; l’exportation de PDF nécessite ReportLab, installé via `pip install ‘aspose-note[pdf]’.

L’API est modélisée sur l’interface familière Aspose.Note pour .NET : « Document », « Page », « Outline », « RichText », « Image », « Table », « AttachedFile ».

Télécharger un fichier OneNote et extraire tout le texte

Installez avec pip, puis passez un chemin de fichier à ‘Document()’ pour analyser le format binaire OneNote. ‘GetChildNodes(RichText)’ effectue une recherche récurrente profonde et renvoie chaque nœud texte dans le document, ce qui est utile pour l’indexation de texte complet ou les pipelines de migration.

« Bach pip install aspose-note pour les « »

« Python de aspose.note import Document, RichText

Doc = Document (« notebook.one ») Les pages suivantes sont : {len(list(doc))}

Extrait de tout le texte dans l’ensemble du document

textes = [rt.Text pour rt dans doc.GetChildNodes(RichText) si rt.Text] Pour les textes : Le texte (texte) « »

Exporter en PDF et enregistrer les images jointes

L’exportation de PDF nécessite la dépendance ReportLab facultative. Installez-la avec le « pip install » « aspose-note[pdf] » ». Le même objet « Document » peut également être itéré pour les nœuds « Image » pour extraire et enregistrer toutes les images intégrées sur le disque en un seul passage.

« Python de aspose.note Importation de Document, SaveFormat, Image Importation de patchwork

Doc = Document (« notebook.one »)

Exporter le document en PDF (requiert une note de mise en page[pdf])

Doc.Save (« output.pdf », SaveFormat.Pdf)

Enregistrer toutes les images intégrées sur disque

out_dir = pathlib.Path(« images ») out_dir.mkdir(existe_oui=Véritable) pour i, img en enumérate(doc.GetChildNodes(Image)): Nom de fichier ou f"image_{i}.bin" (out_dir / nom).écrire des bytes(img.Bytes) « »

Foire aux questions

Qu’est-ce que Aspose.Note FOSS pour Python?

C’est une bibliothèque Python gratuite, sous licence MIT, pour lire les fichiers Microsoft OneNote (.one) sans nécessiter Microsoft Office, l’automatisation COM ou tout temps d’exécution propriétaire.

Quelles variantes de format OneNote sont prises en charge?

OneNote 2010, OneNote Online et OneNote 2007 sont des variantes du format. Tout fichier de section valide.

Comment l’installer ?

Exécutez « pip install aspose-note » pour la bibliothèque de base, ou « pip install « aspose-note[pdf] » pour inclure la dépendance ReportLab facultative pour l’exportation de PDF.

Puis-je exporter des fichiers OneNote en PDF?

Oui. Appelez « Document.Save(path, SaveFormat.Pdf)». L’exportation PDF nécessite la dépendance optionnelle ReportLab installée via l’extra «[pdf]».

Puis-je télécharger des fichiers .one à partir d’un flux?

Oui.La classe « Document » accepte un flux binaire (par exemple, « iobytesIO » ou un corps de réponse HTTP) afin que vous puissiez traiter des fichiers sans écrire sur le disque.

Quelle version de Python est requise ?

Python 3.10 ou plus récent est requis.

Puis-je écrire ou modifier un fichier .one?

Non. L’édition actuelle est uniquement lisible. Il peut ouvrir et analyser tout fichier de section valide .one, mais l’écriture de retour au format binaire OneNote n’est pas prise en charge.

Les documents OneNote cryptés sont-ils pris en charge?

Non. Le chargement d’un fichier .one protégé par mot de passe émet une mention “IncorrectPasswordException”.

Où puis‑je trouver le code source ?

La bibliothèque est sous licence MIT et hébergée sur GitHub. Les rapports de bugs et les demandes de tirage sont les bienvenus.

  

Ressources de support et d'apprentissage

 Français