1. Produkte
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Aspose.Note FOSS für Python

Lesen, durchqueren und exportieren Sie Microsoft OneNote (.one) Dateien aus Python - kostenlos und Open-Source, keine Microsoft Office erforderlich.

Open-Source-Python-Bibliothek für OneNote-Dateien

Aspose.Note FOSS for Python ist eine 100 % kostenlose, MIT-lizenzierte Bibliothek, die es Ihnen ermöglicht, Microsoft OneNote (.one)-Dateien vollständig aus Python zu lesen, ohne Microsoft Office, ohne COM‑Automatisierung und ohne proprietäre Laufzeit. Sie stellt eine saubere öffentliche API (aspose.note.*) bereit, die an die bekannte Aspose.Note für .NET-Schnittstelle angelehnt ist, unterstützt von einem eingebauten MS-ONE/OneStore‑Binärparser, geschrieben in reinem Python.

Installation von PyPI mit pip install aspose-note (oder pip install "aspose-note[pdf]", um den PDF‑Export zu aktivieren). Benötigt Python 3.10 oder höher.

Die Bibliothek eignet sich für Dokumenten‑Automatisierungsskripte, Content‑Indexierungspipelines, Archivierungswerkzeuge und jede serverseitige Arbeitsablauf, die OneNote‑Inhalte verarbeiten muss, ohne von Microsoft Office abhängig zu sein.

Lesen und Durchsuchen von OneNote-Dokumenten

  • **Laden Sie .one-Dateien: ** Öffnen Sie jeden OneNote-Abschnitt aus einem Dateiweg oder einem binären Stream über “Dokument”.
  • Full DOM traversal: Navigieren Sie nach Dokument → Seite → Ausrichtung → OutlineElement → RichText / Bild / Tabelle / Anhängerdatei.
  • ** Rich Text Extraktion: ** Lesen Sie Rohtext über ‘RichText.Text’ oder überprüfen Sie die Segmente ‘TextRun’ für bold, italic, Schriftart, Farbe und Hyperlink-Metadaten.
  • **Tabellen-Pässe: ** Durch die Hierarchien von Tabelle → Tabellrohr → Tabellzelle mit Spaltenbreiten und Grenzsicht.
  • **Tag-Kontrolle: ** Lesen Sie die Metadaten von NoteTag (Form, Etikette, Farbe, Fertigstellung) auf Text, Bild und Tabellenknoten.

Wo Aspose.Note FOSS verwendet werden kann

  • **Indexierung von Inhalten: **Extraktion und Indexierung aller Texte aus OneNote-Archiven für Suchrohrleitungen.
  • **Dokumentmigration: ** Konvertieren von OneNote-Abschnitten in PDF, einfacher Text oder strukturierte Daten.
  • ** Archivierungswerkzeuge: ** Speichern Sie eingebettete Bilder und Anhänge auf der Festplatte aus .one-Dateien.
  • ** CI/CD-Workflows: ** Validieren oder verarbeiten Sie OneNote-Inhalte in Docker-Container.
  • **Wissensbasierte Pipelines: ** Strukturierte Inhalte aus OneNote-Notizen für Teams extrahieren.

Export, Bilder und Anhänge

  • **PDF-Export: ** Speichern Sie jedes geladene ‘Dokument’ in PDF mit ‘Document.Save(path, SaveFormat.Pdf)’
  • **PDF-Optionen: ** Anpassen Sie die Seitenbereiche, das Tag-Icon-Verzeichnis, die Icon-Größe und die Lücke über ‘PdfSaveOptions’.
  • **Image Export: ** Iterate Image Knoten, um Rohbytes, Dateinamen, Dimensionen und Alt-Text abzurufen.
  • **Add-On-Speicherung: ** Iterieren Sie die Knoten “Add-on-Datei”, um eingebettete Dateianhänge auf der Festplatte zu speichern.
  • ** Stream-basiertes Laden: ** Öffnen Sie .one-Dateien aus einem binären Stream (z. B. `io.BytesIO’) ohne auf die Festplatte zu schreiben.

Entwicklererfahrung

Aspose.Note FOSS installiert mit einem einzigen Befehl pip install aspose-note. Das Basispaket hat keine optionalen Abhängigkeiten; PDF-Export erfordert ReportLab, installiert über `pip install ‘aspose-note[pdf]’’.

Die API ist auf der vertrauten Aspose.Note für .NET-Schnittstelle modelliert: ‘Document’, ‘Page’, ‘Outline’, ‘RichText’, ‘Image’, ‘Table’, ‘AttachedFile’.Die Bibliothek ist MIT-lizenziert, Open-Source und akzeptiert Bug-Berichte und Beiträge auf GitHub.

Laden Sie eine OneNote-Datei hoch und extrahieren Sie den gesamten Text

Installieren Sie mit pip, und geben Sie dann einen Dateiweg zu Document(), um das OneNote-Binärformat zu analysieren. GetChildNodes(RichText) führt eine tiefe, recursive Suche durch und gibt jeden Textknoten im Dokument zurück, was für die Volltext-Indexierung oder Migrationspipelines nützlich ist.

» » Bach Pip installieren aspose-note » »

» Python von aspose.note Import Dokument, RichText

doc = Dokument („notebook.one“) Print(f"Seiten: {len(list(doc))}")

Alle Texte über das gesamte Dokument hinweg extrahieren

Text = [rt.Text für rt in doc.GetChildNodes(RichText) in rt.Text] Für Text in Texten: Der Text (Text) » »

Exportieren in PDF und Speichern von angehängten Bildern

PDF-Export erfordert die optionale ReportLab-Abhängigkeit. Installieren Sie es mit pip install "aspose-note[pdf]". Das gleiche Dokument'-Objekt kann auch für Image’-Knoten iteriert werden, um alle eingebetteten Bilder in einem einzigen Pass auf die Festplatte zu extrahieren und zu speichern.

» Python von aspose.note Import Dokument, SaveFormat, Bild Patch im Import

doc = Dokument („notebook.one“)

Exportieren Sie das Dokument in PDF (erfordert eine Ablage-Note[pdf])

doc.Save(“output.pdf”, SaveFormat.Pdf)

Alle eingebetteten Bilder auf der Festplatte speichern

out_dir = pathlib.Path (”Bilder”) aus_di.mkdir(exist_ok=True) für i, img in enumerate(doc.GetChildNodes(Image)): Name = img.FileName oder f"image_{i}.bin" (out_dir / name).Write_byte (img.Bytes) » »

Häufig gestellte Fragen

Was ist Aspose.Note FOSS für Python?

Es ist eine kostenlose, MIT-lizenzierte Python-Bibliothek zum Lesen von Microsoft OneNote (.one) Dateien ohne Microsoft Office, COM Automation oder eine proprietäre Laufzeit.

Welche OneNote-Formatvarianten werden unterstützt?

OneNote 2010, OneNote Online und OneNote 2007 Formatvarianten. Jede gültige Abschnittdatei kann geladen werden.

Wie installiere ich es?

Führen Sie “pip install aspose-note” für die Basiskirche aus oder “pip install “aspose-note[pdf]” aus, um die optionale ReportLab-Abhängigkeit für den PDF-Export aufzunehmen.

Kann ich OneNote-Dateien in PDF exportieren?

Ja. Rufen Sie ‘Document.Save(path, SaveFormat.Pdf)`. PDF-Export erfordert die optionale ReportLab-Abhängigkeit, die über das ‘[pdf]’-Extra installiert ist.

Kann ich .one Dateien aus einem Stream laden?

Die Klasse “Dokument” akzeptiert einen binären Stream (z. B. “io.BytesIO” oder einen HTTP-Antwortkörper), sodass Sie Dateien verarbeiten können, ohne auf die Festplatte zu schreiben.

Welche Python-Version ist erforderlich?

Python 3.10 oder höher ist erforderlich.

Kann ich eine .one-Datei schreiben oder ändern?

Die aktuelle Version ist nur zum Lesen verfügbar. Sie kann jede gültige Abschnittdatei öffnen und analysieren, aber das Schreiben zurück zum OneNote-Binärformat wird nicht unterstützt.

Werden verschlüsselte OneNote-Dokumente unterstützt?

Das Laden einer passwortgeschützten .one-Datei erhebt eine “IncorrectPasswordException”. verschlüsselte Dokumente werden in der aktuellen Ausgabe nicht unterstützt.

Wo finde ich den Quellcode?

Die Bibliothek ist MIT-lizenziert und auf GitHub gehostet. Bug-Berichte und Pull-Anfragen sind willkommen.

  

Support und Lernressourcen

 Deutsch