1. Products
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Aspose.Note FOSS pre Python

Čítajte, prechádzajte a exportujte Microsoft OneNote (.one) súbory z Python — bezplatne a open-source, nie je potrebný Microsoft Office.

Open-Source Python knižnica pre OneNote súbory

Aspose.Note FOSS pre Python je 100 % bezplatná knižnica pod licenciou MIT, ktorá vám umožní čítať súbory Microsoft OneNote (.one) úplne z Python, bez potreby Microsoft Office, COM automatizácie ani proprietárneho runtime. Poskytuje čisté verejné API (aspose.note.*) modelované na známy Aspose.Note pre .NET rozhraní, podporované vstavaným binárnym parserom MS-ONE/OneStore napísaným v čistom Python.

Inštalujte z PyPI pomocou pip install aspose-note (alebo pip install "aspose-note[pdf]" pre povolenie exportu do PDF). Vyžaduje Python 3.10 alebo novší.

Knižnica je vhodná pre skripty automatizácie dokumentov, pipeline indexovania obsahu, archivné nástroje a akýkoľvek server‑side pracovný tok, ktorý potrebuje spracovávať obsah OneNote bez závislosti na Microsoft Office.

Čítajte a prechádzajte OneNote dokumenty

  • Načítanie .one súborov: Otvorte akúkoľvek sekciu OneNote z cesty k súboru alebo binárneho streamu pomocou Document.
  • Plné prechádzanie DOM: Navigujte Document → Page → Outline → OutlineElement → RichText / Image / Table / AttachedFile.
  • Extrahovanie formátovaného textu: Prečítajte surový text pomocou RichText.Text alebo skontrolujte segmenty TextRun pre tučné, kurzívu, písmo, farbu a metadáta hyperodkazov.
  • Parsovanie tabuliek: Prechádzajte hierarchiami Table → TableRow → TableCell s šírkami stĺpcov a viditeľnosťou okrajov.
  • Kontrola značiek: Prečítajte metadáta NoteTag (tvar, popis, farba, stav dokončenia) na uzloch textu, obrázku a tabuľky.

Kde sa dá Aspose.Note FOSS použiť

  • Content indexing: Extrahujte a indexujte celý text z archívov OneNote pre vyhľadávacie pipeline.
  • Document migration: Konvertujte sekcie OneNote do PDF, obyčajného textu alebo štruktúrovaných dát.
  • Archival tools: Uložte vložené obrázky a prílohy na disk zo súborov .one.
  • CI/CD pracovné postupy: Overovať alebo spracovávať obsah OneNote v Docker kontajneroch.
  • Rúrky pre znalostnú bázu: Extrahovať štruktúrovaný obsah z tímových OneNote poznámkových blokov.

Export, obrázky a prílohy

  • PDF export: Uložte akýkoľvek načítaný Document do PDF pomocou Document.Save(path, SaveFormat.Pdf).
  • PDF options: Prispôsobte rozsah stránok, adresár ikon značiek, veľkosť ikony a medzeru pomocou PdfSaveOptions.
  • Image export: Prejdite Image uzly a získajte surové bajty, názov súboru, rozmery a alternatívny text.
  • Attachment saving: Prejdite AttachedFile uzly a uložte vložené prílohy súborov na disk.
  • Stream-based loading: Otvorte súbory .one z binárneho prúdu (napr. io.BytesIO) bez zápisu na disk.

Skúsenosti vývojára

Aspose.Note FOSS inštalácie s jediným príkazom pip install aspose-note. Základný balík nemá žiadne voliteľné závislosti; export do PDF vyžaduje ReportLab, ktorý sa nainštaluje pomocou pip install "aspose-note[pdf]".

API je navrhnuté podľa známeho Aspose.Note pre rozhranie .NET: Document, Page, Outline, RichText, Image, Table, AttachedFile. Knižnica je licencovaná pod MIT, je open-source a prijíma hlásenia chýb a príspevky na GitHub.

Načítajte súbor OneNote a extrahujte celý text

Nainštalujte pomocou pip, potom odovzdajte cestu k súboru do Document(), aby ste analyzovali binárny formát OneNote. GetChildNodes(RichText) vykoná hlboké rekurzívne vyhľadávanie a vráti každý textový uzol v dokumente, čo je užitočné pre full‑textové indexovanie alebo migračné rúrky.

pip install aspose-note
from aspose.note import Document, RichText

doc = Document("notebook.one")
print(f"Strany: {len(list(doc))}")

# Extrahovať všetok text v celom dokumente
texts = [rt.Text for rt in doc.GetChildNodes(RichText) if rt.Text]
for text in texts:
    print(text)

Exportujte do PDF a uložte pripojené obrázky

Export do PDF vyžaduje voliteľnú závislosť ReportLab. Nainštalujte ju pomocou pip install "aspose-note[pdf]". Ten istý objekt Document je možné tiež iterovať cez uzly Image a tak extrahovať a uložiť všetky vložené obrázky na disk v jednom prechode.

from aspose.note import Document, SaveFormat, Image
import pathlib

doc = Document("notebook.one")

# Export dokumentu do PDF (vyžaduje aspose-note[pdf])
doc.Save("output.pdf", SaveFormat.Pdf)

# Uložiť všetky vložené obrázky na disk
out_dir = pathlib.Path("images")
out_dir.mkdir(exist_ok=True)
for i, img in enumerate(doc.GetChildNodes(Image)):
    name = img.FileName or f"image_{i}.bin"
    (out_dir / name).write_bytes(img.Bytes)

Frequently Asked Questions

Čo je Aspose.Note FOSS pre Python?

Je to bezplatná, pod licenciou MIT Python knižnica na čítanie súborov Microsoft OneNote (.one) bez potreby Microsoft Office, COM automatizácie alebo akéhokoľvek proprietárneho runtime.

Ktoré varianty formátu OneNote sú podporované?

Varianty formátu OneNote 2010, OneNote Online a OneNote 2007. Akýkoľvek platný .one sekčný súbor je možné načítať.

Ako ho nainštalovať?

Spustite pip install aspose-note pre základnú knižnicu, alebo pip install "aspose-note[pdf]" pre zahrnutie voliteľnej závislosti ReportLab pre export do PDF.

Môžem exportovať súbory OneNote do PDF?

Áno. Zavolajte Document.Save(path, SaveFormat.Pdf). Export do PDF vyžaduje nainštalovanú voliteľnú závislosť ReportLab prostredníctvom extra [pdf].

Môžem načítať .one súbory zo streamu?

Áno. Trieda Document akceptuje binárny prúd (napr. io.BytesIO alebo telo HTTP odpovede), takže môžete spracovávať súbory bez zápisu na disk.

Aká verzia Python je požadovaná?

Python 3.10 alebo novší je vyžadovaný.

Môžem zapisovať alebo upravovať súbor .one?

Nie. Aktuálna edícia je len na čítanie. Dokáže otvoriť a analyzovať akýkoľvek platný .one sekčný súbor, ale zápis späť do binárneho formátu OneNote nie je podporovaný.

Sú podporované šifrované dokumenty OneNote?

Nie. Načítanie .one súboru chráneného heslom vyvolá IncorrectPasswordException. Šifrované dokumenty nie sú v aktuálnej edícii podporované.

Kde môžem nájsť zdrojový kód?

Knižnica je licencovaná pod licenciou MIT a je hostovaná na GitHub. Správy o chybách a pull requesty sú vítané.

  

Support and Learning Resources

 Slovenčina