1. Produkty
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Aspose.Note FOSS pro Python

Číst, procházet a exportovat soubory Microsoft OneNote (.one) z Pythonu – zdarma a s otevřeným zdrojovým kódem, není třeba Microsoft Office.

Open-source knihovna Python pro soubory OneNotu

Aspose.Note FOSS pro Python je 100 % zdarma, MIT licencovaná knihovna, která vám umožní číst soubory Microsoft OneNote (.one) kompletně z Python, bez Microsoft Office, bez COM automatizace a bez nutnosti proprietárního runtime. Poskytuje čisté veřejné API (aspose.note.*) modelované podle známého rozhraní Aspose.Note pro .NET, podpořené vestavěným binárním parserem MS-ONE/OneStore napsaným v čistém Python.

Nainstalujte z PyPI pomocí pip install aspose-note (nebo pip install "aspose-note[pdf]" pro povolení exportu do PDF). Vyžaduje Python 3.10 nebo novější.

Knihovna je vhodná pro skripty automatizace dokumentů, pipeline pro indexaci obsahu, archivní nástroje i jakýkoli server‑side workflow, který potřebuje zpracovávat obsah OneNote bez závislosti na Microsoft Office.

Čtení a procházení dokumentů OneNotu

  • **Uložte soubory .one: ** Otevřete jakoukoli část OneNotu z cesty souboru nebo binárního proudu pomocí „Dokument“.
  • Plná domová přepážka: Navigujte Dokument → Stránka → Obrazový prvek → Obsahový prvek → Obrazový text / Tabulka / Přiložený soubor.
  • Extrakce bohatého textu: Čtěte surový text prostřednictvím ‚RichText.Text‘ nebo zkontrolujte segmenty ‚TextRun‘ pro bold, italic, font, barva a hypertextové metadata.
  • Partování tabulek: Přes hierarchie Tabulka → Tabulka → Tabulka s šířkami sloupců a viditelností hranic.
  • ** Kontrola značek: ** Přečtěte si metadata „NoteTag“ (tvar, štítek, barva, stav dokončení) na textových, obrázkových a tabulkových uzlech.

Kde lze Aspose.Note FOSS použít

  • ** Indexování obsahu: ** Vyjmutí a indexování veškerého textu z archivů OneNotu pro vyhledávací kanály.
  • **Migrace dokumentů: ** Převést části OneNotu na PDF, jednoduchý text nebo strukturovaná data.
  • Archivní nástroje: Uložit vložené obrázky a přílohy na disk z souborů .one.
  • ** Pracovní postupy CI/CD: ** Ověřte nebo zpracujte obsah OneNotu v kontejnerech Docker.
  • **Pipelíny znalostní báze: ** Zpracujte strukturovaný obsah ze zápisníků OneNotu pro týmy.

Export, obrázky a přílohy

  • **Export PDF: ** Uložit uložený dokument do PDF pomocí dokumentu.Save(path, SaveFormat.Pdf)`.
  • ** Možnosti PDF: ** Přizpůsobte rozsah stránek, adresář ikon značky, velikost ikon a mezeru prostřednictvím ‘PdfSaveOptions’.
  • **Image export: **Iterujte uzly Image pro získání surových bajtů, názvu souboru, rozměrů a alt textu.
  • ** Uložení příloh: ** Iterujte uzly ‚AttracedFile‘ pro uložení vložených příloh souborů na disk.
  • ** Stream-based loading: ** Otevřete soubory .one z binárního toku (např. iO.BytesIO) bez psaní na disk.

Zkušenost vývojářů

Aspose.Note FOSS instaluje pomocí jediného příkazu pip install aspose-note. Základní balíček nemá žádné volitelné závislosti; PDF export vyžaduje ReportLab, nainstalovaný prostřednictvím `pip install ‘aspose-note[pdf]’.

API je modelováno na známém rozhraní Aspose.Note pro .NET: „Document“, „Page“, „Outline“, „RichText“, „Image“, „Table“, „AttachedFile“. Knihovna je licencována MIT, je open-source a přijímá zprávy o chybách a příspěvky na GitHub.

Stahování souboru OneNote a extrahování celého textu

Instalace pomocí pipu, poté přejděte na cestu souboru do dokumentu (Dokument) pro analýzu binárního formátu OneNotu. „GetChildNodes(RichText)“ provádí hluboké recursivní vyhledávání a vrací každý textový uzel v dokumentu, což je užitečné pro indexování celého textu nebo migrační potrubí.

„Bash PIP instalace aspose-note „“

„Python“ z aspose.note import Dokument, RichText

doc = dokument (dále jen „notebook.one“) Stránky: {len(list(doc))} »

Extrahujte celý text v celém dokumentu

text = [rt.Text pro rt v doc.GetChildNodes(RichText) v případě rt.Text] Pro text v textech: Tiskové (textové) „“

Export do PDF a uložení připojených obrázků

Export PDF vyžaduje volitelnou závislost ReportLab. Nainstalujte ji pomocí “pip install” “aspose-note[pdf]".Tento samý objekt “Dokument” lze také iterovat pro uzly “Image” pro extrahování a uložení všech vložených obrázků na disk v jednom průchodu.

„Python“ z aspose.note import Dokument, SaveFormat, Obrázek Vývoz patelbu

doc = dokument (dále jen „notebook.one“)

Export dokumentu do formátu PDF (vyžaduje připomenutí [pdf])

doc.Save(“output.pdf”, SaveFormat.Pdf)

Uložit všechny vložené obrázky na disk

out_dir = pathlib.Path (dále jen „obrazy“) out_dir.mkdir(exist_ok=True) je to pravda pro i, img in enumerate(doc.GetChildNodes(Image)): jméno = img.FileName nebo f"image_{i}.bin” (vytvořeno z textů) Write_byte (vytvořeno z textů) „“

Často kladené dotazy

Co je Aspose.Note FOSS pro Python?

Je to zdarma, MIT licencované Python knihovna pro čtení souborů Microsoft OneNote (.one) bez nutnosti Microsoft Office, COM automatizace, nebo jakékoliv vlastní běh.

Jaké varianty formátu OneNotu jsou podporovány?

OneNote 2010, OneNote Online a OneNote 2007 formátové varianty. Můžete nahrát všechny platné soubory sekce .one.

Jak ho nainstalovat?

Spusťte “pip install aspose-note” pro základní knihovnu nebo “pip install “aspose-note[pdf]”” pro zahrnutí volitelné závislosti ReportLab pro export PDF.

Mohu exportovat soubory OneNotu do PDF?

Ano. volejte „Document.Save(path, SaveFormat.Pdf)“. PDF export vyžaduje volitelnou závislost ReportLab nainstalovanou prostřednictvím doplňku „[pdf]“.

Mohu si stáhnout soubory .one z proudu?

Třída „Dokument“ přijímá binární tok (např. „io.BytesIO“ nebo odpovědní těleso HTTP), takže můžete zpracovávat soubory bez psaní na disk.

Jakou verzi Pythonu potřebujeme?

Vyžaduje se Python 3.10 nebo novější.

Mohu psát nebo upravovat soubor .one?

Aktuální verze je pouze pro čtení. Může otevřít a vyhodnotit všechny platné soubory sekce .one, ale nepodporuje se psaní zpět do binárního formátu OneNotu.

Jsou podporovány šifrované dokumenty OneNotu?

Ne. Stahování souboru .one chráněného heslem vyvolá „IncorrectPasswordException“. šifrované dokumenty nejsou v aktuální verzi podporovány.

Kde najdu zdrojový kód?

Knihovna je licencována MIT a hostována na GitHub. Bug zprávy a požadavky na stahování jsou vítány.

  

Podpora a vzdělávací materiály

 Čeština