1. Products
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Aspose.Note FOSS pentru Python

Citiți, parcurgeți și exportați fișierele Microsoft OneNote (.one) din Python — gratuit și open-source, fără a necesita Microsoft Office.

Bibliotecă Python open-source pentru fișiere OneNote

Aspose.Note FOSS pentru Python este o bibliotecă 100% gratuită, licențiată MIT, care vă permite să citiți fișiere Microsoft OneNote (.one) direct din Python, fără Microsoft Office, fără automatizare COM și fără a necesita un runtime proprietar. Expune un API public curat (aspose.note.*) modelat pe familiarul Aspose.Note pentru interfața .NET, susținut de un parser binar MS-ONE/OneStore încorporat, scris în pur Python.

Instalați de pe PyPI cu pip install aspose-note (sau pip install "aspose-note[pdf]" pentru a activa exportul PDF). Necesită Python 3.10 sau o versiune ulterioară.

Biblioteca este potrivită pentru scripturi de automatizare a documentelor, fluxuri de lucru de indexare a conținutului, instrumente de arhivare și orice flux de lucru pe server care trebuie să consume conținut OneNote fără o dependență de Microsoft Office.

Citiți și parcurgeți documentele OneNote

  • Încărcați fișiere .one: Deschideți orice secțiune OneNote dintr-o cale de fișier sau flux binar prin Document.
  • Parcurgere completă a DOM-ului: Navigați Document → Page → Outline → OutlineElement → RichText / Image / Table / AttachedFile.
  • Extracție de text îmbogățit: Citiți textul brut prin RichText.Text sau inspectați segmentele TextRun pentru îngroșare, italic, font, culoare și metadatele hyperlink-ului.
  • Analiză de tabel: Parcurgeți ierarhiile Table → TableRow → TableCell cu lățimile coloanelor și vizibilitatea bordurilor.
  • Inspectare etichetă: Citiți metadatele NoteTag (formă, etichetă, culoare, stare de finalizare) pe nodurile de text, imagine și tabel.

Unde poate fi utilizat Aspose.Note FOSS

  • Indexare conținut: Extrageți și indexați tot textul din arhivele OneNote pentru fluxurile de căutare.
  • Migrare document: Convertiți secțiunile OneNote în PDF, text simplu sau date structurate.
  • Instrumente de arhivare: Salvați imaginile și atașamentele încorporate pe disc din fișierele .one.
  • Fluxuri de lucru CI/CD: Validați sau procesați conținutul OneNote în interiorul containerelor Docker.
  • Conducte de bază de cunoștințe: Extrageți conținut structurat din caietele OneNote ale echipei.

Export, imagini și atașamente

  • Export PDF: Salvați orice Document încărcat în PDF utilizând Document.Save(path, SaveFormat.Pdf).
  • Opțiuni PDF: Personalizați intervalul de pagini, directorul de pictograme de etichetă, dimensiunea pictogramei și spațiul prin PdfSaveOptions.
  • Export imagine: Parcurgeți nodurile Image pentru a obține octeții brute, numele fișierului, dimensiunile și textul alternativ.
  • Salvare atașamente: Parcurgeți nodurile AttachedFile pentru a salva atașamentele de fișiere încorporate pe disc.
  • Încărcare bazată pe flux: Deschideți fișierele .one dintr-un flux binar (de ex., io.BytesIO) fără a scrie pe disc.

Experiența dezvoltatorului

Aspose.Note FOSS instalări cu o singură comandă pip install aspose-note. Pachetul de bază nu are dependențe opționale; exportul PDF necesită ReportLab, instalat prin pip install "aspose-note[pdf]".

API-ul este modelat pe familiarul Aspose.Note pentru interfața .NET: Document, Page, Outline, RichText, Image, Table, AttachedFile. Biblioteca este licențiată sub MIT, open-source, și acceptă rapoarte de erori și contribuții pe GitHub.

Încarcă un fișier OneNote și extrage tot textul

Instalați cu pip, apoi furnizați o cale de fișier către Document() pentru a analiza formatul binar OneNote. GetChildNodes(RichText) efectuează o căutare recursivă profundă și returnează fiecare nod de text din document, ceea ce este util pentru indexarea full‑text sau conductele de migrare.

pip install aspose-note
from aspose.note import Document, RichText

doc = Document("notebook.one")
print(f"Pages: {len(list(doc))}")

# Extrage tot textul din întregul document
texts = [rt.Text for rt in doc.GetChildNodes(RichText) if rt.Text]
for text in texts:
    print(text)

Exportă în PDF și salvează imaginile atașate

Exportul PDF necesită dependența opțională ReportLab. Instalați‑o cu pip install "aspose-note[pdf]". Același obiect Document poate fi iterat și pentru nodurile Image pentru a extrage și salva toate imaginile încorporate pe disc într-un singur pas.

from aspose.note import Document, SaveFormat, Image
import pathlib

doc = Document("notebook.one")

# Exportă documentul în PDF (necesită aspose-note[pdf])
doc.Save("output.pdf", SaveFormat.Pdf)

# Salvează toate imaginile încorporate pe disc
out_dir = pathlib.Path("images")
out_dir.mkdir(exist_ok=True)
for i, img in enumerate(doc.GetChildNodes(Image)):
    name = img.FileName or f"image_{i}.bin"
    (out_dir / name).write_bytes(img.Bytes)

Frequently Asked Questions

Ce este Aspose.Note FOSS pentru Python?

Este o bibliotecă gratuită, licențiată MIT Python, pentru citirea fișierelor Microsoft OneNote (.one) fără a necesita Microsoft Office, automatizare COM sau orice runtime proprietar.

Ce variante de format OneNote sunt suportate?

Variantele de format OneNote 2010, OneNote Online și OneNote 2007. Orice fișier de secțiune .one valid poate fi încărcat.

Cum îl instalez?

Rulați pip install aspose-note pentru biblioteca de bază sau pip install "aspose-note[pdf]" pentru a include dependența opțională ReportLab pentru exportul PDF.

Pot exporta fișierele OneNote în PDF?

Da. Apelați Document.Save(path, SaveFormat.Pdf). Exportul PDF necesită dependența opțională ReportLab instalată prin extra-ul [pdf].

Pot încărca fișiere .one dintr-un flux?

Da. Clasa Document acceptă un flux binar (de ex., io.BytesIO sau corpul unui răspuns HTTP) astfel încât să puteți procesa fișierele fără a le scrie pe disc.

Ce versiune Python este necesară?

Python 3.10 sau o versiune ulterioară este necesară.

Pot să scriu sau să modific un fișier .one?

Nu. Ediția curentă este doar în citire. Poate deschide și analiza orice fișier de secțiune .one valid, dar scrierea înapoi în formatul binar OneNote nu este suportată.

Sunt documentele OneNote criptate suportate?

Nu. Încărcarea unui fișier .one protejat prin parolă declanșează o IncorrectPasswordException. Documentele criptate nu sunt suportate în ediția curentă.

Unde pot găsi codul sursă?

Biblioteca este licențiată sub MIT și găzduită pe GitHub. Raportările de erori și cererile de pull sunt binevenite.

  

Support and Learning Resources

 Română