1. Products
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Aspose.Note FOSS za Python

Čitajte, pretražujte i izvozite Microsoft OneNote (.one) fajlove iz Python — besplatno i open-source, bez Microsoft Office-a.

Open-Source Python biblioteka za OneNote fajlove

Aspose.Note FOSS za Python je 100% besplatna, MIT-licencirana biblioteka koja vam omogućava da čitate Microsoft OneNote (.one) fajlove u potpunosti iz Python, bez Microsoft Office-a, bez COM automatizacije i bez potrebe za vlasničkim runtime-om. Izlaže čist javni API (aspose.note.*) modelovan po poznatom Aspose.Note za .NET interfejsu, podržan ugrađenim MS-ONE/OneStore binarnim parserom napisanom u čistom Python.

Instalirajte sa PyPI koristeći pip install aspose-note (ili pip install "aspose-note[pdf]" da omogućite PDF izvoz). Zahteva Python 3.10 ili noviji.

Biblioteka je pogodna za skripte za automatizaciju dokumenata, pipeline‑e za indeksiranje sadržaja, alate za arhiviranje i bilo koji server‑side radni tok koji treba da konzumira OneNote sadržaj bez zavisnosti od Microsoft Office-a.

Čitajte i pretražujte OneNote dokumente

  • Učitajte .one fajlove: Otvorite bilo koju OneNote sekciju iz putanje fajla ili binarnog toka putem Document.
  • Potpuno prelaženje DOM‑a: Navigirajte kroz Document → Page → Outline → OutlineElement → RichText / Image / Table / AttachedFile.
  • Ekstrakcija formatiranog teksta: Pročitajte sirovi tekst putem RichText.Text ili pregledajte segmente TextRun za podebljano, kurziv, font, boju i metapodatke hiperveza.
  • Parsiranje tabela: Prođite kroz hijerarhije Table → TableRow → TableCell sa širinama kolona i vidljivošću ivica.
  • Inspekcija tagova: Pročitajte metapodatke NoteTag (oblik, oznaka, boja, stanje završetka) na čvorovima teksta, slike i tabele.

Gde se Aspose.Note FOSS može koristiti

  • Indeksiranje sadržaja: Ekstrahujte i indeksirajte sav tekst iz OneNote arhiva za pretraživačke pipeline‑ove.
  • Migracija dokumenata: Konvertujte OneNote sekcije u PDF, običan tekst ili strukturirane podatke.
  • Alati za arhiviranje: Sačuvajte ugrađene slike i priloge na disk iz .one fajlova.
  • CI/CD radni tokovi: Validirajte ili obrađujte OneNote sadržaj unutar Docker kontejnera.
  • Pipelines za bazu znanja: Ekstrahujte strukturirani sadržaj iz timskih OneNote beležnica.

Izvoz, slike i prilozi

  • PDF izvoz: Sačuvajte bilo koji učitani Document u PDF koristeći Document.Save(path, SaveFormat.Pdf).
  • PDF opcije: Prilagodite opseg stranica, direktorijum ikona oznaka, veličinu ikone i razmak putem PdfSaveOptions.
  • Izvoz slika: Prođite kroz Image čvorove da biste dobili sirove bajtove, ime fajla, dimenzije i alt tekst.
  • Čuvanje priloga: Prođite kroz AttachedFile čvorove da biste sačuvali ugrađene fajl priloge na disk.
  • Učitavanje putem stream-a: Otvorite .one fajlove iz binarnog stream-a (npr. io.BytesIO) bez upisivanja na disk.

Iskustvo programera

Aspose.Note FOSS instalacije jednim pip install aspose-note komandama. Osnovni paket nema opcionalne zavisnosti; PDF izvoz zahteva ReportLab, instaliran putem pip install "aspose-note[pdf]".

API je modelisan po poznatom Aspose.Note za .NET interfejsu: Document, Page, Outline, RichText, Image, Table, AttachedFile. Biblioteka je licencirana pod MIT-om, otvorenog koda, i prihvata izveštaje o greškama i doprinose na GitHub-u.

Učitaj OneNote datoteku i izvuci sav tekst

Instalirajte pomoću pip-a, zatim prosledite putanju do fajla funkciji Document() da parsirate OneNote binarni format. GetChildNodes(RichText) izvršava duboku rekurzivnu pretragu i vraća svaki tekstualni čvor u dokumentu, što je korisno za indeksiranje punog teksta ili migracione pipelines.

pip install aspose-note
from aspose.note import Document, RichText

doc = Document("notebook.one")
print(f"Stranice: {len(list(doc))}")

# Izvuci sav tekst kroz ceo dokument
texts = [rt.Text for rt in doc.GetChildNodes(RichText) if rt.Text]
for text in texts:
    print(text)

Izvezi u PDF i sačuvaj priložene slike

PDF izvoz zahteva opcioni ReportLab zavisnost. Instalirajte ga pomoću pip install "aspose-note[pdf]". Isti Document objekat se takođe može iterirati po Image čvorovima kako bi se izvadile i sačuvale sve ugrađene slike na disk u jednom prolazu.

from aspose.note import Document, SaveFormat, Image
import pathlib

doc = Document("notebook.one")

# Izvezi dokument u PDF (zahteva aspose-note[pdf])
doc.Save("output.pdf", SaveFormat.Pdf)

# Sačuvajte sve ugrađene slike na disk
out_dir = pathlib.Path("images")
out_dir.mkdir(exist_ok=True)
for i, img in enumerate(doc.GetChildNodes(Image)):
    name = img.FileName or f"image_{i}.bin"
    (out_dir / name).write_bytes(img.Bytes)

Frequently Asked Questions

Šta je Aspose.Note FOSS za Python?

To je besplatna, MIT-licencirana Python biblioteka za čitanje Microsoft OneNote (.one) fajlova bez potrebe za Microsoft Office-om, COM automatizacijom ili bilo kojim vlasničkim runtime-om.

Koje varijante OneNote formata su podržane?

OneNote 2010, OneNote Online i OneNote 2007 varijante formata. Svaki validan .one fajl sekcije može da se učita.

Kako da ga instaliram?

Pokrenite pip install aspose-note za osnovnu biblioteku, ili pip install "aspose-note[pdf]" da uključite opcioni ReportLab zavisnost za PDF izvoz.

Mogu li izvesti OneNote datoteke u PDF?

Da. Pozovite Document.Save(path, SaveFormat.Pdf). PDF izvoz zahteva da je opcioni ReportLab zavisnost instaliran putem [pdf] dodatka.

Mogu li učitati .one fajlove iz toka?

Da. Klasa Document prihvata binarni tok (npr., io.BytesIO ili telo HTTP odgovora) tako da možete obrađivati fajlove bez upisivanja na disk.

Koja Python verzija je potrebna?

Python 3.10 ili noviji je neophodan.

Mogu li da pišem ili izmenim .one fajl?

Ne. Trenutna edicija je samo za čitanje. Može da otvori i parsira bilo koji validan .one sekcioni fajl, ali pisanje nazad u OneNote binarni format nije podržano.

Da li su šifrovani OneNote dokumenti podržani?

Ne. Učitavanje .one fajla zaštićenog lozinkom podiže IncorrectPasswordException. Šifrovani dokumenti nisu podržani u trenutnoj ediciji.

Gde mogu da nađem izvorni kod?

Biblioteka je licencirana pod MIT licencom i hostovana na GitHub-u. Izveštaji o greškama i pull zahtevi su dobrodošli.

  

Support and Learning Resources

 Српски