1. Produkter
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Foss.Note Foss til Python

Læs, gennemgå og eksportere Microsoft OneNote (.one) filer fra Python - gratis og open source, ingen Microsoft Office kræves.

Open Source Python-bibliotek til OneNote-filer

Aspose.Note FOSS for Python er et 100 % gratis, MIT‑licenseret bibliotek, der lader dig læse Microsoft OneNote (.one)‑filer helt fra Python, uden Microsoft Office, uden COM‑automatisering og uden proprietær runtime. Det eksponerer et rent offentligt API (aspose.note.*) modelleret efter den velkendte Aspose.Note for .NET‑grænseflade, understøttet af en indbygget MS-ONE/OneStore binær parser skrevet i ren Python.

Installer fra PyPI med pip install aspose-note (eller pip install "aspose-note[pdf]" for at aktivere PDF‑eksport). Kræver Python 3.10 eller nyere.

Biblioteket er egnet til dokumentautomatiserings‑scripts, indholdsindekserings‑pipelines, arkiveringsværktøjer og enhver server‑side workflow, der skal håndtere OneNote‑indhold uden en Microsoft Office‑afhængighed.

Læs og gennemgå OneNote-dokumenter

  • **Lad .one-filer: ** Åbn en hvilken som helst OneNote-sektion fra en filvej eller binærstrøm via ‘Dokument’.
  • Full DOM traversal: Navigere Dokument → Side → Udkast → Udkastelement → RichText / Billede / Tabell / TilføjedeFile.
  • Rich Text Extraction: Læs rå tekst via ‘RichText.Text’ eller inspicer ‘TextRun’ segmenter for bold, italic, skrifttype, farve og hyperlink metadata.
  • Tabelparsing: Gennemse hierarkierne ’Tabel → TableRow → TableCell’ med kolonnebredder og grænsevisibilitet.
  • ** Taggkontrol: ** Læs ’NoteTag’ metadata (form, mærkning, farve, færdiggørelse) på tekst, billede og tabelnoder.

Hvor Aspose.Note FOSS kan bruges

  • ** Indeksering af indhold: ** Udtræk og indeksér al tekst fra OneNote-arkiver til søgepipeliner.
  • **Dokumentmigration: ** Konverter OneNote-sektioner til PDF, almindelig tekst eller strukturerede data.
  • Archivværktøjer: Gem indlejrede billeder og vedhæftede filer til disk fra .one-filer.
  • **CI/CD-arbejdsprocesser: ** Valider eller behandle OneNote-indhold i Docker-beholdere.
  • **Knowledge-base-rørledninger: ** Udtræk struktureret indhold fra team OneNote-notesbøger.

Eksport, billeder og vedhæftede filer

  • ** PDF eksport: ** Gem eventuelle indlæst ‘Dokument’ til PDF ved hjælp af ‘Document.Save(path, SaveFormat.Pdf)’.
  • **PDF-indstillinger: ** Tilpasse sideområdet, tagikonkataloget, ikonstørrelsen og gapet via ‘PdfSaveOptions’.
  • **Billedeksport: ** Iterer ‘Billede’ knudepunkter for at hente rå byte, filnavn, dimensioner og alt tekst.
  • ** Vedhæftede filer: ** Iterere knudepunkterne ‘AttracedFile’ for at gemme indlejrede filvedhæftede filer til disk.
  • **Stream-baseret indlæsning: ** Åbn .one filer fra en binær stream (f.eks. `io.BytesIO’) uden at skrive til disk.

Udvikleroplevelse

Aspose.Note FOSS installerer med en enkelt kommando ‘pip install aspose-note’.

API’en er modelleret på den velkendte Aspose.Note for .NET-grænseflade: ‘Document’, ‘Page’, ‘Outline’, ‘RichText’, ‘Image’, ‘Table’, ‘AttachedFile’.

Indlæse en OneNote-fil og udtrække al tekst

Installér med pip, og derefter videregive en filvej til ‘Document()’ for at analysere OneNote binærformat. ‘GetChildNodes(RichText)’ udfører en dyb recursiv søgning og returnerer hver tekstnod i dokumentet, hvilket er nyttigt til fuldtekstindeksering eller migrering rørledninger.

»Bash Pip installerer aspose-note »«

af Python fra aspose.note import Dokument, RichText

dokumentet (”notebook.one”) udskrivning(f"Sider: {len(list(doc))}")

Udtræk al tekst over hele dokumentet

tekst = [rt.Text for rt i doc.GetChildNodes(RichText) hvis rt.Text] For tekst i tekster: Udskrivning af tekst (text) »«

Eksporter til PDF og gem vedhæftede billeder

PDF-eksport kræver den valgfrie ReportLab-afhængighed. Installer den med ‘pip install ‘aspose-note[pdf]’’. Det samme ‘Dokument’ objekt kan også itereres for ‘Image’ noder til at udtrække og gemme alle de indlejrede billeder til disk i et enkelt pass.

af Python fra aspose.note import Dokument, SaveFormat, Billede Import af patch

dokumentet (”notebook.one”)

Eksport dokumentet til PDF (kræver aspose-note[pdf])

ark.Save(“output.pdf”, SaveFormat.Pdf)

Gem alle indlejrede billeder til disk

out_dir = pathlib.Path (”billeder”) ud_dyr.dkdir(eksistere_også=Sandt) for i, img i enumerate(doc.GetChildNodes(Billede)): navn = img.FileName eller f"image_{i}.bin" (ud_ud / navn).skrive_byte(img.Bytes) »«

Frequently Asked Questions

Hvad er Aspose.Note FOSS for Python?

Det er et gratis, MIT-licenseret Python-bibliotek til læsning af Microsoft OneNote (.one) filer uden at kræve Microsoft Office, COM automatisering eller nogen proprietær køretid.

Hvilke OneNote-formatsvarianter understøttes?

OneNote 2010, OneNote Online og OneNote 2007 formatvarianter. Alle gyldige .one-sektionsfiler kan indlæses.

Hvordan installerer jeg det?

Kør ‘pip install aspose-note’ for basebiblioteket eller ‘pip install ‘aspose-note[pdf]’ for at medtage den valgfrie ReportLab-afhængighed til PDF-eksport.

Kan jeg eksportere OneNote-filer til PDF?

Du skal kalde ‘Document.Save(path, SaveFormat.Pdf)’. PDF-eksport kræver den valgfrie ReportLab-afhængighed installeret via ‘[pdf]’ ekstra.

Kan jeg downloade .one filer fra en stream?

Ja. Klassen ‘Dokument’ accepterer en binær strøm (f.eks. ‘io.BytesIO’ eller et HTTP-svarstof), så du kan behandle filer uden at skrive til disk.

Hvilken version af Python skal jeg bruge?

Python 3.10 eller nyere er påkrævet.

Kan jeg skrive eller ændre en .one fil?

Den aktuelle udgave er kun til læsning. Den kan åbne og analysere en gyldig .one-sektionsfil, men der understøttes ikke skrivning tilbage til OneNote-binærformatet.

Er krypterede OneNote-dokumenter understøttet?

Nej. Indlæser en passwordbeskyttet .one-fil opstår en “IncorrectPasswordException”.

Hvor kan jeg finde kildekoden?

Biblioteket er MIT-licenseret og hostet på GitHub. Bug rapporter og trække anmodninger er velkomne.

  

Support og læringsressourcer

 Dansk