1. Producten
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Aspose.Note FOSS voor Python

Lees, doorstuur en exporteer Microsoft OneNote (.one) bestanden uit Python - gratis en open source, geen Microsoft Office vereist.

Open source Python-bibliotheek voor OneNote-bestanden

Aspose.Note FOSS voor Python is een 100% gratis, MIT-licentieerde bibliotheek waarmee je Microsoft OneNote (.one) bestanden volledig kunt lezen vanuit Python, zonder Microsoft Office, geen COM-automatisering en geen proprietaire runtime vereist.

Installeer vanuit PyPI met ‘pip install aspose-note’ (of ‘pip install ‘aspose-note[pdf]’’’ om PDF-export mogelijk te maken).

De bibliotheek is geschikt voor documentautomatiseringsscripts, inhoudsindexpipelines, archiveringshulpmiddelen en alle werkstromen aan de serverkant die OneNote-inhoud moeten consumeren zonder een Microsoft Office-afhankelijkheid.

Lees en doorloopt OneNote-documenten

  • **Laden van .one-bestanden: ** Open een OneNote-gedeelte vanuit een bestandspad of binaire stroom via ‘Document’.
  • Volledige DOM-versnelling: Navigeren naar ‘Document → Pagina → Uitlijning → OutlineElement → RichText / Afbeelding / Tabel / Bijgevoegde bestand’.
  • **Rich Text Extraction: ** Lees ruwe tekst via ‘RichText.Text’ of controleer ‘TextRun’ segmenten voor bold, italic, lettertype, kleur en hyperlink metadata.
  • Tabelparsing: Door de hiërarchieën ‘Tabel → TableRow → TableCell’ met kolombreedtes en grenszichtbaarheid.
  • ** Tag inspectie: ** Lees de metadata van ‘NoteTag’ (vorm, label, kleur, voltooiing) op tekst, afbeelding en tabelknopen.

Waar Aspose.Note FOSS kan worden gebruikt

  • Inhoud indexeren: Alle tekst uit de OneNote-archieven voor zoekleidingen extraheren en indexeren.
  • **Documentmigratie: ** Worden OneNote-onderdelen omgezet in PDF, eenvoudige tekst of gestructureerde gegevens.
  • Archieftools: Bewaar ingebedde afbeeldingen en bijlagen op de schijf uit .one-bestanden.
  • **CI/CD-werkstromen: ** Valideer of verwerk OneNote-inhoud in Docker-containers.
  • Kennisbasispijplijnen: Structureerde inhoud extraheren uit OneNote-notitieblokken van het team.

Exporteren, afbeeldingen en bijlagen

  • **PDF-export: ** Bewaar elke geladen ‘Document’ naar PDF met behulp van ‘Document.Save(path, SaveFormat.Pdf)’.
  • **PDF-opties: ** Pas de pagina-bereik, tag-iconen directory, pictogramgrootte en gap aan via ‘PdfSaveOptions’.
  • **Image export: **Iteratie van de ‘Image’-nodes om ruwe bytes, bestandsnaam, afmetingen en alt-tekst te halen.
  • **Aanvulling opslaan: ** Itereren van ‘Aanvullendbestand’-nodes om ingebedde bestandsafslagen op te slaan op de schijf.
  • **Stream-gebaseerde lading: ** Open .one bestanden van een binaire stream (bijv. `io.BytesIO’) zonder te schrijven naar een schijf.

Ontwikkelaarservaring

Aspose.Note FOSS installeert met een enkele opdracht ‘pip install aspose-note’.Het basispakket heeft geen optionele afhankelijkheden; PDF-export vereist ReportLab, geïnstalleerd via ‘pip install ‘aspose-note[pdf]’.

De API is gemodelleerd op de bekende Aspose.Note voor .NET-interface: ‘Document’, ‘Page’, ‘Outline’, ‘RichText’, ‘Image’, ‘Table’, ‘AttachedFile’.

Een OneNote-bestand laden en alle tekst extraheren

Installeer met pip, geef vervolgens een bestandspad door naar ‘Document()’ om het binaire formaat van OneNote te analyseren. ‘GetChildNodes(RichText)’ voert een diep recursieve zoekopdracht uit en retourneert elke tekstnood in het document, wat handig is voor volledige tekstindexering of migratiepijplijnen.

‘Bash’ Pip installeren aspose-note ‘’

‘Python’ van aspose.note import Document, RichText

doc = Document(“notebook.one”) print(f"Pages: {len(list(doc))}")

Alle tekst over het hele document extraheren

tekst = [rt.Text voor rt in doc.GetChildNodes(RichText) in rt.Text] Voor tekst in teksten: De tekst (Texte) ‘’

Exporteren naar PDF en bijgevoegde afbeeldingen opslaan

PDF-export vereist de optionele ReportLab-afhankelijkheid. Installeer het met ‘pip install ‘aspose-note[pdf]’’. Hetzelfde ‘Document’-object kan ook worden herhaald voor ‘Image’ -nodes om alle ingebedde afbeeldingen in één pass te extraheren en op te slaan.

‘Python’ van aspose.note importeren Document, SaveFormat, Afbeelding Import van pathlib

doc = Document(“notebook.one”)

Exporteren van het document naar PDF (vereist aaspose-note[pdf])

doc.Save(“output.pdf”, SaveFormat.Pdf)

Alle ingebedde afbeeldingen opslaan op de schijf

out_dir = pathlib.Path(“beelden”) uit_deur.nl (exist_ok=waar) voor i, img in enumerate(doc.GetChildNodes(Bild)): naam = img.FileName of f"image_{i}.bin" (uit_deur / naam).schrijven_byten(img.Bytes) ‘’

Frequently Asked Questions

Wat is Aspose.Note FOSS voor Python?

Het is een gratis, MIT-licentieerde Python-bibliotheek voor het lezen van Microsoft OneNote (.one) bestanden zonder Microsoft Office, COM automatisering, of enige proprietaire runtime.

Welke OneNote-indelingen worden ondersteund?

OneNote 2010, OneNote Online en OneNote 2007-indelingen. Alle geldige .one-onderdeelbestanden kunnen worden geladen.

Hoe installeer ik het?

Voer ‘pip install aspose-note’ uit voor de basisbibliotheek of ‘pip install ‘aspose-note[pdf]’ uit om de optionele ReportLab-afhankelijkheid voor PDF-export op te nemen.

Kan ik OneNote-bestanden exporteren naar PDF?

Ja. Bel ‘Document.Save(path, SaveFormat.Pdf)’’. PDF-export vereist de optionele ReportLab-afhankelijkheid die is geïnstalleerd via de ‘[pdf]’ extra.

Kan ik .one bestanden downloaden van een stream?

De ‘Document’-klasse accepteert een binaire stroom (bijvoorbeeld ‘io.BytesIO’ of een HTTP-responscorps), zodat u bestanden kunt verwerken zonder op een schijf te schrijven.

Welke Python versie is nodig?

Python 3.10 of hoger is vereist.

Kan ik een .one-bestand schrijven of wijzigen?

De huidige editie is alleen voor lezen. Het kan elk geldig sectiedossier openen en analyseren, maar het schrijven terug naar het binaire OneNote-formaat wordt niet ondersteund.

Worden gecodeerde OneNote-documenten ondersteund?

Het laden van een met een wachtwoord beschermd .one-bestand brengt een ‘IncorrectPasswordException’ op.

Waar kan ik de broncode vinden?

De bibliotheek is MIT-licensed en gehost op GitHub. Bugrapporten en pull requests zijn welkom.

  

Ondersteuning en leermiddelen

 Nederlands