1. Productes
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Foss.Note per a Python

Llegir, fer trampes i exportar arxius de Microsoft OneNote (.one) des de Python - lliure i de codi obert, sense necessitat de Microsoft Office.

Biblioteca de Python de codi obert per a arxius de OneNote

Aspose.Note FOSS per a Python és una biblioteca 100% gratuïta, amb llicència MIT, que permet llegir fitxers Microsoft OneNote (.one) completament des de Python, sense Microsoft Office, sense automatització COM i sense cap entorn d’execució propietari. Exposa una API pública neta (aspose.note.*) modelada segons la coneguda interfície Aspose.Note per a .NET, recolzada per un analitzador binari MS-ONE/OneStore integrat escrit en pur Python.

Instal·leu des de PyPI amb pip install aspose-note (o pip install "aspose-note[pdf]" per habilitar l’exportació PDF). Requereix Python 3.10 o posterior.

La biblioteca és adequada per a scripts d’automatització de documents, canals d’indexació de contingut, eines d’arxiu i qualsevol flux de treball del costat del servidor que necessiti consumir contingut OneNote sense una dependència de Microsoft Office.

Llegir i travessar documents d’OneNote

  • ** Carregar arxius .one: ** Obriu qualsevol secció de OneNote des d’un camí de fitxer o un flux binari a través de ‘Document’.
  • **Permet la travessia completa del DOM: ** Navegació a ‘Document → Pàgina → Descripció → OutlineElement → RichText / Imatge / Taula / Fitxer adjunt’.
  • ** Extracció de text ric: ** Llegir text cru a través de ‘RichText.Text’ o inspeccionar els segments de ‘TextRun’ per obtenir metadades de lletra, lletra, color i hipervincle.
  • **Tabella de paràlisi: ** Travessar les jerarquies de Taula → TableRow → TableCell amb amplades de columnes i visibilitat de límits.
  • ** Inspecció de etiquetes: ** Llegir les metadades de ‘NoteTag’ (forma, etiqueta, color, estat de finalització) en els nodes de text, imatge i taula.

On es pot utilitzar Aspose.Note FOSS

  • **Indexament de contingut: ** Extreu i indexi tot el text dels arxius de OneNote per a canals de cerca.
  • **Migració de documents: ** Converteix les seccions de OneNote en PDF, text simple o dades estructurades.
  • **Eines d’arxiu: ** Salva les imatges i els adjunts incorporats al disc dels arxius .one.
    • Fluxos de treball CI/CD: * Valida o processa el contingut de OneNote dins dels contenidors de Docker.
  • **Pipelines de base de coneixements: ** Extreu contingut estructurat dels blocs de notes de l’equip de OneNote.

Exportació, imatges i adjunts

  • **Exportació de PDF: **Guarda qualsevol document carregat a PDF utilitzant el document.Salvar (camí, SaveFormat.Pdf)'.
  • **Opcions PDF: ** Personalitza l’interval de pàgines, el directori d’icones de etiquetes, la mida de les icones i l’espai a través de ‘PdfSaveOptions’.
  • **Exportació d’imatge: ** Iterar els nodes ‘Imatge’ per recuperar bytes bruts, nom de fitxer, dimensions i text alt.
  • **Apartament d’adhesió: ** Iterar els nodes ‘ApartatFile’ per guardar els adjunts d’arxiu emmarcats al disc.
  • ** Carregament basat en flux: ** Obriu els arxius .one d’un flux binari (per exemple, ‘io.BytesIO’) sense escriure al disc.

Experiència del desenvolupador

Aspose.Note FOSS s’instal·la amb un sol comandament ‘pip install aspose-note’.El paquet base no té dependències opcionals; l’exportació de PDF requereix ReportLab, instal·lat a través de ‘pip install “aspose-note[pdf]”.

L’API està modelada sobre la familiar interfície Aspose.Note per a .NET: ‘Document’, ‘Page’, ‘Outline’, ‘RichText’, ‘Image’, ‘Table’, ‘AttachedFile’.

Carregar un arxiu de OneNote i extreure tot el text

Instal·la amb pip, després passa un camí de fitxer a ‘Document()’ per analitzar el format binari de OneNote. ‘GetChildNodes(RichText)’ realitza una cerca recursiva profunda i retorna cada node de text del document, que és útil per a la indexació de text complet o canonades de migració.

«Baix PIP INSTALL assumpte-nota «»

El Python de aspose.note import Document, RichText

Doc = Document (”notebook.one”) i de la pàgina (p.

Extreure tot el text a través de tot el document

text = [rt.Text per a rt en doc.GetChildNodes(RichText) si rt.Text] Per a textos en text: El text (text) «»

Exportar a PDF i guardar imatges adjunts

L’exportació de PDF requereix la dependència opcional de ReportLab. Instal·la’l amb la instal·lació de ‘pip install ‘aspose-note[pdf]’.El mateix objecte ‘Document’ també es pot iterar per als nodes ‘Image’ per extreure i guardar totes les imatges emmarcades al disc en una sola passa.

El Python de aspose.note import Document, SaveFormat, Imatge Importació de patates

Doc = Document (”notebook.one”)

Exportar el document a PDF (requereix adjunta-nota[pdf])

Doc.Salva (”output.pdf”, SaveFormat.Pdf)

Salva totes les imatges emmarcades al disc

out_dir = patllib.Path(“images”) per a la seva identificació i_discurs.cat (existeix per a tothom) per a i, img en enumerate(doc.GetChildNodes(Imatge)): Nom del fitxer o f"image_{i}.bin" (en anglès) escriure_bytes (en anglès) «»

Frequently Asked Questions

Què és Aspose.Note FOSS per a Python?

És una biblioteca de Python lliure i amb llicència MIT per llegir arxius de Microsoft OneNote (.one) sense necessitar l’automatització de Microsoft Office, COM o qualsevol temps de execució propietari.

Quines variants de format de OneNote es donen suport?

Les variants de format de OneNote 2010, OneNote Online i OneNote 2007 es poden carregar amb qualsevol fitxer de secció vàlid.

Com ho instal·lo?

Executeu ‘pip install aspose-note’ per a la biblioteca base, o ‘pip install ‘aspose-note[pdf]’’ per incloure la dependència ReportLab opcional per a l’exportació de PDF.

Puc exportar arxius de OneNote a PDF?

Sí. truca a ‘Document.Save(path, SaveFormat.Pdf)’ . L’exportació de PDF requereix la dependència opcional de ReportLab instal·lada a través de l’extracte ‘[pdf]’.

Puc carregar arxius .one d’un flux?

La classe Document accepta un flux binari (per exemple, ‘io.BytesIO’ o un cos de resposta HTTP) per tal que pugui processar arxius sense escriure al disc.

Quina versió de Python és necessària?

Es requereix Python 3.10 o posterior.

Puc escriure o modificar un arxiu .one?

No. L’edició actual és només de lectura. Pot obrir i analitzar qualsevol fitxer de secció vàlid .one, però no es dóna suport a l’escriptura de nou al format binari de OneNote.

Es donen suport a documents encriptats de OneNote?

No. La càrrega d’un arxiu .one protegit per contrasenya genera una ‘Excepció de contrasenya incorrecta’.

On puc trobar el codi font?

La biblioteca està llicenciada pel MIT i està allotjada a GitHub. Els informes de bugs i les sol·licituds de retracció són benvinguts.

  

Suport i recursos d aprenentatge

 Català