1. Productos
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Notas de FOSS para Python

Leer, cruzar y exportar archivos de Microsoft OneNote (.one) desde Python - gratis y de código abierto, sin necesidad de Microsoft Office.

Biblioteca de Python de código abierto para archivos de OneNote

Aspose.Note FOSS para Python es una biblioteca 100% gratuita, con licencia MIT, que le permite leer archivos Microsoft OneNote (.one) completamente desde Python, sin Microsoft Office, sin automatización COM y sin requerir un runtime propietario. Expone una API pública limpia (aspose.note.*) modelada según la conocida interfaz Aspose.Note para .NET, respaldada por un analizador binario MS-ONE/OneStore incorporado escrito en puro Python.

Instale desde PyPI con pip install aspose-note (o pip install "aspose-note[pdf]" para habilitar la exportación a PDF). Requiere Python 3.10 o posterior.

La biblioteca es adecuada para scripts de automatización de documentos, canalizaciones de indexación de contenido, herramientas de archivado y cualquier flujo de trabajo del lado del servidor que necesite consumir contenido de OneNote sin una dependencia de Microsoft Office.

Leer y cruzar documentos de OneNote

  • Cargar archivos .one: Abra cualquier sección de OneNote desde un camino de archivo o flujo binario a través de ‘Documento’.
  • **Dom completo: ** Navegación a ‘Documento → Página → Descripción → Elementos de Descripción → RichText / Imagen / Tabla / Archivo adjunto’.
  • ** Extracción de texto rico: ** Lee texto crudo a través de ‘RichText.Text’ o inspeccione los segmentos de ‘TextRun’ para obtener metadatos de bold, italic, font, color y hipervínculo.
  • **Tabla de análisis: ** A través de las jerarquías de Tabla → Tabla de bordes → TablaCell con ancho de columna y visibilidad de límite.
  • ** Inspección de etiquetas: ** Lee los metadatos de ‘NoteTag’ (forma, etiqueta, color, estado de finalización) en los nodos de texto, imagen y tabla.

Dónde se puede usar Aspose.Note FOSS

  • **Indexado de contenido: **Extraer e indexar todo el texto de los archivos de OneNote para búsqueda de pines.
  • **Migración de documentos: ** Convertir secciones de OneNote en PDF, texto simple o datos estructurados.
    • Herramientas de archivo: ** Guardar imágenes incorporadas y adjuntos al disco de los archivos .one.
  • ** Flujos de trabajo CI/CD: * Validar o procesar el contenido de OneNote dentro de los contenedores de Docker.
  • **Pipelines de base de conocimientos: ** Extraer contenido estructurado de los notas de OneNote de equipo.

Exportación, imágenes y anexos

  • **Exportación de PDF: ** Guardar cualquier documento cargado en PDF usando ‘Document.Save(path, SaveFormat.Pdf)’.
  • **Opciones PDF: ** Personalizar el rango de páginas, el directorio de iconos de etiquetas, el tamaño de iconos y el intervalo a través de ‘PdfSaveOptions’.
  • **Image export: ** Iterate los nodos de ‘Image’ para recuperar bytes crudos, nombre de archivo, dimensiones y texto alt.
  • **Añadir: ** Iterar los nodos de ‘AñadidoFiche’ para guardar los adjuntos de archivos incorporados en el disco.
  • ** Carga basada en flujo:** Abre los archivos .one de un flujo binario (por ejemplo, ‘io.BytesIO’) sin escribir en disco.

Experiencia del desarrollador

Aspose.Note FOSS se instala con un único comando ‘pip install aspose-note’.El paquete base no tiene dependencias opcionales; la exportación de PDF requiere ReportLab, instalado a través de ‘pip install ‘aspose-note[pdf]’.

La API está modelada en la familiar interfaz Aspose.Note para .NET: ‘Document’, ‘Page’, ‘Outline’, ‘RichText’, ‘Image’, ‘Table’, ‘AttachedFile’.La biblioteca es licenciada por MIT, de código abierto y acepta informes de errores y contribuciones en GitHub.

Cargar un archivo de OneNote y extraer todo el texto

Instalar con pip, luego pasar un camino de archivo a ‘Document()’ para analizar el formato binario de OneNote. ‘GetChildNodes(RichText)’ realiza una búsqueda recursiva profunda y devuelve cada nodo de texto en el documento, lo que es útil para la indexación de texto completo o las pistas de migración.

«Bash Pip instalar aspose-note «»

-Python de aspose.note Importar Documentos, RichText

Doc = Documento (en inglés) Imagen(f"Páginas: {len(list(doc))}")

  • Extraer todo el texto en todo el documento textos = [rt.Text para rt en doc.GetChildNodes(RichText) si rt.Text] Para los textos en texto: El texto (Texto) «»

Exportar a PDF y guardar imágenes adjuntas

La exportación de PDF requiere la dependencia opcional de ReportLab. Instalarlo con la opción de instalar el “pip install” para “aspose-note[pdf]".El mismo objeto “Document” también se puede iterar para los nodos de “Image” para extraer y guardar todas las imágenes incorporadas en un solo paso.

-Python de aspose.note Importar Documentos, SaveFormat, Imagen Importación de patatas

Doc = Documento (en inglés)

Exportar el documento a PDF (requiere aspose-note[pdf])

Doc.Save(“output.pdf”, SaveFormat.Pdf)

Salvar todas las imágenes incorporadas en disco out_dir = pathlib.Path(“imágenes”) de la misma manera que el de la misma manera. exist_ok=True para i, img en enumerate(doc.GetChildNodes(Imagen)): nombre = img.FileName o f"image_{i}.bin” (out_dir / nombre).escribir_bytes(img.Bytes) «»

Preguntas frecuentes

¿Qué es Aspose.Note FOSS para Python?

Es una biblioteca de Python gratuita con licencia MIT para leer archivos de Microsoft OneNote (.one) sin requerir Microsoft Office, automatización COM o cualquier tiempo de ejecución propiedad.

¿Qué variantes de formato de OneNote son compatibles?

Variantes de formato de OneNote 2010, OneNote Online y OneNote 2007. se puede cargar cualquier archivo de sección válido.

¿Cómo lo instalo?

Ejecutar ‘pip install aspose-note’ para la biblioteca base, o ‘pip install ‘aspose-note[pdf]’’ para incluir la dependencia opcional de ReportLab para la exportación de PDF.

¿Puedo exportar archivos de OneNote a PDF?

Sí. Llamar ‘Document.Save(path, SaveFormat.Pdf)’’. la exportación de PDF requiere la dependencia opcional de ReportLab instalada a través del ‘[pdf]’ extra.

¿Puedo descargar archivos .one de un flujo?

La clase ‘Documento’ acepta un flujo binario (por ejemplo, ‘io.BytesIO’ o un cuerpo de respuesta HTTP) para que pueda procesar archivos sin escribir en disco.

¿Qué versión de Python es necesaria?

Se requiere Python 3.10 o posterior.

¿Puedo escribir o modificar un archivo .one?

La versión actual es de lectura única. puede abrir y analizar cualquier archivo de sección válido .one, pero no se admite la escritura de nuevo al formato binario de OneNote.

¿Se admiten los documentos encriptados de OneNote?

No. Cargar un archivo .one protegido por contraseña genera una “Excepción de contraseña incorrecta”.

¿Dónde puedo encontrar el código fuente?

La biblioteca está licenciada por el MIT y está alojada en GitHub. los informes de errores y las solicitudes de retiro son bienvenidos.

  

Recursos de soporte y aprendizaje

 Español