1. Продукти
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Забележка: FOSS за Python

Четете, преминавайте през и експортирайте Microsoft OneNote (.one) файлове от Python – безплатно и с отворен код, без да се изисква Microsoft Office.

Библиотека с отворен код на Python за файлове на OneNote

Aspose.Note FOSS за Python е 100% безплатна, лицензирана под MIT библиотека, която ви позволява да четете файлове Microsoft OneNote (.one) изцяло от Python, без Microsoft Office, без COM автоматизация и без проприет runtime. Тя предоставя чист публичен API (aspose.note.*), моделиран върху познатия Aspose.Note за .NET интерфейс, подкрепен от вграден MS-ONE/OneStore бинарен парсер, написан в чист Python.

Инсталирайте от PyPI с pip install aspose-note (или pip install "aspose-note[pdf]", за да активирате експортиране в PDF). Изисква Python 3.10 или по-нова версия.

Библиотеката е подходяща за скриптове за автоматизация на документи, конвейери за индексиране на съдържание, архивни инструменти и всякакви сървърни работни процеси, които трябва да обработват съдържание от OneNote без зависимост от Microsoft Office.

Четене и преминаване през документи на OneNote

  • Зареждане на .one файлове: Отворете всеки раздел на OneNote от пътека на файла или двоичен поток чрез “Документ”.
  • Пълна DOM обиколка: Навигация Документ → Страница → Очертание → Очертание → RichText / Image / Table / AttachedFile.
  • **Извличане на богат текст: ** Прочетете суров текст чрез “RichText.Text” или проверете сегментите “TextRun” за смели, италически, шрифтове, цветове и хипервръзки метаданни.
  • Таблица: Преминаване през йерархиите на таблица → TableRow → TableCell с ширини на колони и видимост на границите.
  • **Проверка на таговете: ** Прочетете метаданните на “NoteTag” (форма, етикет, цвят, състояние на завършване) върху текстови, изображения и таблични възли.

Къде Aspose.Note FOSS може да се използва

  • Индексиране на съдържание: Извличане и индексиране на целия текст от архивите на OneNote за тръбопроводи за търсене.
  • **Миграция на документи: ** Конвертирайте OneNote секции в PDF, обикновен текст или структурирани данни.
  • ** Архивни инструменти: ** Запазете вградените изображения и прикачени файлове на диск от файловете .one.
  • ** CI/CD работни потоци: ** Валидиране или обработка на съдържанието на OneNote в контейнери на Docker.
  • **Работни линии на базата на знания: ** Извличане на структурирано съдържание от бележниците на OneNote на екипа.

Експорт, Изображения и Прикачени файлове

  • ** PDF експорт: ** Запазете всяко заредено “Документ” в PDF с помощта на “Document.Save(path, SaveFormat.Pdf)”.
  • ** Опции за PDF: ** Настройване на диапазона на страниците, каталога с икони за етикети, размера на иконите и разстоянието чрез “PdfSaveOptions”.
  • **Импорт на изображение: ** Итерирайте възелите “Изображение”, за да изтеглите сурови байтове, име на файл, размери и алт текст.
  • **Запазване на прикачени файлове: ** Итерирайте възлите “AttracedFile”, за да запишете вградените прикачени файлове на диска.
  • **Натоварване на базата на поток: ** Отворете файловете .one от двоичен поток (например `io.BytesIO’) без да пишете на диск.

Опит на разработчиците

Aspose.Note FOSS инсталира с една команда “pip install aspose-note”. базов пакетът няма опционални зависимости; PDF експорт изисква ReportLab, инсталиран чрез “pip install “aspose-note[pdf]”.

API е моделиран на познатия Aspose.Note за .NET интерфейс: „Document“, „Page“, „Outline“, „RichText“, „Image“, „Table“, „AttachedFile“.

Заредете файл на OneNote и извлечете целия текст

Инсталирайте с pip, след това прехвърлете пътека към файл в ‘Document()’, за да анализирате двоичния формат на OneNote. ‘GetChildNodes(RichText)’ извършва дълбоко рекурсивно търсене и връща всеки текстов възел в документа, което е полезно за индексиране на пълния текст или миграционни тръбопроводи.

„Баш pip install за инсталиране „

„Питон“ от aspose.note Import Document, RichText

doc = Документ(“notebook.one”) отпечатани(f"Страници: {len(list(doc))}")

Извличане на целия текст в целия документ

текстове = [rt.Text за rt в doc.GetChildNodes(RichText) ако rt.Text] За текста в текстове: Отпечатано (от текст) „

Експортиране в PDF и Запазване на прикачени изображения

PDF експорт изисква допълнителна зависимост ReportLab. Инсталирайте го с “pip install “aspose-note[pdf]””. Същият обект “Document” може да се повтаря и за възли “Image” за извличане и записване на всички вградени изображения на диск в един проход.

„Питон“ от aspose.note Import Document, SaveFormat, Image Внос на палитра

doc = Документ(“notebook.one”)

Експортиране на документа в PDF (изисква аспониране[pdf])

съхранение на файловете (”output.pdf”, SaveFormat.Pdf)

Запазете всички вградени изображения на диск

out_dir = pathlib.Path(“изображения”) out_dir.mkdir(съществуващо_ok=Истински) За да се отбележи, че е налице, img in enumerate(doc.GetChildNodes(Image)): име = img.FileName или f"image_{i}.bin" (изберете от името на фирмата).Write_byte(img.Bytes) „

Frequently Asked Questions

Какво е Aspose.Note FOSS за Python?

Това е безплатна, лицензирана от MIT Python библиотека за четене на Microsoft OneNote (.one) файлове без да се изисква Microsoft Office, COM автоматизация или някакво собствено изпълнение.

Кои варианти на формати на OneNote се поддържат?

OneNote 2010, OneNote Online и OneNote 2007 формати вариации. Можете да качите всеки валиден файл на секция .one.

Как да го инсталираме?

Изпълнете “pip install aspose-note” за основната библиотека или “pip install “aspose-note[pdf]””, за да включите опционалната зависимост ReportLab за експортиране на PDF.

Мога ли да експортирам файлове на OneNote в PDF?

Да. Назовете “Document.Save(path, SaveFormat.Pdf)” . PDF експорт изисква опционалната зависимост ReportLab, инсталирана чрез “[pdf]” допълнително.

Мога ли да кача .one файлове от поток?

Класа “Документ” приема двоичен поток (например “io.BytesIO” или HTTP отговор), така че можете да обработвате файлове, без да пишете на диск.

Каква версия на Python е необходима?

Задължително е да се използва Python 3.10 или по-нова версия.

Мога ли да записвам или модифицирам .one файл?

Не. Текущата версия е само за четене. Тя може да отваря и анализира всеки валиден файл на раздел .one, но не се поддържа писане обратно в двоичния формат на OneNote.

Поддържат ли се криптирани документи на OneNote?

Зареждането на защитен с парола .one файл повдига “IncorrectPasswordException”.

Къде мога да намеря изходния код?

Библиотеката е лицензирана от MIT и се хоства на GitHub. Бъг доклади и изтегляне искания са добре дошли.

  

Ресурси за поддръжка и обучение

 Български