1. 製品
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

タグ:FOSS for Python

Python から Microsoft OneNote (.one) ファイルを読み、読み込み、輸出する - 無料でオープンソースで、Microsoft Office は必要ありません。

オープンソースのPython ライブラリ for OneNote ファイル

Aspose.Note FOSS for Python は、Microsoft Office なし、COM 自動化なし、独自のランタイムが必要なことなく、Python から完全に Microsoft OneNote (.one) ファイルを読み取ることができる 100% 無料で MIT ライセンスを受けたライブラリです。 純粋な Python で書かれた組み込みの MS-ONE/OneStore バイナリ パッサーによってサポートされた、よく知られている Aspose.Note for .NET インターフェイスでモデル化された、クリーンな公開 API ( aspose.note.*) を公開します。

PyPI から「pip install aspose-note」 (または「pip install aspose-note[pdf]」) をインストールして PDF エクスポートを有効にする) をインストールします。

このライブラリは、文書自動化スクリプト、コンテンツインデックスパイプライン、アーカイブツール、および Microsoft Office 依存なしで OneNote コンテンツを消費する必要があるサーバー側のワークフローに適しています。

読み込みと OneNote ドキュメントの読み込み

  • **.one ファイルをロード: ** ファイルパスまたはバイナリ ストリームから「ドキュメント」で OneNote のいずれかのセクションを開きます。
  • 完全なドーム トラベル: ** ドキュメント→ページ→オフライン→オフラインエレメント→リッチテキスト/画像/テーブル/添付ファイルを移動します。
  • Rich Text Extraction: RichText.Text を介して原文を読み取るか、 bold、italic、font、color、および hyperlink メタデータの「TextRun」セグメントをチェックします。
  • Table Parsing: 列幅と境界の可視性を持つ Table → TableRow → TableCell 等級を横断します。
  • タグ検査: テキスト、画像、テーブルノードの「NoteTag」メタデータ(形、ラベル、色、完成状態)を読み取る。

どこで Aspose.Note FOSS を使用できますか

  • コンテンツのインデックス: 検索パイプラインのための OneNote アーカイブからすべてのテキストを抽出してインデックスします。
  • ** ドキュメント移行:** OneNote セクションを PDF、単純テキスト、または構造化データに変換します。
  • アーカイブツール: 埋め込まれた画像とファイルを .one ファイルからディスクに保存します。
  • **CI/CDワークフロー: ** Docker コンテナ内の OneNote コンテンツを検証または処理します。
  • ** 知識ベースパイプライン:** チーム OneNote ノートブックから構造化されたコンテンツを抽出します。

輸出、画像、および添付

  • PDF 輸出: すべてのロードされた「ドキュメント」を「Document.Save(path, SaveFormat.Pdf)」を使用して PDF に保存します。
  • PDF オプション: ページ範囲、タグアイコンディレクトリ、アイコンサイズ、およびギャップを「PdfSaveOptions」でカスタマイズします。
  • Image export: Iterate Image nodes to retrieve raw bytes, file name, dimensions, and alt text. 画像の輸出:**「イメージ」ノードをイタリアンして、原始バイト、ファイル名、サイズ、およびアルトテキストを取得します。
  • ** 添付保存:** 添付ファイルノードをイテレして、埋め込まれたファイルの添付ファイルをディスクに保存します。
  • ストリームベースのロード: ディスクに書き込まないで、バイナリストリーム(例えば、io.BytesIO)から .one ファイルを開きます。

開発者体験

Aspose.Note FOSS は、単一の pip install aspose-note コマンドでインストールします. ベースパッケージにはオプションの依存性はありません; PDF エクスポートには、 `pip install ‘aspose-note[pdf]’ を介してインストールされた ReportLab が必要です。

API は .NET 用のよく知られている Aspose.Note インターフェイスにモデル化されています: 「Document」、「Page」、「Outline」、「RichText」、「Image」、「Table」、「AttachedFile」 図書館は MIT でライセンスを受け、オープンソースであり、GitHub でバグレポートや貢献を受け入れています。

OneNote ファイルをロードして、すべてのテキストを抽出

pip を使用してインストールし、ファイルパスを「Document()」に送信して、OneNote バイナリ形式をパスします。getChildNodes(RichText)」は、深いリクルシブな検索を実行し、文書の各テキストノードを返します。

「バッシュ」 pip install aspose-note をインストールする 」

「Python」 from aspose.note import ドキュメント, RichText

ドキュメント(「notebook.one」) トップページ(F)

文書全体を超えるすべてのテキストを抽出

テキスト = [rt.Text for rt in doc.GetChildNodes(RichText) if rt.Text] テキストに含まれるもの: for text in texts: 印刷(テキスト) 」

PDF にエクスポートし、添付された画像を保存する

PDF エクスポートには、オプションの ReportLab 依存性が必要です。それを pip install 'aspose-note[pdf]' でインストールします。同じ Document’ オブジェクトは、 `Image’ ノードで、すべての埋め込まれた画像をディスクに一通して抽出して保存することもできます。

「Python」 from コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード コード パチンコの輸入

ドキュメント(「notebook.one」)

ドキュメントをPDFにエクスポートする(notation(pdf)が必要)

保存(「output.pdf」、保存形式.PDF)

すべての埋め込まれた画像をディスクに保存

out_dir = pathlib.Path(「画像」) ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ ウィンテージ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ イ 名前=img.FileName or f"image_{i}.bin" ( トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > トップ > ト 」

よくある質問

Aspose.Note FOSS for Python とは?

これは、Microsoft Office、COM自動化、または所有の実行時間を必要とせずにMicrosoft OneNote (.one) ファイルを読み取るための無料のMITライセンス付きの Python ライブラリです。

どの OneNote 形式のバリエーションがサポートされていますか?

OneNote 2010、OneNote Online、およびOneNote 2007の形式の変数. 適切な .one セクションファイルをロードできます。

インストール方法は?

ベースライブラリの「pip install aspose-note」または「pip install aspose-note[pdf]」を実行して、PDF 輸出用のオプションの ReportLab 依存性を含む。

OneNote ファイルを PDF にエクスポートできますか?

はい. Call Document.Save(path, SaveFormat.Pdf). PDF エクスポートには、オプションの ReportLab 依存性が「[pdf]」の追加機能でインストールされる必要があります。

ストリームから .one ファイルをロードできますか?

はい. 「Document」クラスは、バイナリストリーム(例えば、「io.BytesIO」またはHTTP対応体)を採用し、ディスクに書き込むことなくファイルを処理できます。

Pythonのバージョンは何が必要ですか?

Python 3.10 以降が必要です。

.one ファイルを書き換えたり変更したりできますか?

無し 現在のバージョンは読み込みのみです. 適切な .one セクション ファイルを開いて解析できますが、OneNote バイナリ形式に戻ることはサポートされていません。

暗号化された OneNote ドキュメントはサポートされていますか?

パスワードで保護された .one ファイルをロードすると、IncorrectPasswordException が表示されます。

ソースコードはどこで入手できますか?

このライブラリはMITライセンスで、GitHubでホストされています。バグ報告やプルリクエストは歓迎します。

  

サポートと学習リソース

 日本語