1. 제품
  2.   Aspose.Note
  3.   Aspose.Note FOSS for Python

Aspose.Note FOSS for Python에 대한 정보

읽기, 탐색 및 파이썬에서 Microsoft OneNote (.one) 파일을 내보내기 - 무료 및 오픈 소스, Microsoft Office 필요 없습니다.

OneNote 파일을 위한 오픈 소스 Python 라이브러리

Aspose.Note FOSS for Python는 Microsoft Office가 없고 COM 자동화가 필요하지 않으며 소유권 실행 시간이 필요하지 않음으로써 Microsoft OneNote (.one) 파일을 파이썬에서 완전히 읽을 수있는 MIT 라이선스가 100% 무료이며, 익숙한 Aspose.Note for .NET 인터페이스에 모델링 된 깨끗한 공용 API (aspose.note.*)를 공개합니다.

‘pip install aspose-note’(또는 ‘pip install aspose-note[pdf]’)를 사용하여 PDF 내보내기를 사용하여 설치합니다.)

이 라이브러리는 문서 자동화 스크립트, 콘텐츠 인덱싱 파이프라인, 아카이브 도구 및 Microsoft Office 의존성없이 OneNote 콘텐츠를 소비해야 하는 서버 측의 모든 워크플로에 적합합니다.

읽기 및 OneNote 문서를 통해

  • **.one 파일 로드: ** ‘Document’을 통해 파일 경로 또는 바이너리 스트림에서 OneNote 섹션을 열어보세요.
  • ** 전체 DOM 횡단: ** ‘Document → Page → Outline → OutlineElement → RichText / Image / Table / AttachedFile’를 탐색합니다.
  • **Rich Text Extraction: **RichText.Text를 통해 원본 텍스트를 읽거나 ‘TextRun’ 세그먼트를 검사하여 대담한, 이탈리틱, 글꼴, 색상 및 하이퍼 링크 메타데이터를 확인합니다.
  • Table parsing: 열 폭과 경계 가시성을 가진 Table → TableRow → TableCell 계층 계층을 통과합니다.
  • ** 태그 검사: ** 텍스트, 이미지 및 테이블 노드에 있는 ‘NoteTag’ 메타데이터(형태, 레이블, 색상, 완료 상태)를 읽습니다.

Aspose.Note FOSS가 사용할 수 있는 곳

  • ** 콘텐츠 인덱싱: ** 검색 파이프라인을 위한 OneNote 아카이브에서 모든 텍스트를 추출하고 인덱스합니다.
  • ** 문서 마이그레이션: ** OneNote 섹션을 PDF, 단순 텍스트 또는 구조화 된 데이터로 변환합니다.
  • **아키보드 도구: ** 삽입된 이미지와 첨부 파일을 ‘.one’ 파일에서 디스크에 저장합니다.
  • **CI/CD 워크플로우: **Docker 컨테이너 내에서 OneNote 콘텐츠를 검증하거나 처리합니다.
  • **지식 기반 파이프라인: ** 팀 OneNote 노트북에서 구조화된 콘텐츠를 추출합니다.

수출, 이미지 및 첨부

  • **PDF 수출: **로드 된 ‘Document’을 ‘Document.Save(path, SaveFormat.Pdf)‘를 사용하여 PDF로 저장합니다.
  • **PDF 옵션: ** 페이지 범위, 태그 아이콘 디렉터리, 아이콘 크기 및 틈새를 사용하여 ‘PdfSaveOptions’를 사용자 정의합니다.
  • **Image export: **Image 노드를 iterate하여 원본 바이트, 파일 이름, 차원 및 alt 텍스트를 검색합니다.
  • ** 첨부 파일 저장: ** 첨부 파일 첨부 파일을 디스크에 저장하기 위해 ‘AtttachedFile’ 노드를 이터링합니다.
  • ** 스트림 기반 로딩: ** 디스크에 쓰지 않고 바이너리 스트림(예: io.BytesIO')에서 .one` 파일을 열어보세요.

개발자 경험

Aspose.Note FOSS는 단일 ‘pip install aspose-note’ 명령으로 설치합니다.베이스 패키지는 선택적인 의존성을 갖추지 않습니다; PDF 수출은 ‘pip install ‘aspose-note[pdf]‘을 통해 설치된 ReportLab를 필요로 합니다.

API는 .NET 인터페이스의 익숙한 Aspose.Note를 기반으로 모델링되었습니다: ‘Document’, ‘Page’, ‘Outline’, ‘RichText’, ‘Image’, ‘Table’, ‘AttachedFile’.이 라이브러리는 MIT 라이선스, 오픈 소스이며 GitHub에서 버그 보고서 및 기여를 수락합니다.

OneNote 파일을 로드하고 모든 텍스트를 추출

pip을 사용하여 설치한 다음 파일 경로를 ‘Document()‘로 전달하여 OneNote 바이너리 형식을 검사합니다. ‘GetChildNodes(RichText)‘는 깊은 재발 검색을 수행하고 문서의 모든 텍스트 노드를 반환하여 전체 텍스트 인덱싱 또는 마이그레이션 파이프라인에 유용합니다.

♪ 바시 pip install aspose-note에 대한 정보 ♪♪

  • 파이썬 from aspose.note import 문서, RichText

문서(“notebook.one”) (f"페이지: {len(list(doc))})

전체 문서에 대한 모든 텍스트 추출

텍스트 = [rt.Text for rt in doc.GetChildNodes(RichText) if rt.Text] 텍스트에 대한 내용: For text in texts: 텍스트( Text) ♪♪

PDF로 내보내고 첨부된 이미지를 저장

PDF 수출은 선택적인 ReportLab 의존성을 필요로 합니다. 설치는 `pip install ‘aspose-note[pdf]‘으로 합니다. 같은 ‘Document’ 개체는 ‘Image’ 노드에서 하나의 패스에서 모든 삽입 된 이미지를 디스크에 추출하고 저장할 수 있습니다.

  • 파이썬 from aspose.note import 문서, SaveFormat, 이미지 Patel을 가져오기

문서(“notebook.one”)

문서를 PDF로 내보내기 (필요한 경우에 참고[pdf])

문서 파일을 저장(“output.pdf”, SaveFormat.Pdf)

모든 삽입 된 이미지를 디스크에 저장

out_dir = pathlib.Path(“사진”) 이용자(이용자) 를 위해, img in enumerate(doc.GetChildNodes(Image)): 이름 = img.FileName 또는 f"image{i}.bin" (이하 이름을 입력합니다.Write_byte(img.Bytes) ♪♪

자주 묻는 질문

Python에 대한 Aspose.Note FOSS는 무엇입니까?

Microsoft Office, COM 자동화 또는 특허 실행 시간을 필요로하지 않고 Microsoft OneNote (.one) 파일을 읽을 수있는 MIT 라이선스가있는 무료 Python 라이브러리입니다.

어떤 OneNote 형식 변종이 지원니까?

OneNote 2010, OneNote Online 및 OneNote 2007 형식 변형. 유효한 .one 섹션 파일을 로드할 수 있습니다.

어떻게 설치하나요?

기본 라이브러리에서 ‘pip install aspose-note’를 실행하거나 ‘pip install ‘aspose-note[pdf]‘을 실행하여 PDF 내보내기용으로는 선택적인 ReportLab 의존성을 포함합니다.

OneNote 파일을 PDF로 내보낼 수 있습니까?

예. Call Document.Save(path, SaveFormat.Pdf). PDF 수출은 [pdf] 추가를 통해 설치된 선택적인 ReportLab 의존성을 필요로 합니다.

스트림에서 .one 파일을 로드할 수 있습니까?

‘Document’ 클래스는 바이너리 스트림(예: ‘io.BytesIO’ 또는 HTTP 응답 코스)을 수락하여 디스크에 쓰지 않고도 파일을 처리할 수 있습니다.

어떤 Python 버전이 필요합니까?

Python 3.10 또는 이후가 필요합니다.

.one 파일을 작성하거나 수정할 수 있습니까?

현재 버전은 읽기만 가능하며, 유효한 .one 섹션 파일을 열고 검사할 수 있지만 OneNote 바이너리 형식으로 다시 작성하는 것은 지원되지 않습니다.

암호화된 OneNote 문서는 지원니까?

암호로 보호된 .one 파일을 로드하면 ‘IncorrectPasswordException’가 발생합니다. 암호화된 문서는 현재 버전에서 지원되지 않습니다.

소스 코드는 어디에서 찾을 수 있나요?

이 라이브러리는 MIT-licensed이며 GitHub에 호스팅됩니다. 버그 보고 및 풀 리퀘스트를 환영합니다.

  

지원 및 학습 자료

 한국어