はじめに

Aspose.Words FOSS for Python は、Word ドキュメントをフォーマット間で変換するためのシンプルな API を提供します。Document クラスは 5 つの入力フォーマットでファイルを読み込み、save() メソッドは PDF、Markdown、またはプレーンテキストへエクスポートします。

この投稿では、単一ファイル変換からすべてのサポート形式にわたるバッチ処理まで、コア変換ワークフローを順に解説します。


主な機能

単一ドキュメント変換

任意のサポートされている入力ファイルを読み込み、2 行のコードでターゲット形式に変換します。Document コンストラクタは DOCX、DOC、RTF、TXT、Markdown ファイルを受け入れます。

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

複数フォーマットへのバッチ変換

同じ読み込んだドキュメント上で save() を複数回呼び出し、入力ファイルを再読み込みせずにすべてのサポートされている形式で出力を生成します。

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

PdfSaveOptions を使用した PDF エクスポート

PDF出力を細かく制御するには PdfSaveOptions を使用してください。デフォルト設定の場合は、SaveFormat.PDF で十分です。

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

MarkdownSaveOptions を使用した Markdown エクスポート

追加のMarkdown出力書式制御にはMarkdownSaveOptionsを使用してください。

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

テキスト抽出

Document.get_text() を使用して、任意の読み込まれたドキュメントからプレーンテキスト コンテンツを抽出し、ファイルに書き込まずに取得します。

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

クイックスタート

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

サポートされている形式

形式拡張子読み取り書き込み
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

オープンソースとライセンス

Aspose.Words FOSS for Python は MIT ライセンスの下でリリースされています。ライセンス料なしで個人、社内、商用プロジェクトに使用できます。ソースコードは GitHub で入手可能です。


はじめに