はじめに
Aspose.Words FOSS for Python は、Word ドキュメントをフォーマット間で変換するためのシンプルな API を提供します。Document クラスは 5 つの入力フォーマットでファイルを読み込み、save() メソッドは PDF、Markdown、またはプレーンテキストへエクスポートします。
この投稿では、単一ファイル変換からすべてのサポート形式にわたるバッチ処理まで、コア変換ワークフローを順に解説します。
主な機能
単一ドキュメント変換
任意のサポートされている入力ファイルを読み込み、2 行のコードでターゲット形式に変換します。Document コンストラクタは DOCX、DOC、RTF、TXT、Markdown ファイルを受け入れます。
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
複数フォーマットへのバッチ変換
同じ読み込んだドキュメント上で save() を複数回呼び出し、入力ファイルを再読み込みせずにすべてのサポートされている形式で出力を生成します。
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
PdfSaveOptions を使用した PDF エクスポート
PDF出力を細かく制御するには PdfSaveOptions を使用してください。デフォルト設定の場合は、SaveFormat.PDF で十分です。
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
MarkdownSaveOptions を使用した Markdown エクスポート
追加のMarkdown出力書式制御にはMarkdownSaveOptionsを使用してください。
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
テキスト抽出
Document.get_text() を使用して、任意の読み込まれたドキュメントからプレーンテキスト コンテンツを抽出し、ファイルに書き込まずに取得します。
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
クイックスタート
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
サポートされている形式
| 形式 | 拡張子 | 読み取り | 書き込み |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
オープンソースとライセンス
Aspose.Words FOSS for Python は MIT ライセンスの下でリリースされています。ライセンス料なしで個人、社内、商用プロジェクトに使用できます。ソースコードは GitHub で入手可能です。