Giới thiệu

Aspose.Words FOSS for Python cung cấp một API đơn giản để chuyển đổi tài liệu Word giữa các định dạng. Lớp Document tải các tệp trong năm định dạng đầu vào và phương thức save() xuất ra PDF, Markdown hoặc văn bản thuần.

Bài viết này hướng dẫn quy trình chuyển đổi cốt lõi, từ chuyển đổi tệp đơn lẻ đến xử lý hàng loạt trên tất cả các định dạng được hỗ trợ.


Tính năng chính

Chuyển Đổi Tài Liệu Đơn

Tải bất kỳ tệp đầu vào nào được hỗ trợ và chuyển đổi nó sang định dạng mục tiêu chỉ với hai dòng mã. Hàm khởi tạo Document chấp nhận các tệp DOCX, DOC, RTF, TXT và Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Chuyển đổi hàng loạt sang nhiều định dạng

Gọi save() nhiều lần trên cùng một tài liệu đã tải để tạo ra các đầu ra ở mọi định dạng được hỗ trợ mà không cần tải lại tệp đầu vào.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

Xuất PDF với PdfSaveOptions

Sử dụng PdfSaveOptions để kiểm soát chi tiết đầu ra PDF. Đối với cài đặt mặc định, SaveFormat.PDF là đủ.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Xuất Markdown với MarkdownSaveOptions

Sử dụng MarkdownSaveOptions để kiểm soát thêm định dạng đầu ra Markdown.

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Trích xuất văn bản

Trích xuất nội dung văn bản thuần từ bất kỳ tài liệu nào đã tải lên bằng cách sử dụng Document.get_text() mà không ghi vào tệp.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Bắt đầu nhanh

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Định dạng được hỗ trợ

Định dạngPhần mở rộngĐọcGhi
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Mã nguồn mở & Cấp phép

Aspose.Words FOSS for Python được phát hành dưới MIT License. Bạn có thể sử dụng nó trong các dự án cá nhân, nội bộ và thương mại mà không phải trả phí giấy phép. Mã nguồn có sẵn trên GitHub.


Bắt đầu