บทนำ

Aspose.Words FOSS for Python ให้ API ที่ตรงไปตรงมาสำหรับการแปลงเอกสาร Word ระหว่างรูปแบบต่าง ๆ คลาส Document โหลดไฟล์ในห้ารูปแบบอินพุตและเมธอด save() ส่งออกเป็น PDF, Markdown หรือข้อความธรรมดา.

โพสต์นี้จะพาไปสำรวจกระบวนการแปลงหลัก ตั้งแต่การแปลงไฟล์เดี่ยวจนถึงการประมวลผลแบบชุดสำหรับทุกรูปแบบที่รองรับ.


คุณสมบัติหลัก

การแปลงเอกสารเดี่ยว

โหลดไฟล์อินพุตที่รองรับใด ๆ แล้วแปลงเป็นรูปแบบเป้าหมายด้วยสองบรรทัดของโค้ด ตัวสร้าง Document รองรับไฟล์ DOCX, DOC, RTF, TXT และ Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

การแปลงเป็นชุดหลายรูปแบบ

เรียก save() หลายครั้งบนเอกสารที่โหลดแล้วเดียวกันเพื่อสร้างผลลัพธ์ในทุกรูปแบบที่รองรับโดยไม่ต้องโหลดไฟล์อินพุตใหม่.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

การส่งออก PDF ด้วย PdfSaveOptions

ใช้ PdfSaveOptions เพื่อควบคุมการส่งออก PDF อย่างละเอียด. สำหรับการตั้งค่าเริ่มต้น, SaveFormat.PDF เพียงพอ.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

การส่งออก Markdown ด้วย MarkdownSaveOptions

MarkdownSaveOptions

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

การสกัดข้อความ

ดึงเนื้อหาข้อความธรรมดาจากเอกสารที่โหลดใด ๆ ด้วยการใช้ Document.get_text() โดยไม่ต้องเขียนลงไฟล์.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

เริ่มต้นอย่างเร็ว

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

รูปแบบที่รองรับ

รูปแบบส่วนขยายอ่านเขียน
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

ซอร์สเปิดและการให้สิทธิ์

Aspose.Words FOSS for Python ถูกปล่อยภายใต้ MIT License. คุณสามารถใช้ในโครงการส่วนบุคคล, ภายใน, และเชิงพาณิชย์โดยไม่ต้องเสียค่าลิขสิทธิ์. โค้ดต้นฉบับพร้อมให้ใช้งานบน GitHub.


เริ่มต้นใช้งาน