บทนำ
Aspose.Words FOSS for Python ให้ API ที่ตรงไปตรงมาสำหรับการแปลงเอกสาร Word ระหว่างรูปแบบต่าง ๆ คลาส Document โหลดไฟล์ในห้ารูปแบบอินพุตและเมธอด save() ส่งออกเป็น PDF, Markdown หรือข้อความธรรมดา.
โพสต์นี้จะพาไปสำรวจกระบวนการแปลงหลัก ตั้งแต่การแปลงไฟล์เดี่ยวจนถึงการประมวลผลแบบชุดสำหรับทุกรูปแบบที่รองรับ.
คุณสมบัติหลัก
การแปลงเอกสารเดี่ยว
โหลดไฟล์อินพุตที่รองรับใด ๆ แล้วแปลงเป็นรูปแบบเป้าหมายด้วยสองบรรทัดของโค้ด ตัวสร้าง Document รองรับไฟล์ DOCX, DOC, RTF, TXT และ Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
การแปลงเป็นชุดหลายรูปแบบ
เรียก save() หลายครั้งบนเอกสารที่โหลดแล้วเดียวกันเพื่อสร้างผลลัพธ์ในทุกรูปแบบที่รองรับโดยไม่ต้องโหลดไฟล์อินพุตใหม่.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
การส่งออก PDF ด้วย PdfSaveOptions
ใช้ PdfSaveOptions เพื่อควบคุมการส่งออก PDF อย่างละเอียด. สำหรับการตั้งค่าเริ่มต้น, SaveFormat.PDF เพียงพอ.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
การส่งออก Markdown ด้วย MarkdownSaveOptions
MarkdownSaveOptions
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
การสกัดข้อความ
ดึงเนื้อหาข้อความธรรมดาจากเอกสารที่โหลดใด ๆ ด้วยการใช้ Document.get_text() โดยไม่ต้องเขียนลงไฟล์.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
เริ่มต้นอย่างเร็ว
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
รูปแบบที่รองรับ
| รูปแบบ | ส่วนขยาย | อ่าน | เขียน |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
ซอร์สเปิดและการให้สิทธิ์
Aspose.Words FOSS for Python ถูกปล่อยภายใต้ MIT License. คุณสามารถใช้ในโครงการส่วนบุคคล, ภายใน, และเชิงพาณิชย์โดยไม่ต้องเสียค่าลิขสิทธิ์. โค้ดต้นฉบับพร้อมให้ใช้งานบน GitHub.