परिचय

Aspose.Words FOSS एक ओपन‑सोर्स Python लाइब्रेरी है जो Word दस्तावेज़ों के साथ काम करने के लिए है। यह DOCX, DOC, RTF, TXT, और Markdown फ़ाइलें पढ़ती है, और उन्हें PDF, Markdown, या साधारण टेक्स्ट में निर्यात कर सकती है — सभी बिना Microsoft Word या किसी भी नेटिव निर्भरताओं की आवश्यकता के।

लाइब्रेरी MIT लाइसेंस के तहत जारी की गई है और PyPI पर उपलब्ध है। इसे इस प्रकार स्थापित करें:

pip install aspose-words-foss>=26.4.0

Aspose.Words FOSS को Python 3.10 या बाद का संस्करण चाहिए और यह तीन शुद्ध‑Python पैकेजों (olefile, fpdf2, pydantic) पर निर्भर करता है, जो pip द्वारा स्वचालित रूप से स्थापित होते हैं।


मुख्य विशेषताएँ

दस्तावेज़ लोडिंग और रूपांतरण

Document क्लास प्राथमिक प्रवेश बिंदु है। किसी भी समर्थित इनपुट फ़ॉर्मेट में फ़ाइल लोड करें और save() को कॉल करके इसे किसी अन्य आउटपुट फ़ॉर्मेट में परिवर्तित करें।

import aspose.words_foss as aw

doc = aw.Document("input.docx")  # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)

PDF निर्यात

डिफ़ॉल्ट सेटिंग्स के लिए SaveFormat.PDF का उपयोग करके वर्ड दस्तावेज़ों को पीडीएफ में निर्यात करें या सूक्ष्म नियंत्रण के लिए PdfSaveOptions का उपयोग करें।

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Markdown निर्यात सहेजने के विकल्पों के साथ

आउटपुट फ़ॉर्मेटिंग पर सूक्ष्म नियंत्रण के लिए MarkdownSaveOptions और PdfSaveOptions का उपयोग करें।

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions, PdfSaveOptions

doc = aw.Document("input.docx")

md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

पाठ निष्कर्षण

Document.get_text() का उपयोग करके किसी भी समर्थित दस्तावेज़ फ़ॉर्मेट से सादा पाठ निकालें।

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

दस्तावेज़ संरचना पार्सिंग

विशेषीकृत पार्सर DOCX आंतरिक भागों से संरचित डेटा निकालते हैं। NumberingParser सूची क्रमांकन परिभाषाओं को पढ़ता है और StyleParser शैली नामों को संरचित वस्तुओं में पार्स करता है।

बहु-फ़ॉर्मेट इनपुट समर्थन

एक ही Document कंस्ट्रक्टर का उपयोग करके पाँच इनपुट फ़ॉर्मैट — DOCX, DOC, RTF, TXT, और Markdown — से दस्तावेज़ लोड करें। LoadFormat एन्‍युम स्पष्ट फ़ॉर्मैट चयन के लिए स्थिरांक प्रदान करता है (LoadFormat.DOCX, LoadFormat.DOC, LoadFormat.RTF, LoadFormat.TEXT, LoadFormat.MARKDOWN)।


त्वरित प्रारंभ

पैकेज इंस्टॉल करें और एक DOCX फ़ाइल को सभी तीन आउटपुट फ़ॉर्मैट्स में बदलें:

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("report.docx")

# Export to Markdown
doc.save("report.md", aw.SaveFormat.MARKDOWN)

# Export to PDF
doc.save("report.pdf", aw.SaveFormat.PDF)

# Export to plain text
doc.save("report.txt", aw.SaveFormat.TEXT)

# Extract text directly
text = doc.get_text()
print(f"Extracted {len(text)} characters")

समर्थित फ़ॉर्मेट

फ़ॉर्मेटएक्सटेंशनपढ़ेंलिखें
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

ओपन सोर्स और लाइसेंसिंग

Aspose.Words FOSS for Python को MIT License के तहत जारी किया गया है। आप इसे व्यक्तिगत, आंतरिक और व्यावसायिक परियोजनाओं में बिना लाइसेंस शुल्क के स्वतंत्र रूप से उपयोग कर सकते हैं। पूर्ण स्रोत कोड GitHub पर Aspose Words FOSS organization में उपलब्ध है।


शुरू करना