Uvod
Aspose.Words FOSS for Python pruža jednostavan API za konvertovanje Word dokumenata između formata. Klasa Document učitava fajlove u pet ulaznih formata, a metoda save() izvozi u PDF, Markdown ili običan tekst.
Ovaj post prolazi kroz osnovne radne tokove konverzije, od konverzije pojedinačnog fajla do grupne obrade kroz sve podržane formate.
Ključne karakteristike
Jednostruka konverzija dokumenta
Učitajte bilo koji podržani ulazni fajl i konvertujte ga u ciljani format sa dva reda koda. Konstruktor Document prihvata DOCX, DOC, RTF, TXT i Markdown fajlove.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Пакетна конверзија у више формата
Pozovite save() više puta na istom učitanom dokumentu da biste proizveli izlaze u svakom podržanom formatu bez ponovnog učitavanja ulaznog fajla.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
PDF izvoz sa PdfSaveOptions
Koristite PdfSaveOptions za finu kontrolu PDF izlaza. Za podrazumevana podešavanja, SaveFormat.PDF je dovoljna.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Markdown izvoz uz MarkdownSaveOptions
MarkdownSaveOptions
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Извлачење текста
Izvucite sadržaj običnog teksta iz bilo kog učitanog dokumenta koristeći Document.get_text() bez upisivanja u datoteku.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Brzi početak
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Podržani formati
| Format | Ekstenzija | Čitanje | Pisanje |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Отворени извор и лиценцирање
Aspose.Words FOSS za Python je objavljen pod MIT licencom. Možete ga koristiti u ličnim, internim i komercijalnim projektima bez naknada za licencu. Izvorni kod je dostupan na GitHub-u.