Uvod
Aspose.Words FOSS for Python pruža jednostavno API za pretvaranje Word dokumenata između formata. Document klasa učitava datoteke u pet ulaznih formata, a save() metoda izvozi u PDF, Markdown ili običan tekst.
Ovaj post prikazuje osnovne radne tokove konverzije, od konverzije jedne datoteke do grupne obrade kroz sve podržane formate.
Ključne značajke
Jednostruka konverzija dokumenta
Učitajte bilo koju podržanu ulaznu datoteku i pretvorite je u odredišni format s dva retka koda. Konstruktor Document prihvaća DOCX, DOC, RTF, TXT i Markdown datoteke.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Masovna konverzija u više formata
Pozovite save() više puta na istom učitanom dokumentu kako biste proizveli izlaze u svakom podržanom formatu bez ponovnog učitavanja ulazne datoteke.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
PDF izvoz s PdfSaveOptions
Koristite PdfSaveOptions za finu kontrolu PDF izlaza. Za zadane postavke, SaveFormat.PDF je dovoljna.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Izvoz u Markdown s MarkdownSaveOptions
MarkdownSaveOptions
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Ekstrakcija teksta
Izvucite sadržaj običnog teksta iz bilo kojeg učitanog dokumenta koristeći Document.get_text() bez zapisivanja u datoteku.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Brzi početak
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Podržani formati
| Format | Ekstenzija | Čitanje | Pisanje |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Open Source i licenciranje
Aspose.Words FOSS for Python objavljen je pod MIT licencom. Možete ga koristiti u osobnim, internim i komercijalnim projektima bez naknada za licencu. Izvorni kod dostupan je na GitHubu.