Uvod

Aspose.Words FOSS for Python pruža jednostavan API za konvertovanje Word dokumenata između formata. Klasa Document učitava fajlove u pet ulaznih formata, a metoda save() izvozi u PDF, Markdown ili običan tekst.

Ovaj post prolazi kroz osnovne radne tokove konverzije, od konverzije pojedinačnog fajla do grupne obrade kroz sve podržane formate.


Ključne karakteristike

Jednostruka konverzija dokumenta

Učitajte bilo koji podržani ulazni fajl i konvertujte ga u ciljani format sa dva reda koda. Konstruktor Document prihvata DOCX, DOC, RTF, TXT i Markdown fajlove.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Пакетна конверзија у више формата

Pozovite save() više puta na istom učitanom dokumentu da biste proizveli izlaze u svakom podržanom formatu bez ponovnog učitavanja ulaznog fajla.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

PDF izvoz sa PdfSaveOptions

Koristite PdfSaveOptions za finu kontrolu PDF izlaza. Za podrazumevana podešavanja, SaveFormat.PDF je dovoljna.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Markdown izvoz uz MarkdownSaveOptions

MarkdownSaveOptions

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Извлачење текста

Izvucite sadržaj običnog teksta iz bilo kog učitanog dokumenta koristeći Document.get_text() bez upisivanja u datoteku.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Brzi početak

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Podržani formati

FormatEkstenzijaČitanjePisanje
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Отворени извор и лиценцирање

Aspose.Words FOSS za Python je objavljen pod MIT licencom. Možete ga koristiti u ličnim, internim i komercijalnim projektima bez naknada za licencu. Izvorni kod je dostupan na GitHub-u.


Početak