Uvod

Aspose.Words FOSS for Python pruža jednostavno API za pretvaranje Word dokumenata između formata. Document klasa učitava datoteke u pet ulaznih formata, a save() metoda izvozi u PDF, Markdown ili običan tekst.

Ovaj post prikazuje osnovne radne tokove konverzije, od konverzije jedne datoteke do grupne obrade kroz sve podržane formate.


Ključne značajke

Jednostruka konverzija dokumenta

Učitajte bilo koju podržanu ulaznu datoteku i pretvorite je u odredišni format s dva retka koda. Konstruktor Document prihvaća DOCX, DOC, RTF, TXT i Markdown datoteke.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Masovna konverzija u više formata

Pozovite save() više puta na istom učitanom dokumentu kako biste proizveli izlaze u svakom podržanom formatu bez ponovnog učitavanja ulazne datoteke.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

PDF izvoz s PdfSaveOptions

Koristite PdfSaveOptions za finu kontrolu PDF izlaza. Za zadane postavke, SaveFormat.PDF je dovoljna.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Izvoz u Markdown s MarkdownSaveOptions

MarkdownSaveOptions

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Ekstrakcija teksta

Izvucite sadržaj običnog teksta iz bilo kojeg učitanog dokumenta koristeći Document.get_text() bez zapisivanja u datoteku.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Brzi početak

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Podržani formati

FormatEkstenzijaČitanjePisanje
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Open Source i licenciranje

Aspose.Words FOSS for Python objavljen je pod MIT licencom. Možete ga koristiti u osobnim, internim i komercijalnim projektima bez naknada za licencu. Izvorni kod dostupan je na GitHubu.


Početak