Wprowadzenie

Aspose.Words FOSS for Python zapewnia prosty interfejs API do konwertowania dokumentów Word między formatami. Klasa Document ładuje pliki w pięciu formatach wejściowych, a metoda save() eksportuje do PDF, Markdown lub zwykłego tekstu.

Ten wpis przechodzi przez podstawowe przepływy konwersji, od konwersji pojedynczego pliku po przetwarzanie wsadowe we wszystkich obsługiwanych formatach.


Kluczowe funkcje

Konwersja pojedynczego dokumentu

Załaduj dowolny obsługiwany plik wejściowy i przekonwertuj go na format docelowy w dwóch linijkach kodu. Konstruktor Document akceptuje pliki DOCX, DOC, RTF, TXT i Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Konwersja wsadowa do wielu formatów

Wywołaj save() wielokrotnie na tym samym załadowanym dokumencie, aby wygenerować wyjścia we wszystkich obsługiwanych formatach bez ponownego ładowania pliku wejściowego.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

Eksport PDF z PdfSaveOptions

Użyj PdfSaveOptions do precyzyjnej kontroli nad wyjściem PDF. Dla ustawień domyślnych SaveFormat.PDF jest wystarczające.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Eksport Markdown z użyciem MarkdownSaveOptions

Użyj MarkdownSaveOptions do dodatkowej kontroli nad formatowaniem wyjścia Markdown.

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Ekstrakcja tekstu

Wyodrębnij zawartość tekstu zwykłego z dowolnego załadowanego dokumentu przy użyciu Document.get_text() bez zapisywania do pliku.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Szybki start

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Obsługiwane formaty

FormatExtensionOdczytZapis
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Open Source i licencjonowanie

Aspose.Words FOSS for Python jest udostępniany na licencji MIT. Możesz go używać w projektach osobistych, wewnętrznych i komercyjnych bez opłat licencyjnych. Kod źródłowy jest dostępny na GitHub.


Rozpoczęcie