Wprowadzenie
Aspose.Words FOSS for Python zapewnia prosty interfejs API do konwertowania dokumentów Word między formatami. Klasa Document ładuje pliki w pięciu formatach wejściowych, a metoda save() eksportuje do PDF, Markdown lub zwykłego tekstu.
Ten wpis przechodzi przez podstawowe przepływy konwersji, od konwersji pojedynczego pliku po przetwarzanie wsadowe we wszystkich obsługiwanych formatach.
Kluczowe funkcje
Konwersja pojedynczego dokumentu
Załaduj dowolny obsługiwany plik wejściowy i przekonwertuj go na format docelowy w dwóch linijkach kodu. Konstruktor Document akceptuje pliki DOCX, DOC, RTF, TXT i Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Konwersja wsadowa do wielu formatów
Wywołaj save() wielokrotnie na tym samym załadowanym dokumencie, aby wygenerować wyjścia we wszystkich obsługiwanych formatach bez ponownego ładowania pliku wejściowego.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
Eksport PDF z PdfSaveOptions
Użyj PdfSaveOptions do precyzyjnej kontroli nad wyjściem PDF. Dla ustawień domyślnych SaveFormat.PDF jest wystarczające.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Eksport Markdown z użyciem MarkdownSaveOptions
Użyj MarkdownSaveOptions do dodatkowej kontroli nad formatowaniem wyjścia Markdown.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Ekstrakcja tekstu
Wyodrębnij zawartość tekstu zwykłego z dowolnego załadowanego dokumentu przy użyciu Document.get_text() bez zapisywania do pliku.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Szybki start
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Obsługiwane formaty
| Format | Extension | Odczyt | Zapis |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Open Source i licencjonowanie
Aspose.Words FOSS for Python jest udostępniany na licencji MIT. Możesz go używać w projektach osobistych, wewnętrznych i komercyjnych bez opłat licencyjnych. Kod źródłowy jest dostępny na GitHub.