Document 类是 Aspose.PDF FOSS for .NET 的核心。它代表一个完整的 PDF,并提供对内部每个结构的访问——页面、注释、表单字段、元数据和嵌入文件。
打开文档
从文件、字节数组或流加载 PDF:
using var doc = Document.Open(File.ReadAllBytes("input.pdf"));
Console.WriteLine($"Pages: {doc.Pages.Count}");
页面使用基于 1 的索引:doc.Pages[1] 是第一页。
从头开始创建
using var doc = new Document();
var page = doc.Pages.Add();
page.Paragraphs.Add(new TextFragment("Hello, PDF!"));
doc.Save("hello.pdf");
表格、浮动框、页眉/页脚以及图表都是布局引擎自动放置的段落类型。
页面操作
设置页面几何形状、旋转和边界框:
var page = doc.Pages[1];
page.SetMediaBox(new Rectangle(0, 0, 612, 792));
page.SetCropBox(new Rectangle(36, 36, 576, 756));
page.SetRotation(90);
转换
该库包含针对多种输出格式的专用转换器:
| 转换器 | 输出 |
|---|---|
PdfToHtmlConverter | HTML |
PdfToMarkdownConverter | Markdown |
PdfToSvgConverter | SVG |
PdfToTextConverter | 纯文本 |
渲染为光栅图像使用设备类(PngDevice, JpegDevice, TiffDevice, BmpDevice),每个接受以 DPI 为单位的 Resolution。
PDF/A 合规性
验证并将文档转换为 PDF/A-1B、PDF/A-2B 或 PDF/A-3B:
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");
入门
dotnet add package Aspose.Pdf.Foss
有关完整的 API 详细信息,请参阅
Document Management developer guide
以及
Conversion and Optimization guide。