Hình ảnh đóng vai trò thiết yếu trong việc minh họa thông tin chính trong tài liệu Word. Chúng tăng cường sức hấp dẫn của tài liệu và cải thiện tổng thể cách trình bày của nó. Là một lập trình viên, bạn có thể được giao nhiệm vụ trích xuất các hình ảnh nhúng trong các tài liệu Word DOCX hoặc DOC. Trong hướng dẫn trích xuất hình ảnh Aspose.Words bằng C# này, chúng ta sẽ khám phá cách trích xuất hình ảnh từ tài liệu Word một cách lập trình bằng C# và Plugin Aspose. Bạn cũng sẽ học cách lưu các hình ảnh đã trích xuất vào vị trí mong muốn của bạn.
.NET API cho việc Trích xuất Hình ảnh từ Tài liệu Word
Để trích xuất hình ảnh từ các tài liệu Microsoft Word DOCX/DOC, chúng ta sẽ sử dụng Aspose.Words cho .NET. Đây là một API mạnh mẽ và được sử dụng rộng rãi để tạo và thao tác tài liệu Word và có thể được hoàn thiện bằng Plugin $99 để thêm tính năng. Bạn có thể tải xuống DLL của API và thêm tham chiếu của nó vào ứng dụng của bạn. Ngoài ra, bạn có thể cài đặt nó trực tiếp từ NuGet bằng cách sử dụng bảng điều khiển quản lý gói.
PM> Cài đặt-Gói Aspose.Words
Trích xuất Hình ảnh từ Tài liệu Word trong C#
Trong các tài liệu Word, hình ảnh được đại diện dưới dạng các hình dạng. Do đó, để trích xuất hình ảnh từ các tài liệu Word được bảo vệ hoặc các tệp DOCX tiêu chuẩn, bạn phải xử lý tất cả các hình dạng trong tài liệu. Các bước sau đây mô tả cách trích xuất hình ảnh từ DOCX trong C# một cách lập trình.
- Tải tài liệu Word bằng cách sử dụng lớp Document.
- Lấy tất cả các hình dạng chứa hình ảnh vào một đối tượng IEnumerable bằng cách sử dụng phương thức Document.GetChildNodes(NodeType.Shape, Boolean).
- Lặp qua các hình dạng đã thu thập.
- Trong mỗi vòng lặp, trích xuất hình ảnh và lưu nó bằng phương thức Shape.ImageData.Save(string).
Mẫu mã sau đây minh họa cách trích xuất hình ảnh từ tài liệu Word trong C#:
// Tải tài liệu
Document doc = new Document("input.docx");
// Lấy tất cả các hình dạng chứa hình ảnh
NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);
// Trích xuất và lưu mỗi hình ảnh
foreach (Shape shape in shapes)
{
if (shape.ImageData.HasImage)
{
// Trích xuất đường dẫn tệp hình ảnh
string imagePath = $"Hình_#{shape.Name}.png";
shape.ImageData.Save(imagePath);
}
}
Thử Aspose.Words cho .NET Miễn Phí
Bạn có thể nhận giấy phép tạm thời miễn phí để thử Aspose.Words cho .NET mà không bị hạn chế. Nhận giấy phép tạm thời của bạn ngay bây giờ.
Kết luận
Hình ảnh đã trở thành một phần thiết yếu của các tài liệu Word, làm cho nội dung trở nên thu hút hơn về mặt hình ảnh. Do đó, Aspose.Words cho .NET, được bổ sung bởi thư viện .NET để trích xuất hình ảnh từ Word, cung cấp nhiều tính năng để thêm hoặc thao tác hình ảnh trong các tài liệu Word.
Bài viết này đã đề cập cụ thể đến việc trích xuất hình ảnh từ các tài liệu Word bằng C#. Với sự trợ giúp của một mã mẫu, bạn đã học cách trích xuất một cách lập trình tất cả hình ảnh từ một tệp DOCX/DOC và lưu chúng vào một thư mục. Bạn có thể tìm hiểu thêm về Aspose.Words cho .NET qua tài liệu. Nếu bạn có bất kỳ câu hỏi nào, hãy cảm thấy tự do để liên hệ qua diễn đàn của chúng tôi.
Xem thêm
Mẹo: Nếu bạn bao giờ cần chuyển đổi một tài liệu Word từ một bài trình bày PowerPoint, hãy xem xét việc sử dụng bộ chuyển đổi Trình bày sang Tài liệu Word của Aspose.