Aspose.HTML for .NET 是一种高级 HTML 处理 API,用于在跨平台应用程序中执行广泛的管理和操作任务。 API 旨在创建、修改、提取数据、转换和呈现 HTML 文档,而无需任何外部软件。此外,它还支持流行的文件格式,如 EPUB、MHTML、XML、SVG 和 Markdown,以及呈现为 PDF、DOCX、XPS 和图像文件格式。 Aspose.HTML for .NET 完全用 C# 编写,可用于构建任何类型的 32 位或 64 位 .NET 应用程序,包括 ASP.NET、WCF、WinForms 和 .NET Core。此外,HTML 文档对象模型集成了嵌入式格式和规范,例如 CSS、HTML Canvas、SVG、XPath 和 JavaScript,开箱即用,扩展了操作功能和渲染质量。

高级 .NET HTML API 功能

实施 W3C 规范

用各种数据源填充模板

加载 EPUB 和 MHTML 文件格式

一次渲染多个文档

在 HTML 到 PDF 期间应用页眉和页脚

从 Web 中提取数据

文档中的 API 功能

您可以在我们的文档中查看完整的 Aspose.HTML 功能列表。在您的项目中使用 Aspose.HTML C# 库允许您执行以下任务:

在 C# 中将 HTML 转换为 PDF、图像和其他格式

C# API 只需几行代码就可以为您的 .NET 应用程序实现 HTML 到 PDF、HTML 到图像或任何其他转换。转换过程简单可靠,因此使 Aspose.HTML for .NET API 成为完美的选择。

将 HTML 转换为 PDF – C#



using Aspose.HTML;
using Aspose.HTML.Saving;
using Aspose.HTML.Converters;
...

    // Load an HTML file to be converted
    using var document = new HTMLDocument("input.html")

    // Create an instance of the PdfSaveOptions class
    var pdfSaveOptions = new PdfSaveOptions();

    // Convert HTML to PDF
    Converter.ConvertHTML(document, pdfSaveOptions, "output.pdf");


您可以在 此处尝试在线 HTML 转换器。

您还可以将 HTML、XHTML、MHTML、Markdown、EPUB 或 SVG 转换为许多其他文件格式,包括下面列出的几种文件格式:

合并 HTML、MHTML、EPUB 和 MD 文件

Aspose.HTML for .NET API 使开发人员的文件合并过程更容易:使用 HTMLDocument 类加载文件; 创建 Renderer 实例和所需的输出设备; 使用 Render() 方法合并所有 HTML 文档。
此外,您可以实时合并文件! 将 HTML、MHTML、Markdown 和 EPUB 组合成 PDF、XPS、DOCX、TIFF 和许多其他文件格式:

编辑 HTML 文档

Aspose.HTML for .NET 允许您使用文档对象模型 (DOM) 创建和编辑 HTML 文档。 DOM 是 HTML 文档的编程接口,将文档(作为节点和对象)表示为节点树,其中每个节点代表文档的一部分。 Aspose.HTML for .NET API 允许您连接到页面并可以更改文档结构、样式和内容。您可以通过插入新节点以及删除或编辑现有节点的内容来修改文档。

.NET HTML API 帮助开发人员阅读、修改、导航和编辑 (X)HTML 文档。 Aspose.HTML for .NET API 可以执行的一些文件编辑功能如下:

  • 使用各种方法导航 HTML 文档,例如元素遍历、文档遍历、XPath 查询和 CSS 选择器查询,
  • 删除和替换 HTML 节点,
  • 从 HTML 中提取和编辑 CSS,
  • 配置文档沙箱等。

您可以使用以下工具轻松地在线或以编程方式编辑文档、生成 HTML 代码以及从网络上抓取数据:

降价支持

Markdown 是一种具有纯文本格式语法的标记语言。 Markdown 通常用作文档和自述文件的格式,因为它允许以易于阅读和易于编写的风格进行编写。 Aspose.HTML 提供了一个强大而灵活的 Markdown 转换器,可以双向转换从 Markdown 到 HTML 和从 HTML 到 Markdown。此外,转换器 API 具有一组预定义的规则,因此您可以使用正宗的 Markdown 语法、GitLab Flavored Markdown 修改将 HTML 转换为 Markdown,甚至可以根据需要配置规则。

将 HTML 转换为 Markdown – C#



using Aspose.Html;
using Aspose.HTML.Saving;
...

	// Load an HTML file
	using var document = new HTMLDocument("document.html");

	// Convert HTML to Markdown using a set of features supported by GitLab Flavored Markdown
	document.Save("output.md", MarkdownSaveOptions.Git);


反向转换就是这么简单!在您的 C# 应用程序中使用 Aspose.HTML 类库,您只需一行代码即可轻松地将 Markdown 转换为 HTML 文件!

将 Markdown 转换为 HTML – C#



using Aspose.Html.Converters;
...

	// Convert Markdown to HTML
	Converter.ConvertMarkdown("document.md", "output.html");



您可以在 此处尝试在线 Markdown 转换器。 您可以转换 Markdown转换为 PDF、XPS、DOCX、JPG、PNG、BMP、TIFF、GIF 和 MHTML。上传、转换您的文档并在几秒钟内获得结果。您不需要任何额外的软件。

Aspose.HTML for .NET 库为 C# 平台提供了 Markdown 解析 API。 您可以通过以下链接创建、编辑、保存、合并、转换 MD 文件为其他文件格式,以及将链接、列表、代码块、图像和其他元素添加到 Markdown 文件中:

电子书和网络档案

Aspose.HTML for .NET 能够加载 ePub 和 MHTML 文件以执行各种操作,包括转换为固定布局和光栅图像格式。

将 EPUB 转换为 PDF – C#



using Aspose.Html.Converters;
using Aspose.Html.Saving;
...

	// Open an existing EPUB file for reading
    using var stream = File.OpenRead("input.epub");
    
    // Create an instance of PdfSaveOptions
    var options = new PdfSaveOptions();
    
    // Call the ConvertEPUB method to convert EPUB to PDF
    Converter.ConvertEPUB(stream, options, "output.pdf");


将 MHTML 转换为 PDF – C#



using Aspose.Html.Converters;
using Aspose.Html.Saving;
...

	 // Open an existing MHTML file for reading
     using var stream = File.OpenRead("input.mht");
    
     // Create an instance of PdfSaveOptions
     var options = new PdfSaveOptions();
    
     // Call the ConvertMHTML method to convert MHTML to PDF
     Converter.ConvertMHTML(stream, options, output.pdf);



您可以在线尝试MHTML Converter和在线 EPUB 转换器。 我们基于浏览器的转换工具适用于所有平台,包括 Windows 、Linux、Mac OS、Android 和 iOS。转换器与所有 PC 设备、智能手机和平板电脑兼容。

网页抓取

网络抓取,也称为网络收获、网络数据提取或网络爬虫,是一种从网站中提取数据的技术。 Aspose.HTML 不支持开箱即用的 Web Scraping 模块。但是,使用完全基于 W3C 规范并支持 XPath 和 CSS 选择器查询的 Aspose.HTML API,您可以轻松检查任何 HTML 文档的内容并创建自己的 Web Scraping 解决方案。

简单的 Web 数据提取 – C#



using Aspose.Html;
...

    // Create an instance of the HTML document with a website as a parameter
    using var document = new Aspose.Html.HTMLDocument("https://en.wikipedia.org/wiki/Aspose_API");

    // Get all anchor-elements
    var elements = document.QuerySelectorAll("a");

    // Dump the anchor-element data to the console
    elements.Cast<HTMLAnchorElement>().ToList().ForEach(x =>
        {
            System.Console.WriteLine("[Href]: " + x.Href);
            System.Console.WriteLine("[Content]: " + x.TextContent);
        });



Aspose.HTML 提供免费的在线 数据抓取工具 应用程序从网站获取数据的方法。我们的应用程序是安全的,可以在任何平台上运行,并且不需要安装任何软件。数据抓取器可用于图像提取、从网页中获取关键字等。它们使用简单明了,但功能强大且可靠。

其他受支持的 Aspose.HTML for .NET API 功能

使用 Aspose.HTML C# 库来转换、合并、编辑 HTML 文档,从网络中提取数据等等!



  

Support and Learning Resources

  
  

Aspose.HTML 为其他流行的开发环境提供单独的 HTML 处理 API,如下所列: