Aspose.HTML for Java 是一种高级 HTML 操作 API,用于在 Java 应用程序中操作和生成 HTML。 API 允许添加、删除、替换节点、提取 CSS 以及通过多种方式浏览文档。此外,API 提供了加载 EPUB 和 MHTML 的能力,并提供了允许通过 JavaScript 操作 DOM 的脚本。
Aspose.HTML for Java 支持文件间格式转换以加载 HTML 文档并以 XPS、PDF 和光栅图像(包括 JPEG、PNG、BMP 等)保存输出,并为 PDF 文件提供加密。

高级 Java HTML 处理 API 特性

从头开始创建 HTML 页面

加载现有文件

实施 W3C 规范

轻量级和独立的组件

插入、替换或删除节点

提取 CSS 样式信息

加载 EPUB 和 MHTML 文档格式

将 HTML 呈现为光栅图像

文档中的 API 功能

您可以在我们的文档中查看 Aspose.HTML 功能的完整列表。在您的项目中使用 Aspose.HTML for Java 库允许您执行以下任务:

  • 创建或打开来自不同来源的现有 HTML 文档(示例项目中的 Aspose.HTML.Examples.QuickStart.DocumentOpenTests)。
  • HTML 操作:通过 API 创建、编辑、删除和替换 HTML 节点。
  • 保存 HTML 文档。
  • 为特定的 HTML 节点提取 CSS 样式。
  • 配置影响 HTML 文档处理的文档沙箱。
  • 以不同方式浏览 HTML 文档。
  • 将 HTML 文档转换为各种支持的格式:JPEG、PNG、BMP、TIFF、PDF、XPS 等。

将 HTML 转换为 PDF 和 XPS 格式

API 支持将 HTML 渲染为最常用的光栅图像,包括 BMP、TIFF、JPEG、PNG、PDF 和 XPS 格式。开发人员可以通过为生成的固定布局格式配置 PageSetup 方面进行自定义,包括要呈现的页码、生成的页面大小或为嵌入图像设置 JPEG 压缩。

将 HTML 呈现为固定布局格式 - Java


     
    // Load a file to be rendered
    HTMLDocument htmdoc = new HTMLDocument(dir + "template.html");

    // Render HTML to PDF & XPS
    HtmlRenderer renderer = new HtmlRenderer();

    renderer.render(new PdfDevice(new PdfRenderingOptions(), dir + "output.pdf"), htmdoc);
    renderer.render(new XpsDevice(new XpsRenderingOptions(), dir + "output.xps"), htmdoc);


您可以尝试在线 HTML 转换器。

您还可以将 HTML、XHTML、MHTML、Markdown、EPUB 或 SVG 转换为许多其他文件格式,包括下面列出的几种:

转换为光栅图像

Aspose.HTML for Java 在其核心提供高保真渲染引擎,可以将 HTML 页面转换为最常用的光栅图像格式,包括 TIFF、BMP、PNG 和 JPEG,而无需任何额外的软件或工具。

处理 EPUB 和 MHTML 文件

该库能够加载 EPUB 和 MHTML 文件以执行各种操作,包括转换为固定布局和光栅图像格式。

HTML 节点导航

API 支持通过 XPath、元素或 CSS 选择器查询在 HTML 文件中导航,并且可以轻松地插入、提取、删除或替换节点。

提取锚点类型的所有节点 - Java


     
    // instance creation of HTMLDocument and loading HTML from URL
    HTMLDocument dct = new HTMLDocument("https://www.aspose.com");

    // get all anchor type nodes 
    NodeList nodelist = dct.getDocumentElement().querySelectorAll("a");

    // display anchor text & href values for all nodes
    for (Node node : nodelist){

        HTMLAnchorElement anchor = (HTMLAnchorElement)node;
        System.out.println("Text: " + node.getTextContent() + " Href: " + anchor.getHref());
    }



配置沙盒

HTML API 使您能够配置影响 HTML 文档处理的文档沙箱,即;在某些情况下,CSS 样式取决于屏幕尺寸。



  

Support and Learning Resources

  
  

Aspose.HTML 为其他流行的开发环境提供单独的 HTML 处理 API,如下所列: