Java HTML文件操作API

将包括CSS样式在内的HTML文档处理和呈现为PDF和Raster Image格式。

  下载免费试用版
Java的Aspose.HTML

Aspose.HTML for Java

 
 

Aspose.HTML for Java是高级HTML操纵API,用于在Java应用程序中操纵和生成HTML。API允许通过多种方式添加,删除,替换节点,提取CSS以及浏览文档。此外,API提供了加载EPUB和MHTML的功能,并提供了允许通过JavaScript处理DOM的脚本。

Aspose.HTML for Java支持文件间格式转换,以加载HTML文档并将输出保存在XPS,PDF和光栅图像(包括JPEG,PNG,BMP等)中,并为PDF文件提供加密。

 

先进的Java HTML处理API功能

 

 

从头开始创建HTML页面

 

加载现有文件

 

实施W3C规范

 

轻巧的独立组件

 

插入,替换或删除节点

 

提取CSS样式信息

 

加载EPUB和MHTML文档格式

 

渲染HTML到光栅图像

 

将HTML转换为XPS和PDF

从HTML渲染为PDF和XPS格式 

API支持将HTML呈现到最常用的光栅图像,包括BMP,TIFF,JPEG和PNG,PDF和XPS格式。开发人员可以通过配置PageSetup方面进行自定义,以生成最终的固定布局格式,包括要渲染的页码,生成的页面大小或为嵌入式图像设置JPEG压缩。

将HTML呈现为固定布局格式-Java

// load the file to be rendered
HTMLDocument htmdoc = new HTMLDocument(dir + "template.html");
// render to PDF & XPS
HtmlRenderer renderer = new HtmlRenderer();
renderer.render(new PdfDevice(new PdfRenderingOptions(), dir + "output.pdf"), htmdoc);
renderer.render(new XpsDevice(new XpsRenderingOptions(), dir + "output.xps"), htmdoc);

操纵ePub和MHTML文件

该库能够加载ePub和MHTML文件以执行各种操作,包括转换为固定布局和光栅图像格式。

HTML节点导航

API支持通过XPath,元素或CSS选择器查询浏览HTML文件,并且可以轻松插入,提取,删除或替换节点。

提取锚类型的所有节点-Java

// instance creation of HTMLDocument and loading HTML from URL
HTMLDocument dct = new HTMLDocument("https://www.aspose.com");
// get all anchor type nodes 
NodeList nodelist = dct.getDocumentElement().querySelectorAll("a");
// display anchor text & href values for all nodes
for (Node node : nodelist)
{
    HTMLAnchorElement anchor = (HTMLAnchorElement)node;
    System.out.println("Text: " + node.getTextContent() + " Href: " + anchor.getHref());
}
 

支持和学习资源

 
 

Aspose.HTML为其他流行的开发环境提供了单独的HTML处理API,如下所示: