从头开始创建HTML页面
从文件,流或URL加载现有的HTML
实施W3C规范
使用模板合并实施模板
用各种数据源填充模板
将HTML Canvas 2D渲染为PDF
添加,替换或删除节点
从HTML文档中提取数据
加载EPUB和MHTML文件格式
将HTML渲染为光栅图像格式
一次渲染多个文档
实现Markdown到HTML转换器
在HTML到PDF的过程中应用页眉和页脚
API仅需几行代码即可为您的.NET应用程序实现HTML到PDF,HTML到图像或任何其他转换。
// Load the HTML file to be converted
using (var document = new Aspose.Html.HTMLDocument("document.html"))
{
// Convert HTML to PDF
Aspose.Html.Converters.Converter.ConvertHTML(document, new PdfSaveOptions(), "output.pdf");
// Convert HTML to Image
Aspose.Html.Converters.Converter.ConvertHTML(document, new ImageSaveOptions(ImageFormat.Png), "output.png");
}
Markdown是一种具有纯文本格式语法的标记语言。Markdown经常被用作文档和自述文件的格式,因为它允许以易于阅读和易于编写的方式进行书写。Aspose.HTML提供了功能强大且灵活的Markdown转换器,可以在从Markdown到HTML以及从HTML到Markdown的两个方向上进行转换。此外,转换器API具有一组预定义的规则,因此您可以使用真实的Markdown语法,GitLab风味的Markdown修改将HTML转换为Markdown,甚至可以根据需要配置规则。
// Load HTML file
using (var document = new Aspose.Html.HTMLDocument("document.html"))
{
// Convert HTML to Markdown using a set of features supported by GitLab Flavored Markdown
document.Save("output.md", Aspose.Html.Saving.MarkdownSaveOptions.Git);
}
// Convert Markdown to HTML
Aspose.Html.Converters.Converter.ConvertMarkdown("document.md", "output.html");
开箱即用地支持电子书(EPUB)格式和Web存档(MHTML)格式。API提供高保真度的渲染EPUB和MHTML文件为受支持的输出格式,例如PDF,XPS和Image文件格式。
// Convert EPUB to PDF.
Aspose.Html.Converters.Converter.ConvertEPUB("document.epub", new Aspose.Html.Saving.PdfSaveOptions(), "output.pdf");
// Convert MHTML to PDF.
Aspose.Html.Converters.Converter.ConvertMHTML("document.mht", new Aspose.Html.Saving.PdfSaveOptions(), "output.pdf");
Web抓取(也称为Web收集,Web数据提取或Web爬网)是一种从网站提取数据的技术。Aspose.HTML不支持现成的Web Scraping模块。但是,使用完全基于W3C规范并支持XPath和CSS选择器查询的Aspose.HTML API,您可以轻松地检查任何HTML文档的内容并创建自己的Web Scraping解决方案。
// Create an instance of the HTML document with a website as a parameter.
using (var document = new Aspose.Html.HTMLDocument("https://en.wikipedia.org/wiki/Aspose_API"))
{
// Get all anchor-elements
var elements = document.QuerySelectorAll("a");
// Dump the anchor-element data to the console.
elements.Cast<HTMLAnchorElement>().ToList().ForEach(x =>
{
System.Console.WriteLine("[Href]: " + x.Href);
System.Console.WriteLine("[Content]: " + x.TextContent);
});
}