HTML文件经常用于创建,编辑或传达许多信息。同样,由于功能不同,Microsoft Word文件(包括DOCX和DOC)也很出名。在本文中将了解使用C#保真地将HTML网页文件转换为Word文件。(点击下载)
- 使用C#以编程方式将HTML网页转换为Word DOCX / DOC
- 使用C#中的“高级选项”将HTML转换为Word(DOCX / DOC)
使用C#以编程方式将HTML网页转换为Word DOCX / DOC
让我们从一个简单的用例探讨HTML到DOCX / DOC的转换。我们将创建一个基本的HTML文件,然后执行转换。您需要按照以下步骤将HTML网页转换为Word文件(DOCX / DOC):
- 编写一个简单的HTML文件
- 加载输入的HTML文件
- 初始化DocSaveOptions对象
- 将HTML网页转换为Word DOCX
下面的代码显示了如何将HTML网页转换为Word文件,例如C#中的DOCX / DOC:
// Prepare an HTML code and save it to the file. var code = @"Hello World!!"; System.IO.File.WriteAllText("document.html", code); // Initialize an HTML document from the file using (var document = new HTMLDocument("document.html")) { // Initialize DocSaveOptions var options = new Aspose.Html.Saving.DocSaveOptions(); // Convert HTML webpage to DOCX Aspose.Html.Converters.Converter.ConvertHTML(document, options, "output.docx"); }
使用C#中的“高级选项”将HTML转换为Word(DOCX / DOC)
让我们再往前走一步。您可以使用DocSaveOptions对象更改页面的大小,页边距,背景色和其他属性。所有这些选项有助于更好地控制文件的转换方式。这可以帮助您实现要求,而无需关心基础文件格式。您应该按照以下步骤使用C#使用高级选项将HTML转换为DOCX:
- 加载输入的HTML文件
- 初始化DocSaveOptions对象
- 指定页面尺寸(以英寸为单位)
- 调用ConvertHTML方法以将HTML转换为Word DOCX
以下代码基于上述步骤,这些步骤显示了如何在C#中将HTML转换为Word DOCX文件:
// Prepare an HTML code and save it to the file var code = @"Hello World!!"; System.IO.File.WriteAllText("document.html", code); // Set A5 as a page-size var options = new Aspose.Html.Saving.DocSaveOptions { PageSetup = { AnyPage = new Aspose.Html.Drawing.Page() { Size = new Aspose.Html.Drawing.Size(Aspose.Html.Drawing.Length.FromInches(8.3f), Aspose.Html.Drawing.Length.FromInches(5.8f)) } } }; // Convert HTML document to DOCX Aspose.Html.Converters.Converter.ConvertHTML("document.html", options, "output.docx");
如果您有任何疑问或需求,请随时加入Aspose技术交流群(761297826),我们很高兴为您提供查询和咨询。