教程:使用C#将HTML网页转换为Word文件

发布于:2023-04-27 ⋅ 阅读:(1494) ⋅ 点赞:(0)

HTML文件经常用于创建,编辑或传达许多信息。同样,由于功能不同,Microsoft Word文件(包括DOCX和DOC)也很出名。在本文中将了解使用C#保真地将HTML网页文件转换为Word文件。(点击下载

  • 使用C#以编程方式将HTML网页转换为Word DOCX / DOC
  • 使用C#中的“高级选项”将HTML转换为Word(DOCX / DOC)

HTML文档处理控件Aspose.HTML功能演示:使用C#将HTML网页转换为Word文件

使用C#以编程方式将HTML网页转换为Word DOCX / DOC

让我们从一个简单的用例探讨HTML到DOCX / DOC的转换。我们将创建一个基本的HTML文件,然后执行转换。您需要按照以下步骤将HTML网页转换为Word文件(DOCX / DOC):

  • 编写一个简单的HTML文件
  • 加载输入的HTML文件
  • 初始化DocSaveOptions对象
  • 将HTML网页转换为Word DOCX

下面的代码显示了如何将HTML网页转换为Word文件,例如C#中的DOCX / DOC:

// Prepare an HTML code and save it to the file.
var code = @"Hello World!!";
System.IO.File.WriteAllText("document.html", code);

// Initialize an HTML document from the file
using (var document = new HTMLDocument("document.html"))
{
    // Initialize DocSaveOptions 
    var options = new Aspose.Html.Saving.DocSaveOptions();

    // Convert HTML webpage to DOCX
    Aspose.Html.Converters.Converter.ConvertHTML(document, options, "output.docx");
}

使用C#中的“高级选项”将HTML转换为Word(DOCX / DOC)

让我们再往前走一步。您可以使用DocSaveOptions对象更改页面的大小,页边距,背景色和其他属性。所有这些选项有助于更好地控制文件的转换方式。这可以帮助您实现要求,而无需关心基础文件格式。您应该按照以下步骤使用C#使用高级选项将HTML转换为DOCX:

  • 加载输入的HTML文件
  • 初始化DocSaveOptions对象
  • 指定页面尺寸(以英寸为单位)
  • 调用ConvertHTML方法以将HTML转换为Word DOCX

以下代码基于上述步骤,这些步骤显示了如何在C#中将HTML转换为Word DOCX文件:

// Prepare an HTML code and save it to the file
var code = @"Hello World!!";
System.IO.File.WriteAllText("document.html", code);

// Set A5 as a page-size
var options = new Aspose.Html.Saving.DocSaveOptions
{
    PageSetup =
    {
        AnyPage = new Aspose.Html.Drawing.Page()
        {
            Size = new Aspose.Html.Drawing.Size(Aspose.Html.Drawing.Length.FromInches(8.3f), Aspose.Html.Drawing.Length.FromInches(5.8f))
        }
    }
};

// Convert HTML document to DOCX
Aspose.Html.Converters.Converter.ConvertHTML("document.html", options, "output.docx");

如果您有任何疑问或需求,请随时加入Aspose技术交流群(761297826),我们很高兴为您提供查询和咨询。


网站公告

今日签到

点亮在社区的每一天
去签到