从零开始:C# 解析docx提取文本-无需安装office软件且完美支持aot

docx 文件是 Microsoft Office Word 使用的基于 XML 的文件格式,Open XML。Open XML 格式使用 zip 压缩技术来存储文档,从而节省潜在的成本。 在打开文件时,Office程序会自动对文件进行解压。 在保存文件时,会再次对文件自动进行压缩。 比如可以把任意docx,pptx文件后缀改为.zip,可以看到压缩包中有多个xml格式文件和图片素材。

赞(0)
未经允许不得转载:小狮博客 » 从零开始:C# 解析docx提取文本-无需安装office软件且完美支持aot
分享到: 更多 (0)

联系我们