最近一直在写net中c#关于文件的操作,包括导出数据至Excel、Word、Pdf,从Excel、Csv、Txt等文件导入数据。这篇应该是最后一篇关于文件操作的了,内容是关于文档互转的,比如Office转成Pdf、Html、图片等。
对标的是迅捷的Pdf文件转换器这个软件。老实说,这个软件很强大,但也很讨厌。动不动就要交钱,挺好用的功能,非要加N多限制。虽说是收费软件,但吃相也太难看了,差评。作为程序员不能惯他们毛病,自己整个出来。先看下主界面,支持多文件操作,采用异步+多线程模式,效率提高很多。
实现这些功能,主要用到这几个组件,分别是Aspose.Cells、Aspsoe.Word、Spire.Offfice。这2个组件有些功能是重叠的,哪个熟悉就用哪个。
部分功能源码
/// <summary> /// 将PDF文件转为Html文件 /// </summary> /// <param name="pdfFileFullName"></param> /// <param name="htmlFileFullName"></param> public static void FromPdfToHtml(string pdfFileFullName, string htmlFileFullName) { //源PDF文件 Aspose.Pdf.Document doc = new Aspose.Pdf.Document(pdfFileFullName); //设置输出的html文件格式 Aspose.Pdf.HtmlSaveOptions saveOptions = new Aspose.Pdf.HtmlSaveOptions(); saveOptions.FixedLayout = true; saveOptions.SplitIntoPages = false; saveOptions.RasterImagesSavingMode = Aspose.Pdf.HtmlSaveOptions.RasterImagesSavingModes.AsExternalPngFilesReferencedViaSvg; //将输出保存为HTML格式 doc.Save(htmlFileFullName, saveOptions); } /// <summary> /// 将PDF文件转为XPS文件 /// </summary> /// <param name="pdfFileFullName"></param> /// <param name="xpsFileFullName"></param> public static void FromPdfToXps(string pdfFileFullName, string xpsFileFullName) { Spire.Pdf.PdfDocument doc = new Spire.Pdf.PdfDocument(); doc.LoadFromFile(pdfFileFullName); doc.SaveToFile(xpsFileFullName, Spire.Pdf.FileFormat.XPS); doc.Close(); }
文档操作的教程就告一段落了,下一个话题是关于图片的,包括图片识别和图片编辑
文章评论