最近一直在写net中c#关于文件的操作,包括导出数据至Excel、Word、Pdf,从Excel、Csv、Txt等文件导入数据。这篇应该是最后一篇关于文件操作的了,内容是关于文档互转的,比如Office转成Pdf、Html、图片等。
对标的是迅捷的Pdf文件转换器这个软件。老实说,这个软件很强大,但也很讨厌。动不动就要交钱,挺好用的功能,非要加N多限制。虽说是收费软件,但吃相也太难看了,差评。作为程序员不能惯他们毛病,自己整个出来。先看下主界面,支持多文件操作,采用异步+多线程模式,效率提高很多。
实现这些功能,主要用到这几个组件,分别是Aspose.Cells、Aspsoe.Word、Spire.Offfice。这2个组件有些功能是重叠的,哪个熟悉就用哪个。
部分功能源码
/// <summary>
/// 将PDF文件转为Html文件
/// </summary>
/// <param name="pdfFileFullName"></param>
/// <param name="htmlFileFullName"></param>
public static void FromPdfToHtml(string pdfFileFullName, string htmlFileFullName)
{
//源PDF文件
Aspose.Pdf.Document doc = new Aspose.Pdf.Document(pdfFileFullName);
//设置输出的html文件格式
Aspose.Pdf.HtmlSaveOptions saveOptions = new Aspose.Pdf.HtmlSaveOptions();
saveOptions.FixedLayout = true;
saveOptions.SplitIntoPages = false;
saveOptions.RasterImagesSavingMode = Aspose.Pdf.HtmlSaveOptions.RasterImagesSavingModes.AsExternalPngFilesReferencedViaSvg;
//将输出保存为HTML格式
doc.Save(htmlFileFullName, saveOptions);
}
/// <summary>
/// 将PDF文件转为XPS文件
/// </summary>
/// <param name="pdfFileFullName"></param>
/// <param name="xpsFileFullName"></param>
public static void FromPdfToXps(string pdfFileFullName, string xpsFileFullName)
{
Spire.Pdf.PdfDocument doc = new Spire.Pdf.PdfDocument();
doc.LoadFromFile(pdfFileFullName);
doc.SaveToFile(xpsFileFullName, Spire.Pdf.FileFormat.XPS);
doc.Close();
}
文档操作的教程就告一段落了,下一个话题是关于图片的,包括图片识别和图片编辑



文章评论