一、合并和拆分PDF文件的方式
PDF文件使用了工业标准的压缩算法,易于传输与储存。它还是页独立的,一个PDF文件包含一个或多个“页“,可以单独处理各页,特别适合多处理器系统的工作。PDF文件结构主要可以分为四个部分:首部、文件体、交叉引用表、尾部。PDF操作类库非常多,如下图所示,常用的类库有:Spire.Pdf、iTextSharp。
二、使用 Spire.Pdf 合并和拆分PDF文件
使用 Nuget 添加Spire.Pdf 类库,然后添加如下代码:
/// <summary> /// 合并PDF文件 /// </summary> /// <param name="files">待合并文件列表</param> /// <param name="outFile">合并生成的文件名称</param> static void SpirePdfMerge(string[] files, string outFile) { var doc = Spire.Pdf.PdfDocument.MergeFiles(files); doc.Save(outFile, FileFormat.PDF); } /// <summary> /// 按每页拆分PDF文件 /// </summary> /// <param name="inFile">待拆分PDF文件名称</param> static void SpirePdfSplit(string inFile) { var doc = new Spire.Pdf.PdfDocument(inFile); doc.Split("SpirePdf_拆分-{0}.pdf"); doc.Close(); }
三、使用 iTextSharp 合并和拆分PDF文件
使用 Spire.Pdf 操作PDF文件,简单高效,但生成的PDF文件带有水印,即使使用破解版在第一页还是有水印,我们可以使用 iTextSharp 类库,该类库生成的PDF无水印,具体使用如下:
/// <summary> /// 合并PDF文件 /// </summary> /// <param name="inFiles">待合并文件列表</param> /// <param name="outFile">合并生成的文件名称</param> static void iTextSharpPdfMerge(List<String> inFiles, String outFile) { using (var stream = new FileStream(outFile, FileMode.Create)) { using (var doc = new Document()) { using (var pdf = new PdfCopy(doc, stream)) { doc.Open(); inFiles.ForEach(file => { var reader = new PdfReader(file); for (int i = 0; i < reader.NumberOfPages; i++) { var page = pdf.GetImportedPage(reader, i + 1); pdf.AddPage(page); } pdf.FreeReader(reader); reader.Close(); }); } } } } /// <summary> /// 按每页拆分PDF文件 /// </summary> /// <param name="inFile">待拆分PDF文件名称</param> static void iTextSharpPdfSplit(string inFile) { using (var reader = new PdfReader(inFile)) { // 注意起始页是从1开始的 for (int i = 1; i <= new PdfReader(inFile).NumberOfPages; i++) { using (var sourceDocument = new Document(reader.GetPageSizeWithRotation(i))) { var pdfCopyProvider = new PdfCopy(sourceDocument, new System.IO.FileStream($"iTextSharp_拆分_{i}.pdf", System.IO.FileMode.Create)); sourceDocument.Open(); var importedPage = pdfCopyProvider.GetImportedPage(reader, i); pdfCopyProvider.AddPage(importedPage); } } } }
四、测试结果
完整代码如下:
using Spire.Pdf; using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Net.Mime; using System.Text; using System.Threading.Tasks; using iTextSharp.text; using iTextSharp.text.pdf; using PdfDocument = iTextSharp.text.pdf.PdfDocument; namespace Pdf { class Program { static void Main(string[] args) { try { SpirePdfMerge(Directory.GetFiles("Merge"), "SpirePdfMerge.pdf"); Console.WriteLine("使用 Spire.Pdf 合并文件完成..."); SpirePdfSplit($"{AppDomain.CurrentDomain.BaseDirectory}Split\\1.pdf"); Console.WriteLine("使用 Spire.Pdf 拆分文件完成..."); iTextSharpPdfMerge(Directory.GetFiles("Merge").ToList(), "iTextSharpPdfMerge.pdf"); Console.WriteLine("使用 iTextSharp 合并文件完成..."); iTextSharpPdfSplit($"{AppDomain.CurrentDomain.BaseDirectory}Split\\2.pdf"); Console.WriteLine("使用 iTextSharp 拆分文件完成..."); } catch (Exception e) { Console.WriteLine(e); } finally { Console.ReadKey(); } } #region Spire.Pdf /// <summary> /// 合并PDF文件 /// </summary> /// <param name="files">待合并文件列表</param> /// <param name="outFile">合并生成的文件名称</param> static void SpirePdfMerge(string[] files, string outFile) { var doc = Spire.Pdf.PdfDocument.MergeFiles(files); doc.Save(outFile, FileFormat.PDF); } /// <summary> /// 按每页拆分PDF文件 /// </summary> /// <param name="inFile">待拆分PDF文件名称</param> static void SpirePdfSplit(string inFile) { var doc = new Spire.Pdf.PdfDocument(inFile); doc.Split("SpirePdf_拆分-{0}.pdf"); doc.Close(); } #endregion #region iTextSharp.text.pdf /// <summary> /// 合并PDF文件 /// </summary> /// <param name="inFiles">待合并文件列表</param> /// <param name="outFile">合并生成的文件名称</param> static void iTextSharpPdfMerge(List<String> inFiles, String outFile) { using (var stream = new FileStream(outFile, FileMode.Create)) { using (var doc = new Document()) { using (var pdf = new PdfCopy(doc, stream)) { doc.Open(); inFiles.ForEach(file => { var reader = new PdfReader(file); for (int i = 0; i < reader.NumberOfPages; i++) { var page = pdf.GetImportedPage(reader, i + 1); pdf.AddPage(page); } pdf.FreeReader(reader); reader.Close(); }); } } } } /// <summary> /// 按每页拆分PDF文件 /// </summary> /// <param name="inFile">待拆分PDF文件名称</param> static void iTextSharpPdfSplit(string inFile) { using (var reader = new PdfReader(inFile)) { // 注意起始页是从1开始的 for (int i = 1; i <= new PdfReader(inFile).NumberOfPages; i++) { using (var sourceDocument = new Document(reader.GetPageSizeWithRotation(i))) { var pdfCopyProvider = new PdfCopy(sourceDocument, new System.IO.FileStream($"iTextSharp_拆分_{i}.pdf", System.IO.FileMode.Create)); sourceDocument.Open(); var importedPage = pdfCopyProvider.GetImportedPage(reader, i); pdfCopyProvider.AddPage(importedPage); } } } } #endregion } }
测试效果如下图所示:
以上就是C# 如何合并和拆分PDF文件的详细内容,更多关于C# 合并和拆分PDF文件的资料请关注自学编程网其它相关文章!
- 本文固定链接: https://zxbcw.cn/post/204474/
- 转载请注明:必须在正文中标注并保留原文链接
- QQ群: PHP高手阵营官方总群(344148542)
- QQ群: Yii2.0开发(304864863)