C# 使用 iTextSharp 将 PDF 转换成 TXT 文本

2022/9/16 14:17:12

本文主要是介绍C# 使用 iTextSharp 将 PDF 转换成 TXT 文本,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

var pdfReader = new PdfReader("xxx.pdf");
StreamWriter output = new StreamWriter(new FileStream("处理结果.txt", FileMode.Create));

int pageCount = pdfReader.NumberOfPages;
for (int pg = 1; pg <= pageCount; pg++)
{
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
var value = PdfTextExtractor.GetTextFromPage(pdfReader, pg, strategy);
value = value.Replace(" ", "");
Console.WriteLine(value);
output.Write(value);
}

output.Flush();
output.Close();
Console.Write("处理完毕");
Console.ReadLine();


https://www.cnblogs.com/New-HackerHK/p/14853693.html

 



这篇关于C# 使用 iTextSharp 将 PDF 转换成 TXT 文本的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程