如何转 PDF 文件 为 text 文件?

如何转 PDF 文件 为 text 文件?

哪位高手用过,哪个CPAN的module好用? 多谢。
用程序搞不知道,不过save as text就ok了
google
能google出来就不跑上来问了,你找到啥好link了?

QUOTE:
原帖由 xiaoyu9805119 于 2008-8-26 11:01 发表
google



QUOTE:
原帖由 hdc1112 于 2008-8-26 08:17 发表
用程序搞不知道,不过save as text就ok了

不行吧,不能直接这样吧
CAM:DF

http://search.cpan.org/~clotho/CAM-PDF-1.08/lib/CAM/PDF.pm

ps: google是需要耐心和技巧的,不要只看2-3页没找到就放弃。
CAM:DF, 我已经试过了,也许用的不对,输出结果不对头。CPAN上面的我用了个遍,好像都不太灵。我用的test文件是这个http://www.unizh.ch/home/forrer/pdftest.pdf

最后发现最好的可能是GNU发布的xPDF, linux 的 pdftotext command 能解决问题,需要kernel 2。4。18-3以后版本。

用上面的文件test,非常完美。

纯粹的perl整不了这玩意,都是用C写的lib。PDF文件里如果嵌入图或者复杂的font,咋也整不出来, 用啥都没戏。

比较之后我的结论是,CAM的水平比GNU这个foollabs的高人还是差了点。
I see.
LZ第一个帖子给的信息太少。
偶觉得用Acrobat Professional岂不是更省事,连程序都不用写了。