一个PDF 转 TXT 的在线应用
最近在尝试翻译 PC-Lint 参考手册,少不了要引用里面的代码。
苦恼的是,Acrobat Reader 的 txt 文本导出功能不能保证格式,导出后的代码片段需要手工重新格式化。
转辗了几个开源和商业软件,都不尽如意。最后发现了一个基于 Pylons 框架的免费在线应用 — PDFTextOnline, 这个好使,支持在线 pdf2txt 转换,在线浏览,txt 文本导出,最重要的是它导出的 txt 文本格式和 PDF 基本一致。
PDFTextOnline 的 WEB 部分基于 Pylons 框架,PDF 转换引擎用的是 PDFTextStream.Python 库,界面渲染部分大量采用了 AJAX 和 Dojo.
PDFTextStream.Python 库是这个应用的核心,除 Python 外还有 Java 和 .NET 的版本。可惜的是这个库只有商业许可。






1 Comment Subscribe comments
真的好用这个。我是使用了再来说的那。呼,这么好的东东。。
Leave a Reply You can use reStructuredText here.