GOOGLE 查了一下,大概都是推荐 PYPDF2+SCAPY 的方法,有前辈试过吗?我看 PYPDF2 那个项目原作者早就不维护了。或者还有什么别的方法可以爬 PDF 吗?求指教不胜感激!

1 binux Dec 19, 2019 PDF 最近十年有什么变化吗? 你需要担心的不是库而是文字定位和扫描件 |
2 zeromake Dec 19, 2019 via Android https://github.com/pikepdf/pikepdf 如果说是 pdf 解析库可以考虑用这个 |