【请教】普通pdf变成图片型pdf

从系统下载文件时,以“打印→PDF打印机“”的方式,下载为PDF文件。如果手动下载,则是普通的PDF文件:可直接复制,检索;若通过脚本,以模拟人点击的方式下载,则变成了疑似图片型PDF:不可检索,复制。请问是什么原因?,如何解决? 备注:尝试过通过将PDF转化为可扫描型PDF,但检索效率明显低于原本就可复制的PDF,且文件量大,转化失败率高
湖南省
浏览 219
收藏
3
分享
3 +1
4
+1
全部评论 4
 
清华学弟任泽岩
清华学弟任泽岩

创作者俱乐部成员

有图片型pdf的,不会转化成文档,私密性更好
· 广东省
回复
冉鲜
因为涉及到内容提取以及pdf的分割加工,所以图片型pdf不方便操作。检索的结果来看,疑似是脚本点击下载会触发网站保护机制,所以下载后的pdf类型不相同,目前还没找到直接加工的方式
· 湖南省
回复
 
Vicky
学习
· 上海
回复