pdf数据处理

背景:pdf文件是加密的,且我要写的脚本不足以单独调整加密软件的管理策略【功能也不多,也还没写完】

我正在使用pdfplumber和python进行pdf文件的解析,因为pdfplumber包能够很好的解析表格数据,但是在近期的实机测试中,发现要解析的pdf文件只能由特定软件(比如WPS OFFICE)打开,我应该如何解决文件读取的问题?
思路:1.将原本要制作的软件调整为制作wps office的插件可以吗?这样可以的话,那么wps与python的接口如何实现呢?我有看到一个python-wps-client,但是感觉不用太行。官网上说调用api还要搞第三方认证和申请,太麻烦了

2.在wps里调用外部脚本,wps似乎没有这个能力,而且也涉及到pdf文件流在二者之间的传递

所以我想问问大佬们有什么想法

陕西省
浏览 624
收藏
3
分享
3 +1
2
+1
全部评论 2
 
黄曦然
黄曦然

@金山办公

可以考虑用外部脚本调用 wps open api。 将解析好的数据读出来。或者用python 将表格数据读出来,通过 request包将数据转到服务端的API上。 不知道能否满足您的需求
· 北京
回复
 
清华学弟任泽岩
清华学弟任泽岩

创作者俱乐部成员

打卡学习
· 辽宁省
回复