WPS内图片查重

wils
wils

创作者俱乐部成员

刚看到论坛里有朋友问,如何在WPS里图片查重

在WPS里不好操作

但从外部解压后解析xml比较方便

如图,WPS表格内插入了2张图片,分别重复了2、3次

大家都知道xlsx就是zip文件,可以解压

解压后,media文件夹里只有两张图片,这两张图片可以用powershell检查md5sum的方式确定是否重复

drawings文件夹里的xml文件则记录着文件里这些图片分别出现了几次,在什么位置

同样可以用powershell解析xml得到

这里的查重,不是高大上的机器学习,去找特征点,图像识别之类,只是找出完全相同的图片

在WPS内确实不好操作,但从外部,用脚本,比如powershell解压处理就比较方便

具体代码再想想,明天好再水一贴🤣

海南省
浏览 422
收藏
4
分享
4 +1
6
+1
全部评论 6
 
方盛
方盛

创作者俱乐部成员

不好意思,想问下那个旭日图要怎么操作,你说的方法。我看你的建议撤了,就进来你的帖子咨询下。
· 陕西省
回复
wils
wils

创作者俱乐部成员

嘿嘿,因为当时回答的不太对,后面又水了一贴https://bbs.wps.cn/topic/38802
· 海南省
回复
 
风邪
打卡
· 江苏省
回复