WPS内图片查重
wils
创作者俱乐部成员
刚看到论坛里有朋友问,如何在WPS里图片查重
在WPS里不好操作
但从外部解压后解析xml比较方便
如图,WPS表格内插入了2张图片,分别重复了2、3次
大家都知道xlsx就是zip文件,可以解压
解压后,media文件夹里只有两张图片,这两张图片可以用powershell检查md5sum的方式确定是否重复
drawings文件夹里的xml文件则记录着文件里这些图片分别出现了几次,在什么位置
同样可以用powershell解析xml得到
这里的查重,不是高大上的机器学习,去找特征点,图像识别之类,只是找出完全相同的图片
在WPS内确实不好操作,但从外部,用脚本,比如powershell解压处理就比较方便
具体代码再想想,明天好再水一贴🤣
创作者俱乐部成员
创作者俱乐部成员