用新公式WPSAI.CLASSIFY匹配公司全称、简称

wils
wils

创作者俱乐部成员

感谢龙逸凡老师分享的关于wpsai新公式的帖子

https://bbs.wps.cn/topic/49397

解决了困扰多年的一个问题:如何用公式匹配公司的全称和简称?


过去的做法是:

用一个两个字符的窗口,移动扫过字符串A,获得一组两个字符的数组,再同样处理字符串B,最后计算两个数组重复的项目,以此判断相似程度

或者,用Levenshtein编辑距离的库,计算字符串A变成B,需要修改多少字符,然后除以两个字符串的长度和判断相似程度

还有朋友自己写算法分词后用词向量找相似,不明觉厉

这些方法的成功率,总是停留在八到九成,需要仔细检查,因为他们都是从字面信息上去找相似,想要提高准确度,必须让机器知道字面量到底表达的是什么,有什么额外的特征


终于遇到了ai,它是知道每个词额外的信息的

哈哈,ai它知道额外的信息,不仅仅停留在字面,而是更好的理解了这个词


于是,匹配公司全称、简称的困扰终于有救了

其中A列是简称,B列是打乱顺序的全称

🔔

=WPSAI.CLASSIFY(A1,TEXTJOIN(",",,$B$1:$B$10))

以分类的方式,找出了两者的对应关系,甚至在没有匹配的时候,还会告诉你没有找到匹配,而不会找个最相似的凑活,简直完美👍

广东省
浏览 228
收藏
4
分享
4 +1
6
+1
全部评论 6
 
龙逸凡
龙逸凡

创作者俱乐部成员

有创意
· 重庆
回复
wils
wils

创作者俱乐部成员

感谢老师鼓励
· 海南省
回复
 
Tam Kingsley
Tam Kingsley

创作者俱乐部成员

点赞学习
· 广东省
回复
 
南京的天
我也看那篇文章了,确实好用呀
· 山西省
1
回复
 
亂雲飛渡
学习
· 广东省
回复
 
wps新路
wps新路

WPS函数专家

点赞
· 重庆
回复