用新公式WPSAI.CLASSIFY匹配公司全称、简称

wils
创作者俱乐部成员
感谢龙逸凡老师分享的关于wpsai新公式的帖子
https://bbs.wps.cn/topic/49397
解决了困扰多年的一个问题:如何用公式匹配公司的全称和简称?
过去的做法是:
用一个两个字符的窗口,移动扫过字符串A,获得一组两个字符的数组,再同样处理字符串B,最后计算两个数组重复的项目,以此判断相似程度
或者,用Levenshtein编辑距离的库,计算字符串A变成B,需要修改多少字符,然后除以两个字符串的长度和判断相似程度
还有朋友自己写算法分词后用词向量找相似,不明觉厉
这些方法的成功率,总是停留在八到九成,需要仔细检查,因为他们都是从字面信息上去找相似,想要提高准确度,必须让机器知道字面量到底表达的是什么,有什么额外的特征
终于遇到了ai,它是知道每个词额外的信息的
哈哈,ai它知道额外的信息,不仅仅停留在字面,而是更好的理解了这个词
于是,匹配公司全称、简称的困扰终于有救了
其中A列是简称,B列是打乱顺序的全称
🔔 | =WPSAI.CLASSIFY(A1,TEXTJOIN(",",,$B$1:$B$10)) |
以分类的方式,找出了两者的对应关系,甚至在没有匹配的时候,还会告诉你没有找到匹配,而不会找个最相似的凑活,简直完美👍
创作者俱乐部成员
创作者俱乐部成员
创作者俱乐部成员
WPS函数专家