Wps表格中用正则提取拼音
如下图所示,A2:A5单元格区域中是含拼音的文本,现需要将拼音单独提取出来
Wps表格中更新了RegExp正则函数,现在可以用这个函数来愉快地提取拼音了,如下图
提取公式是:=REGEXP(A2,"\p{Latin}+")
此处的关键是第二个参数,也就是正则表达式"\p{Latin}+"匹配的是连续的拉丁字母。
\p{...}这种形式是Unicode属性转义序列的一种表示方法,其通常遵循\p{...}或\P{...}的语法,其中...是Unicode属性的名称。
\p{...}匹配具有指定属性的字符,而\P{...}匹配不具有该属性的字符。比如:
\p{Han}:匹配中文本字符(不含标点和各种符号)
\p{L}:匹配字母字符(含中文,拉丁字母等,不含标点、括号和数字)
\p{Lu}:匹配大写字母
\p{Ll}:匹配小写字母
\p{Latin}:匹配拉丁字母
\p{Common}:匹配数字、标点、和各种符号(不含中文,英文等字母)
\p{N}:匹配所有数字(包括罗马数字,阿拉伯数字等)
\p{Nd}:匹配阿拉伯数字
\p{Nl}:匹配罗马数字(注意不是普通的IVXL等字符而是专有的拉丁数字ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫⅬⅭⅮⅯⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿ)
创作者俱乐部成员
创作者俱乐部成员
创作者俱乐部成员