PMC生产计划群:2025-30周训练题答案分享
优秀创作者
大家好,我是古老师。今天我将发布2025年第30周PMC生产计划群的“每日一练”题目与答案。本次发布的资料包括每日练习题、对应的正确答案以及对相关考点的详细解析,旨在辅助大家的学习,并作为参考资料使用。
本周的练习题目的方向为“文本提取变形相关专题”,包语法糖、正则表达式、聚合函数、自定义函数、扫描函数、数组变形、堆叠等知识点。
周一:30-1提取客户英文简称-答案
题目背景:
PMC生产计划在日常工作场景中,需要从单元格内提取客户英文简称,这里面可能混有数字或特殊符号等内容,需要快速分离,此时可以使用最新的正则表达式函数来快速提取;
知识点:
\pL+:匹配任何Unicode字母:其中\pL表示“字母类别”,+表示一个或多个字符。提取所有语言中的所有字母字符。-Unicode字母(例如:英文字母、中文汉字、日文假名、俄文字母等)。
[A-z]+:匹配ASCII字符码从A到z的范围:但包含非字母字符(A=65,z=122),如标点符号。-ASCII码65-122的字符:大写字母A-Z(65-90)、部分标点如[(91)、\`(92)、](93)、(96)、小写字母a-z(97-122)。
[A-Za-z]+:匹配纯ASCII字母:大写字母A-Z和小写字母a-z,不包括中间标点。-ASCII字母:A-Z(65-90)和a-z(97-122)的字符。
\d+:匹配数字序列或连字符:其中\d表示数字,+表示一个或多个,匹配数字序列或连字符:其中\d表示数字,+表示一个或多个;
数组公式:
其他答案:
周二:30-2提取箱号范围-答案
题目背景:
除了提取字母类的信息,还有提取数字类信息;而提取数字的正则表达式的思路基本和提取字母类似,可以直接提取,也可以通过替换字母为空来实现。
知识点:
通过正则表达式“[0-9-]+”,直接匹配连续的数字和连字符序列,核心是提取“数字+连字符”组合。2.可用INT()配合数学公式求出:被除数-除数*INT(被除数/除数)
用正则“\pL+”配合替换模式,删除所有连续字母(保留数字和连字符)。“\pL”支持多语言字母匹配,语言兼容性极佳,适合含多语言字母的字符串处理。
以“(\d+-\d+)”的捕获组,精确提取“数字-数字”结构。通过“\d+”匹配多位数、“-”匹配连字符,严格锁定目标格式,适用于需保证结果为“数字-数字”形式的场景,精准度高。
用“[A-Za-z]”结合替换,逐字母删除英文字符。仅支持ASCII英文,语言兼容性有限,适合仅含英文字母的简单字符串处理。
5通过TEXTSPLIT与多个函数组合,生成所有英文字母作为分隔符,分割后保留数字和连字符。虽复杂但展示了高级函数技巧,仅支持英文,适合演示函数组合而非日常高效处理。
数组公式:
其他答案:
周三:30-3 生成箱号范围 - 答案
题目背景:
需要生成一组特定数字范围的时候,可以用生成序列的函数SEQUENCE或者ROW生产指定单元格范围的行号来实现,如果继续要堆叠的话,再用REUDCE函数进行嵌套;
知识点:
1.用财务函数 VDB 的变形公式生成数字序列,结合 TOCOL 将结果转为单列。亮点:非常规利用 VDB 财务函数生成等差数列。
2.遍历每个字符串,用 REGEXP 提取起止数字,通过 SEQUENCE 生成连续值并垂直堆叠。亮点:REGEXP 精准抓取数字范围 + SEQUENCE 序列生成。
3.将字符串中的 "-" 替换为 ":",用 INDIRECT 构建行引用,再通过 ROW 获取行号序列。亮点:INDIRECT 动态转换文本为行区域引用。
4.手动截取破折号两侧子串,通过字符截取和最大值提取起止数字,生成序列后堆叠。
5.用 TEXTSPLIT 分割字符串,分别过滤两侧子串的非数字字符,确定范围后生成序列。
数组公式:
其他答案:
周四:30-4 生成客户加箱号范围 - 答案
题目背景:
数组需要额外加上数据的时候,此时可以用CHOOSE函数配合参数大括号来进行拼接;
知识点:
理解CHOOSE 在重构数组的意义;
数组公式:
其他答案:
周五:30-5 生成产品加客户加箱号范围 - 答案
题目背景:
最终版本的效果是使用公式一键生成产品加客户加箱号范围进行数据分析;
知识点:
简单堆叠法:逐行提取B列字母和所有数字,用数组首尾值确定范围,SEQUENCE生成序列,直接堆叠三列结果。优点:代码最简洁
正则锚点法:通过正则前瞻(?=-)和后顾(?<=-)精确定位范围边界数字,避免字符串杂音,生成无干扰序列。优点:抗干扰能力最强
向量引擎法:全数组化计算:先批量提取字母/数字范围→计算总行数→构建全局索引→用MATCH映射行列关系,无循环输出结果。优点:运算速度最快,大数据性能最佳;
暴力拆解法:弃用正则数字提取,改用TEXTSPLIT分割字符串,人工MID拆解字符过滤数字,适合特殊环境限制。优点:兼容性最好(降级方案)
定义j/k等LAMBDA辅助函数,显式处理标量→数组扩展,通过TOCOL+HSTACK动态构造子矩阵再聚合。优点:可读性/扩展性最佳
数组公式:
其他答案:
本周题目总结
本周围绕PMC生产计划中的文本处理需求 设计了5个核心练习,聚焦 "文本提取与序列生成" 场景,覆盖以下技能点:
1. 正则表达式深度应用
字母提取:通过\pL+(全语种字母)、[A-Za-z]+(纯ASCII字母)解决客户简称分离问题(周一/周四)。
数字范围提取:利用\d+(?=-)(前瞻锚点)、(?<=-)\d+(后顾锚点)精准锁定箱号范围(周二),避免干扰字符影响。
复合提取:结合REGEXP 与 TEXTBEFORE/TEXTAFTER 分割混合数据(周五)。
2. 动态数组引擎技术
序列生成:SEQUENCE 根据起止值展开箱号范围(周三),ROW+INDIRECT 实现动态引用(周三备选方案)。
数组堆叠:REDUCE+VSTACK 逐行构建结果集(周三/五),TOCOL+HSTACK 横向扩展标量(周五公式5)。
向量化计算:SCAN 累积索引 + MATCH 映射行列关系(周三公式3),无循环处理大数据。
3. 函数组合创新实践
财务函数妙用:VDB 生成等差数列(周三公式1),突破函数设计边界。
字符级解析:MID+TEXTJOIN 手动过滤数字(周二公式4),兼容无正则环境。
LAMBDA:封装辅助函数(如 j/k)简化重复逻辑(周五公式5),提升可维护性。
4. 生产场景适配策略
健壮性优先:正则锚点法(公式2)抵御数据噪声,适合原始数据杂乱场景。
效率优先:向量引擎法(公式3)应对万级数据,减少迭代开销。
兼容性优先:暴力拆解法(公式4)作为无REGEXP环境的降级方案。
核心价值:通过5天渐进式训练,学员掌握从 基础提取→范围生成→多列拼接 的完整链条,将杂乱文本转化为结构化生产数据,大幅提升PMC计划中的物料编码、订单解析、库存追踪效率。同时,欢迎大家加入古哥PMC专业群,与更多的同行一起交流经验、共同学习、进步和成长。感谢大家的积极参与和支持!