WPS AI数据分析指引:用DeepSeek+WPS云文档如何秒造数据集
WPS AI数据分析指引:用DeepSeek+WPS云文档如何秒造数据集
在做数据展示时,经常要对数据脱敏,或生成虚拟数据集。尽管Python Faker是一个专门的工具。但是经过测试,更方便的是在WPS AI中一个提示词生成数据集。
根据空白模版生成数据集
首先,打开WPS表格,新建 Sheet1,在第一行输入目标数据表的标题:
例如:
订单日期 | 订单编号 | 配送方式 | 地区 | 省份 | 客户类型 | 客户名称 | 商品类别 | 商品子类别 | 商品名称 | 数量 | 销售金额 | 利润 |
其次,点WPS AI --> AI数据分析,进入AI数据分析交互页面
输入提示词:
根据表格的字段,建一个800行的数据集。
WPS 思考+构造:通过写Python代码方式运行:
运行完成,点击 “插入内容至新工作表”
这样,一个新的数据集就生成完毕了。
进阶用法(一)
根据代码,微调代码并二次生成。
如果要微调或丰富数据集,内容,则修改上面的字典和数组~
将修改后的代码,保存
进入:WPS云文档-效率--PY脚本
点击新建脚本
将刚刚修改后的代码,复制进来:
点击运行
注意:由于在WPS AI中默认有保存地址,在这个PY代码中,对这部分进行修改。非常简单:
删掉 保存的代码;
替换为:回写的代码
如果要将数据回写到新的sheet中,则:点击新建工作表,重新点运行:
这样一个新的数据集就生成了。
如果要再生成更多个性化的数据集,用辅助AI的方式如下:
进阶用法(二)
复制代码片段,在大模型中用如下提示词:
参考下面代码,将数据集场景修改为粤港澳大湾区的地区数据,可下到城市级别,另外,产品分类调整为 企业级采购产品。
# 创建基础数据池
regions = {
'华东': ['山东', '江苏', '安徽', '浙江', '福建', '上海'],
'华南': ['广东', '广西', '海南', '湖南', '江西'],
'华北': ['北京', '天津', '河北', '山西', '内蒙古'],
'西南': ['重庆', '四川', '贵州', '云南', '西藏'],
'西北': ['陕西', '甘肃', '青海', '宁夏', '新疆']
}
product_categories = {
'服装饰品': {
'女装': ['女士衬衫', '女士风衣', '女士连衣裙', '女士牛仔裤'],
'男装': ['男士夹克', '男士衬衫', '男士西裤', '男士羽绒服'],
'鞋包饰品': ['长筒靴', '手提包', '皮带', '太阳镜']
},
'美妆护肤': {
'美妆': ['口红', '粉底液', '眼影盘', '腮红'],
'个护清洁': ['沐浴露', '洗发水', '护发素', '洗面奶']
}
}
# 创建基础数据池
regions = {
'华东': ['山东', '江苏', '安徽', '浙江', '福建', '上海'],
'华南': ['广东', '广西', '海南', '湖南', '江西'],
'华北': ['北京', '天津', '河北', '山西', '内蒙古'],
'西南': ['重庆', '四川', '贵州', '云南', '西藏'],
'西北': ['陕西', '甘肃', '青海', '宁夏', '新疆']
}
product_categories = {
'服装饰品': {
'女装': ['女士衬衫', '女士风衣', '女士连衣裙', '女士牛仔裤'],
'男装': ['男士夹克', '男士衬衫', '男士西裤', '男士羽绒服'],
'鞋包饰品': ['长筒靴', '手提包', '皮带', '太阳镜']
},
'美妆护肤': {
'美妆': ['口红', '粉底液', '眼影盘', '腮红'],
'个护清洁': ['沐浴露', '洗发水', '护发素', '洗面奶']
}
}
新建脚本,并重新运行:
一个新的数据集就生成了:
总结:
给定所需数据集字段,在WPSAI中输入提示词 :造数据集。 如果对字段有约束要求,提前给出。
微调数据集,使用WPS云文档中-效率-PY脚本,将WPSAI生成的代码块,粘贴进脚本,修改后运行。
如果不会改代码,用AI提示词让AI帮助修改代码块,(需要简单的看懂代码块的含义),重新运行。
另外:最好在WPS云文档中运行,不要在传统的WPS Office中运行,避免不必要的报错。