【WPSAI功能体验】WPS表格-初尝WPSAI数据问答
创作者俱乐部成员
【个人行业/职业】
项目助理/数据专员
【使用场景】
作为数据分析,从项目管理的角度,需要通过情况数据清单对人员的执行情况以及整体的进度情况和异常情况进行分析及处理,这次借着WPSAI数据问答功能的推出,尝试着使用WPSAI看看AI是否会带来不一样的角度及情况分析~
【输出结果】
以下开始使用WPSAI数据问答,一步步地去体验和感受WPSAI的不同之处,下面主要通过对AI提出不同的问题来进行体验~
初入眼帘AI数据问答,预设有4个默认问题,下面我就先从这几个问题入手体验~
问题1:检查数据中是否有异常
结果展示
在向WPSAI提出这个问题后,它分别从【缺失值】、【负数值】和【未来日期】几个维度说明数据的情况,其中【缺失值】和【未来日期】可以看出WPSAI是给我们分析原数据的数据完整性以及异常值情况,但【负数值】这项AI列举的是序号、工作量这些值非负,表面看是为我们发现异常值,但实际上这些对于实际应用意义并没有很大,尤其是序号字段,感觉WPSAI在这方面还需要加强
💡 | 总结:在第一问中,WPSAI也只是简单地从数据上发现异常,并没有在理解数据后再给出结果,这些方面后续可以加强 |
所需时间
在数据分析中多次测算时间都在30秒左右,在针对只有2000条数据左右数据的分析时间还需要进一步提高,如果能将时间压缩到20秒以内就完美~
问题2:从业务角度可以分析哪些关键问题
结果展示
# 读取'Sheet1'工作表的数据
sheet_data = all_sheets['Sheet1']
# 分析关键问题
# 1. 预估任务工作量与实际任务工作量的差异
# 2. 任务执行人员的工作效率
# 3. 任务完成日期与任务分配日期的时间差
# 4. 各任务区域的任务分布情况
# 5. 确认状态的分布情况
# 计算预估任务工作量与实际任务工作量的差异
sheet_data['工作量差异'] = sheet_data['预估任务工作量'] - sheet_data['实际任务工作量']
# 计算任务完成日期与任务分配日期的时间差
sheet_data['任务持续时间'] = (sheet_data['完成日期'] - sheet_data['任务分配日期']).dt.days
# 分析各列的数据分布情况
analysis_results = {
'预估任务工作量与实际任务工作量差异分布': sheet_data['工作量差异'].describe(),
'任务持续时间分布': sheet_data['任务持续时间'].describe(),
'任务执行人员工作效率分布': sheet_data.groupby('任务执行人员')['工作量差异'].mean(),
'任务区域分布': sheet_data['任务区域'].value_counts(),
'确认状态分布': sheet_data['确认状态'].value_counts()
}
analysis_results
{'预估任务工作量与实际任务工作量差异分布': count 2894.000000
mean 26.131306
std 80.692706
min 0.000000
25% 1.000000
50% 10.000000
75% 23.000000
max 1879.000000
Name: 工作量差异, dtype: float64, '任务持续时间分布': count 2894.000000
mean -12763.678645
std 20412.733453
min -45357.000000
25% -45104.250000
50% 38.000000
75% 102.000000
max 410.000000
Name: 任务持续时间, dtype: float64, '任务执行人员工作效率分布': 任务执行人员
人员1 32.640351
人员10 22.283465
人员11 24.678161
人员12 39.258065
人员13 6.000000
...
人员60 36.893939
人员61 27.000000
人员7 55.000000
人员8 31.924051
人员9 8.595238
Name: 工作量差异, Length: 61, dtype: float64, '任务区域分布': 任务区域
区域E 739
区域A 526
区域C 461
区域D 390
区域B 274
区域F 260
区域G 244
Name: count, dtype: int64, '确认状态分布': 确认状态
成果已通过 1038
未移交成果 822
成果待确认 819
成果不通过 215
Name: count, dtype: int64}
由上面结果可知,WPSAI主要是以Python为数据分析语言对数据进行分析,基本上它可以对每个字段得数据情况进行了数量统计,但在【持续时间】等数据分析时,它并没有完全提示所有负数日期的异常,在检查问题方面AI还需要继续进步,但一般数据异常还是能显示出来~
所需时间
由于这个需要对数据进行一定解读,所以耗时比单纯数据情况分析稍久~
问题3:帮我做一些有业务价值的图表
结果展示
这个问题主要需要WPSAI对数据进行分析后并画出对应图表,但在测试过程中多次出现【服务异常】不清楚是数据量的问题还是网络原因还是WPSAI服务器原因导致,但从结果可以看出,WPSAI生成的图表并没有进行任何美化,但对于展示来说建议简单通过不同颜色表示不同数据还是比较符合日常需求的,而且可以看出在分布中,WPSAI默认使用的是条形图,但对于占比类数据应该默认显示饼图会更加符合实际需求~
所需时间
由下图可知,在这个问题的测试中,耗时是最长的,而且一直出现【服务异常】,尤其是在等待4、5分钟后出现异常提示且并没有展示出任何结果,如果在数据量很大的情况下,在等待数十分钟后出现【异常】提示是非常影响用户体验,这方面期待WPSAI进一步优化
问题4:从数据中能得出什么结论
结果展示
如上图针对在数据中得出什么结论,它目前只能简单展示数据情况,并没有能深入解读字段背后的意义,这个也期待WPSAI的迭代中能解决~
所需时间
可能由于只是简单对数据的解读,基本上和第一个问题的耗时差不多~
【使用评价】
上文对WPSAI数据问答进行了预设问题的测试,体验如下
目前WPSAI问答只能对数据表字段本身的情况进行分析,暂时没有对字段本身的意义进行深度的解读~
当数据分析量过大时,会经常出现【服务异常】提示,以问题3为例多次尝试也提示【服务要求】,最后只能透过刷新暂停在运行的方法得出了数据,但不清楚这个数据分析量有没有丢失~
图表展示目前还是不能更加实际数据情况选择适合的图表,但结果还是能展示情况
WPSAI在总体上给一个原始数据给定一个分析的基调方向,能够在短时间对数据有一个初步了解,但深入解读方面,暂时还有所欠缺,期待提高~
【使用建议】
目前WPSAI问答只能对数据表字段本身的情况进行分析,暂时没有对字段本身的意义进行深度的解读,期待WPSAI未来能够提升这方面的能力
当数据分析量过大时,会经常出现【服务异常】提示,以问题3为例多次尝试也提示【服务要求】,建议能够优化服务器性能,或在网络异常的情况下提前提示,不要出现长时间的等待后出现无法出现结果的情况~
图表展示目前还是不能更加实际数据情况选择适合的图表,期待日后能够解决这个问题~
WPS版本
WPS64位内测版(12.1.0.17726-release)
系统版本
Windows11