【WPS新品测评】WPS AI视频助手-对视频进行知识蒸馏
最近能切实感受到WPS在AI方面加大了投入,并且初见成效。WPS正在努力从办公工具向办公中枢转型。这次刚亮相的AI视频助手,通过在WPS中使用AI的加持来连结视频和文字,扩展了WPS的办公生态领域。下面就先行体验一下这个WPS AI视频助手能给我们带来什么新的感受。
- 基本界面
进入网址后呈现的界面如下:
个人感觉产品还处于进化过程中,供体验的界面比较简洁。左侧菜单栏的功能中,目前只有视频转文档可以使用,其余功能尚为灰色不可用,从功能名上看,这些待开发的功能也是挺让人期待的。左下角还有个历史记录可以点击。中间为功能区,也就是视频转文档的功能。
视频转文档的功能包括添加视频,上传的视频对格式、时长、数量和文件长度有要求。视频生成的文档有三种可选:图文笔记、视频原文、总结概要。文档语言目前可以选择中文、英文。添加视频后就可以点击确定开始处理,相关的界面我们后面测试的时候介绍。
- 测评思路
根据现有功能,这次做个比较宽泛的功能测试,分别从以下三类用户的角度进行测试:
学生家长:目标为快速提炼学习视频中的要点
打工人:目标为提升培训学习、报告等工作的效率
自媒体:目标为将视频转化为图文形式发布
因此,相应地准备了几个视频文件进行测试,分别如下:
No. | 视频类型 | 内容 | 视频长度 | 容量(MB) | 格式 | 说明 |
1 | 线上授课 | 作文病句讲解 | 00:20:38 | 563 | MP4 | 老师讲课 |
2 | 企业内培 | MySQL数据库介绍 | 00:48:39 | 188 | MP4 | PPT录屏 |
3 | 时事新闻 | 以色列伊朗冲突 | 00:02:16 | 4.16 | MP4 | 新闻播报 |
4 | MV | 起风了 | 00:05:15 | 27.3 | MP4 | 歌曲 |
5 | 纪录片 | BBC纪录片:行星 | 00:49:16 | 700 | AVI | 纯英文无字幕 |
- 测试过程
本次测试是将准备的视频分别上传,生成相应文档,对文档质量进行评价。
- 线上授课视频
测试开始并不顺利,视频文件始终无法添加,且无任何提示。后来考虑可能是格式问题,使用WPS的视频转换做了个处理,从MP4转成MP4后终于可以了。原文件563M,转换后560M。文档类型选择总结概要。
3分30秒生成出文档,大概有一多半时间耗费在理解视频内容上。文档末尾还带有精彩画面的动图。
配图而且是动图这点确实一下子能让文档高级起来。可以选择导出为DOC或者PDF文件,可惜导出后动图的效果就没了。
左侧有一些选择,可以重新选择文档转换类型,也可以生成其他用途文件,包括练习题目和种草文案,这个选项是前面没有的,只能在这里选择。如果不满意也可以重新生成文档。
生成的文档内容无太大偏差,想要说的是和自己听一遍形成的感受确实不太一样,个人会更重点关注所谓的三种语病,很多细节都忽略了,AI则不会受到这种影响。
接着顺势生成了练习题目,经1分20秒后显示。
个人认为这个试卷效果比预想的要好,其实我感觉视频中讲解的条理性没有那么好,但从试卷上看抓住的学习要点还是挺精准的。
- 企业内培视频
在第一步加载视频阶段读取视频数据时间很长,超过了30分钟。与第一个视频相比,时长为2倍左右,容量小了2/3。可第一个视频一共才3分30秒就生成文档了,猜测是读取视频数据时间与视频时长关系较大,且非线性变化,当然具体什么原因不得而知。试了两次以后无法忍受就换了个同类型文件,时长只有4′25秒,文件大小13.2M。这次经过2分钟终于显示出来,文档类型选择的是图文笔记。
从输出结果看,整理的表格很清晰,内容准确。除了原本内容外,补充的学习心得、疑惑解答和启发收获等内容确实能满足打工人的需要。从生成的文档上看,存在的问题是配图不合适,但这个问题是由于视频文件本身内容的缺陷造成的。
- 时事新闻
这条视频测试做了多次。第一次选择图文笔记/英文,经历1分半左右生成文档。但是文档中包含个别中文,并且新闻下方滚动的信息也混入了不少,虽然都是屏幕上的显示内容,但是和新闻内容不相符,个人感觉对这种视频要想做到完美有点难。
第二次生成的内容方面不错,除了标题中的中文大写数字。
改成中文后重新生成遇到了个小问题,首次生成在音频内容分析时就已经达到10分钟了,感觉不对就取消了。检查发现当时本地的视频文件处于被打开状态,但是此时视频应该已经上传了,按理没啥影响,具体原因不明。历时1分49秒重新生成,比英文要慢一点,不过测试样本和次数太少,这种对比也没啥意义。
文档内容上看也是混入了无关的消息,但是稍加修改后感觉还是可用的。
- MV
特意选了一首MV进行测试。我觉得有时候也会在朋友圈啥的发个演唱会视频,借机来表达下情感或者单纯就想装一下。当然同时也很好奇这个视频助手对歌词的识别能达到什么程度。
首次测试选择的是视频原文,不到15秒就生成了。
不知道因为是歌曲还是吐字不清,文字识别的准确率不是很完美。
另外,选择了种草文案重新生成了文档。用时2分钟。
这个功能可以为小红书、微博、朋友圈各自生成了三条文案。
我觉得生成的文案还是有优化空间的,能设置个人风格就好了,比如对我来说就觉得有点夸张。当然改动一下还是可以用的,如果不满意就重新生成吧,总能找到适合的。
- 纪录片
选了个无字幕的纯英文视频来测试,只是单纯想知道目前WPS AI 视频助手的能力上限是什么。选择的转换文档为总结概要。
和第二个视频一样,过了30分钟依然停留在加载视频-读取视频数据处。因此对视频处理了一下,截取了10分钟左右。
经过1分46秒成功生成,而且内容的正确性上看没啥大的瑕疵,给我一个意外惊喜,将来英文资料可以直接处理了。如果要挑毛病的话,核心观点部分有点不能直接使用的感觉,不能说不对,但又说不出来哪里不好,可能是观点太泛泛了。如果能通过输入一些主题或者提示词之类的,给个核心观点分析方向可能会更贴切些。
- 总结
1、测试结果
本次测试结果如下表,表中也给出了生成文档的地址,有兴趣可以去看全文:
※本次测试的网络上行带宽是100M,因此可以近似认为文档生成时间主要是服务器端处理时间
经过测试,对于WPS AI视频助手这个功能,如果满分是十分,总体可以打8分。如果仅从本次测试转换的文档质量上看,WPS AI视频助手目前用于学习、培训方面问题不大,而且准确性和实用性不错,不用过多修改。
2、优化改善建议
最后总结一下这次遇到的一些问题,感觉都不算大的技术问题,逐步迭代优化就行了。
这次测试最大问题是有些视频文件处理太慢,也可能是服务器处理资源的问题。
同样的视频格式,可能还存在一些差异,导致有些视频无法识别。
导出文档时不能指定存储位置,默认为系统下载目录。
分享文档时默认设置为允许、查看权限,或和上次分享的设置一致,现在每次分享都要重新调整。毕竟不分享一般也不会点进来了。
视频文件长度给的限制有点小,当然视频时长也有限制,但是相比之下提高文件长度方面更迫切些,手头相当一部分学习视频超过1G了。
感觉在语音的识别时,发音不标准、环境的嘈杂可能都会有不小影响。