三大维度测评,几十张图片生成后,我对WPS AI生图的体验感受
创作者俱乐部成员
AI生图赛道非常非常非常非常非常非常非常卷。
前有专注这个领域老牌巨头:MJ, SD,国内新秀:即梦,可灵
后有大模型多模态化的Gemini2.5Pro,GPT-4o,豆包
还有磨刀霍霍,设计巨头:adobe
现在这个赛道,不说有千个也上百款软件
差不多一个月的速度更新换代,时间就是金钱,大家使用只追最好用的
所以从客观上分享,一个办公软件的厂商去冲击AI生图领域是非常困难的
虽然WPS很早就布局了,有自己的WPS图像编辑器,金山海报设计软件
我之前也在文章对其中大加点赞:告别PS,用上WPS,意外好用
坦白地说在测评开始前,我是以低预期心态使用的
⭐生成第一张图
新建一个PPT,菜单栏上方“WPS AI”→“AI生成图片”
我们可以看到AI生图的界面,主要以画面描述为主(文生图)
而风格和图片比例,目前无法自定义,只能用官方提供的内容选择
这是我生成的第一张图,提示词:一个可爱的亚洲女生,个人证件照
生成速度非常快10S内
一次生成4张图提供
这个功能在PPT中使用非常丝滑。可以直接插入PPT也可以直接下载,且没有水印
⭐新的发现
智能推荐并不算一种风格,它会帮你匹配风格,比如一开始选择智能推荐
系统帮我匹配了简约照片的风格
生成的图片记录,可以多个PPT同时调用,不怕图片丢失
生图过程中出现过图片生成缺失的问题,不知道是不是普遍现象
⭐针对性测评
从商品属性上考虑,我这次测评对比 选用了多模态的豆包和WPS AI进行对比
测评1:提示词理解能力
这组测试,用非常具体的描述让AI生图,测试其对提示词的理解能力和细节把握,对比图如下:
对比结论:
📌 | 整体来说能够理解大体的意思,但是WPS AI对细节的处理还是有待加强,对比图3中,绿眼睛怎么生成都是黄色的,4中的行李箱也生成的不具体,最大的问题是对专用名词描述上训练不足,图2中的孙悟空形象完全错误,知名IP基本生成不了。满分5分,我给3分。 |
测评2:图片视觉效果
这组测试,用具有一定创作空间的描述让AI生图,测试其生图视觉效果(是否好看),对比图如下:
对比结论:
📌 | WPS AI在做建筑物的静物构图比豆包强一点,但是画面的精细度和质量完全不在一个档次,这点从图像大小也可以看出差距,一旦内容出现人物,图片审美一下就下了好几个档次,图2中 的男模特对比可以看出,尤其是图3的公园景物图,没有人还好,一旦画面出现人,画面就抽象了,满分5分,我给2分。 |
测评3:图片想象力
这组测试,用非常抽象且具有想象力的描述让AI生图,其生图的想象能力和艺术性,对比图如下:
对比结论:
📌 | 从这3组对比图可以看出,WPS AI生图更擅长做建筑物方向的内容,如果针对生物形态的创作,效果比较差,想象力上的创作也差强人意,图1 完全看不出这个和糖果乐园有什么联系,所以总体来说,WPS AI 生成的图片虽然具备相应主题元素,但在场景丰富度和创意独特性上稍逊一筹。满分5分,我给2分。 |
⭐个人感受
尽管这次体验已经抱着低预期的心态来使用了,但是这个效果真的挺让人失望的,
功能局限明显,风格和图片比例无法自定义,同时无法进行图生图和图片控制,严重束缚了用户创意表达。在生图质量上,对提示词理解的细节偏差、人物和复杂场景视觉效果差、艺术感欠缺,使其难以满足中高端用户需求。与成熟竞品相比,差距较大。
能够拿来说的优点在 PPT 内操作的流畅性,10 秒内生成 4 张图,且可直接插入 PPT 或下载无水印,还能在多 PPT 调用记录,这在办公场景下极大提升了素材获取效率,为临时需要简单配图的用户提供了便利,对轻度办公需求者有一定吸引力。
建议WPS AI的团队对AI生图的业务重新考虑一下,自研的进度如果赶不上了,是否可以像使用deepseek的思路一样,使用一些成熟开源的AI文生图模型来对接。
不过毕竟是在PPT里的一个子功能,也不能太过苛责,我猜测后面成熟的Ai生图应该会集合在灵犀上,到时候应该能重新期待一下WPS AI的生图能力吧
作者简介
郑亿Oscar,金山办公最有价值专家KVP,WPS创作者俱乐部成员,23年8月、11月月度优质作者
个人社区经历→【百帖里程碑】23年我在WPS社区的成长回顾
创作者俱乐部成员
社区管理员