【WPS灵犀Claw】应用篇2~一句话让你的灵犀开口,实现文字转语音(TTS)





Lv.2潜力创作者
众所周知默认情况下WPS灵犀Claw是不支持文字转语音功能(TTS)的,那么我们如何领WPS灵犀Claw支持文字转语音呢?通常我们可以下载TTS本地引擎或者通过在线TTS引擎来实现,但这次我们直接利用强大的TTS语音大模型来实现
模型选择
由于需要用到TTS语音合成模型,第一步我们就是选型,这次我们使用mimo系列的TTS模型进行操作~
| 💡 | 在语音合成模型选择上,大家可以根据自己喜好和实际操作过程中选择最合适的~ |
前置准备
由于我们需要利用语音大模型帮我们直接进行语音的合成,所以此时我们需要新增一个skill来帮我们实现,我们可以直接跟WPS灵犀Claw提出我们的需求,提示词如下
| 💡 | 注意:我们不能在自定义大模型中直接添加TTS语音大模型,另外如果要使用大模型需要自行申请大模型API Key |
实战演示
经过以上操作后,我们就得到了一个能够实现语音合成的skill,接下来我们就来展示一下如何使用了~
语音合成
中文稿件播报
如下图所示可以看出,在让它进行语音合成的时候,在提示词没有明确说明风格的时候,灵犀会追问更多细节例如【音色】和【风格】的选择
WPS灵犀介绍_冰糖音色
| ⭐ | 由于社区不支持发音频文件,可前往关联知识库试听效果 |
英文稿件播报
同理在针对英文稿件时,WPS灵犀Claw也会让你有相同的选择,同样会让你选择【音色】和【风格】的,但你可以看出音色选择时,中文和英文默认角色是不一样的~
WPS Lingxi Introduction_Mia
| ⭐ | 由于社区不支持发音频文件,可前往关联知识库试听效果 |
其他功能
那么除了语音合成,我们能不能使用自己的音色进行播报呢?显然是可以的!以mimo这个tts模型为例,除了支持语音合成外,还支持音色设计、音色克隆和唱歌模式
| 💡 | 其他功能由于不同TTS模型会有所不同,使用时根据对于API文档查看即可 |
WPS灵犀工具教程
WPS灵犀Claw版本
WPS灵犀Claw1.2.4-260601|2.18.0
Lv.1新人创作者
Lv.2潜力创作者
Lv.2潜力创作者
Lv.2潜力创作者
Lv.2潜力创作者
Lv.2潜力创作者
Lv.2潜力创作者