百度云语音合成 Python SDK

2022/2/20 17:35:31

本文主要是介绍百度云语音合成 Python SDK,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

pip install baidu-aip

在这里插入图片描述

安装好AipSpeech后就可以直接上代码了,很简单

from aip import AipSpeech

""" 你的 APPID AK SK 在百度云控制台中可以获取,目前可以免费体验"""
APP_ID = 'your ID'
API_KEY = 'your KEY'
SECRET_KEY = 'your SECRET_KEY'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

text = '白皮书说,党的十八大以来,中国的核安全事业进入安全高效发展的新时期。在核安全观引领下,中国逐步构建起法律规范、行政监管、行业自律、技术保障、人才支撑、文化引领、社会参与、国际合作等为主体的核安全治理体系,核安全防线更加牢固。'

result  = client.synthesis(text, 'zh', 1, {
    'vol': 5,
})

# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
    with open('audio.mp3', 'wb') as f:
        f.write(result)

运行过后会生成一个audio.mp3文件,打开就可以听到文字转语音的内容了。

以为这样就完了?不不不
我们要实现的终极目标是在微信打字聊天就可以自动转为我们自己的音色语音发送给对方。。。
额,也不是很绕口,就是难就难在使用自己的音色,毕竟懒得开口嘛。。。额也许有其他不能开口的客观原因呢。比如:

  • 在公交车/地铁上人多不方便语音
  • 在图书馆看书不方便回复语音又不想跑外面去
  • 在你心情不好不想说话又不得不哄的时候|ू・ω・` )

等等,还有很多实用场景,这里就不一一举例了。至于实现的难点嘛,则有:

  • 使用自己的音色,自己录制几个小时的甚至更长时间的朗读音频用作训练。。。
  • 如何嵌入到微信用,毕竟微信没那么大方。。。
  • 还有就是一些安全问题,自己的独特声线容易泄露被其他人利用。。。

解决方案

在网上溜了一圈,就看到这个老哥的一篇,不得不说微软的TTS是真的强。。。

https://zhuanlan.zhihu.com/p/49711377

而我想的解决方案是,在本地生成这个audio.mp3文件后发送一个链接给对方(在微信中),ta打开自动播放也就能听到我们的声音了。鉴于目前没有可以支付美刀的信用卡,不能注册使用Azure,所以只能先用百度这个凑合着用吧,先自己挖一个坑,以后有时间再填。。。over



这篇关于百度云语音合成 Python SDK的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程