打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Python调用百度API实现语音识别(一)

1

前言

上篇文章介绍了下如何用 Python 剪辑视频,想回顾的同学可以拉到文章最下面,有历史链接。

有了上篇文章野狼disco的音频,今天就来带大家玩一下百度的API,如何借用百度 API 的语音识别功能,将我们的音频转为文字。最终落地到 word 中。

当然,转为文字后,也为之前语音机器人做了铺垫,转换的文字可以写入到程序中,后续机器人朗读声音而用。

2

百度 API 官网准备工作

1. 搜索

2. 开放能力 -> 语音技术 -> 语音识别

可以看到这里有三种语音类型,点哪个都行,这里选择语音识别即可。

先点击技术文档看下:

左侧实际上只包含了标准版和极速版,没有看到长语音版。

对比了下价格,果断选择了标准版!自己玩,怎么实惠怎么来!


看了上面普通版的文档,有几点需要注意的:

1. 格式

原始 PCM 的录音参数必须符合 16k 采样率、16bit 位深、单声道,支持的格式有:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。

百度开放平台

2. 时长

目前系统支持的语音时长上限为60s,请不要超过这个长度,否则会返回错误。

百度开放平台

3

注册获取key

不论是之前写过的调用高德api,还是这次的百度api,都可以找到共性,你在用别人提供的接口时,必须要有身份验证这一步。

这意味着你需要去人家平台注册,获取到人家平台给你颁发的身份验证。也就是 key 之类的信息。

查看 Python SDK 文档发现:

文档页的右上侧,有个控制台,点进去,自己注册下。

1. 左侧音频图标 -> 创建应用

2. 填写信息

3. 完成

4

总结

前戏已备好,key等信息已经有了。只需要记住上面说的两个注意点即可。



本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Python语音识别案例|手把手快速尝鲜百度语音技术SDK包|机器语音
百度语音识别REST API
Python3从零开始搭建一个语音对话机器人
手机微信语音批量转文字 使用百度语音识别
python通过调用百度api实现语音识别(超详细)
[WPF 学习] 15.播放百度合成的语音
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服