语音识别ASR

价格	面议
品牌	腾讯
区域	全国
来源	昆山昱唯网络科技有限公司

详情描述：

腾讯云语音识别（Automatic Speech Recognition，ASR）为开发者提供语音转文字服务的佳体验。语音识别服务经微信、腾讯视频、王者荣耀等大量内部业务验证，同时也在线上线下大量外部客户业务场景下成功落地，具备识别准确率高、接入便捷、性能稳定等特点。腾讯云语音识别服务开放实时语音识别、一句话识别和录音文件识别三种服务形式，满足不同类型开发者需求。

功能

腾讯智能语音产品提供多场景强大功能，满足不同类型开发者需求。语音识别分为三种服务，您可以根据使用场景进行选择：

实时语音识别

对长音频流进行识别，支持智能断句，实时识别为文字。

适用于持续时间较长、有一定实时性要求的场景，例如语音输入、会议现场记录、电话会议记录、会场字幕、直播内容审核、视频直播字幕、智慧法庭记录、客服通话内容记录等场景。

语言和方言：语音识别服务目前支持中文普通话，和带有一定方言口音的普通话识别；实时语音识别还可以支持英文16k音频识别。

音频格式支持：支持16bit、8k或16k的单声道中文音频识别；支持16bit 16k单声道英文音频识别；支持音频格式为wav、pcm、sppex、silk。

音频数据长度支持：每个数据包的音频分片大不能超过200k。

一句话识别

对60秒之内的实时短音频流进行识别，可应用于运营活动，和各种语音交互场景，例如语音输入、语音短信、语音搜索、智能硬件和智能语音助手的语音指令等。

语言和方言：语音识别服务目前支持中文普通话，和带有一定方言口音的普通话识别。

音频格式支持：支持16bit、8k或16k的单声道中文音频识别；支持音频格式为wav、mp3。