功能介绍

为开发者提供精准的语音识别服务,即支持实时的指令同时也支持多种格式短音频,包括pcm、wav、ogg等。主要应用于社交聊天、智能家居等多场景智能语音交互。

使用方式背景图
常见问题
  • 问:如果是方言的话需要标注出来么?

    答:
    需要的,现在支持的方言有湖北、四川、东北、山东、河南、粤语,需要在请求头中标注出上传的音频是什么方言,不同方言支持的音频格式不尽相同,请到表格中进行对照。
  • 问:语音识别服务支持哪些音频格式和采样率?

    答:
    目前语音识别服务仅支持16KHz和8KHz两种采样率,其他采样率如48KHz建议重采样到16KHz后再调用语音识别服务,每种服务支持的音频格式不尽相同,请到各个的服务页面中进行查看。
  • 问:地名人名识别出错?

    答:
    这些属于专属词汇,请整理专属词汇成热词表,上传热词表之后,在请求头中加上此词表id,可以优化专有词汇的转译效果,上传热词的具体方法,请转到热词页面进行查看。