致力于追求卓越
全球70%用户的共同选择
Cimon介绍
Cimon声学软件,基于业界领先且量产验证的成熟技术,为客户提供多种真实应用场景下“听清、听懂、能言”式的智能交互能力,广泛应用于智能家居、智能会议、智能教育、智能医疗、智能制造、智能汽车、金融科技、能源电力、智慧法院、智能交通和机器人等领域,提供智能控制、智能问答、智能推荐等多种服务,提升服务效率和质量。
核心技术
远场声学处理
前沿声学技术优势,拥有完全自主知识产权;包括回声抵消、噪声抑制、声源定位、混响消除、波束形成等;
远场语音唤醒
业内顶尖唤醒技术之一,实时响应,让机器听到人类指令;支持双名唤醒、离线语音唤醒、抗强噪语音唤醒、声纹认证唤醒、Open AEC唤醒等,可定制级唤醒词、快捷命令词等;
远场语音识别
业内顶尖语音识别技术之一,精准、快速和稳定,让机器听懂人类语言;覆盖局部场、近远场、超远场、分布场多种场景,深度匹配办公、家居、出行等垂直场景交互需求,支持Free-ask、One-shot、VAN等技术;
远场语音合成
业内顶尖语音合成技术之一,让机器拥有说话的能力; 提供更发音更自然、更专业、更符合场景需求的语音合成服务,支持多种音色定制,可自定义音量、语速等;
独有技术
单麦克风降噪
麦克风阵列降噪
自定义唤醒
离线唤醒
离线命令词识别
InverseArray
倒置麦克风阵列技术
Dualwake
双名唤醒
Penetrated DOA
穿透式波达方向估计
VAN
垂直场景抗强躁
AKS
抗强躁声唤醒
SSP
空间认知
SSA
空间感知
OneShot
一句连控
Free-cut
随时打断
Free-ASK
随时唤醒
TVNS
TV Noise Suppression
OpenAEC
开放声场回声消除
VibratedAEC
动态声场回声消除
产品体验
混响抑制
去混响算法
去除房间混响导致语音拖尾的去混响算法
有效去除由于房间混响造成的语音拖尾现象,增强语音清晰度,提升远场语音识别率。
  • BEFORE
  • AFTER



  • HZ
    时间(s)



  • HZ
    时间(s)
  • 回声消除
    AEC算法
    针对唤醒引擎深度优化的回声消除算法
    收敛时间小于0.5s,回声抑制量超过35dB,即使在DoubleTalk情况下算法仍然鲁棒,并且针对声智科技的唤醒引擎进行深度优化,可以有效提升音乐状态或TTS状态下的唤醒率。
    • BEFORE
    • AFTER



  • HZ
    时间(s)



  • HZ
    时间(s)
  • 波束形成
    Beamforming算法1
    去除空调、胎噪等平稳噪声的Beamforming算法
    主方向语音不失真的前提下,有效去除空调、胎噪等平稳噪声,平稳噪声抑制量大于30dB。
    • BEFORE
    • AFTER



  • HZ
    时间(s)



  • HZ
    时间(s)
  • 波束形成
    Beamforming算法2
    去除环境中的语音、电视等非平稳噪声的Beamforming算法
    在保护主方向语音的同时,去除环境中的语音、电视噪声等非平稳干扰,其中非平稳噪声抑制量大于20dB,在噪音环境下可以大幅提升远场语音识别率。
    • BEFORE
    • AFTER



  • HZ
    时间(s)



  • HZ
    时间(s)
  • SoundAI 双工通话算法效果对比
    抑制散射式背景噪声,消除双方同时讲话产生的回声,让对方能清楚听见您,又可以同时讲话,保持自然清晰的听觉感受。
    • BEFORE
    • AFTER



  • HZ
    时间(s)



  • HZ
    时间(s)
  • 语音识别演示视频
    远场语音识别技术是在声源和麦克风距离较远的情况下,通过麦克风阵列前端处理算法,有效降低噪音,同时对目标说话人声音进行增强,使得智能家居、智能硬件、机器人语音交互等场景下的远场语音也可准确识别。声智科技的远场语音识别技术可保证即使声源在三至十米的距离也能被智能产品准确识别,语音唤醒率达95%以上,支持Duel-wake(双名唤醒)、Free-cut(随时打断、随时唤醒)、OpenAEC(大噪声下有限参考信号语音唤醒)、AKS(抗强噪声唤醒)等功能。能够实现全方向(5米360°)精准唤醒,减少无序唤醒干扰,正确率达到96%以上。并且深度匹配办公、家居、出行等垂直场景交互需求,达到了行业领先水平,能更大程度优化用户的使用体验,让语音交互更顺畅自然。
    声纹识别演示视频
    声纹同指纹一样,是每个人唯一的生理特征。声纹识别也称为说话人识别,是一种通过声音判别说话人身份的技术。随着技术的不断迭代进步,未来可以根据声音条件识别出不同的使用者,不只可以保证服务的安全性和私密性,更是可以实现“千人千面”的个性化服务,依据用户行为进行内容设定与推荐。其中,声智科技语音扩展技术提供了丰富的信息分析和挖掘服务,支持声纹识别、年龄识别、情绪识别、性别识别、哼唱识别、异响检测等功能。在未来,声智科技将持续更新和迭代技术,解决更复杂声学场景下的远场声纹识别等影响用户体验的关键问题。