【e谷观察】声智科技:交互让机器更智能

【e谷观察】声智科技:交互让机器更智能
    马上咨询

    新一轮疫情防控得到全面控制,多地社区也陆续“解封”,但解封不等于解防,在后疫情时代,人工智能在科学防疫的应用场景中发挥着不可替代的关键作用,AI技术打造的多项无接触应用正全面助力疫情防控常态化。

    本期《e谷观察》聚焦北京声智科技有限公司(简称:声智科技),一家融合声学和人工智能技术的平台服务商,通过自有AI技术在疫情防控中做出杰出贡献的公司,获得工信部表彰和中央台、人民日报等媒体报道。


    加速科研成果转化,创新惠及更多公众 


    声智科技创始人、董事长兼CEO陈孝良,2002年毕业于北京航空航天大学获得管理学学士学位,之后到中国科学院大学读书获得工学博士学位,曾任中国科学院声学研究所副研究员。科学家创业一般在探索科研成果转化方面都要经历很多艰辛,这是因为前沿技术类的创业项目与模式创新类创业项目不同,要求创始团队拥有深厚的技术积累与前沿的商业嗅觉,80后的陈孝良就是其中非常敏锐的一位。

    《e谷观察》两次到访声智科技并与之交谈,发现他比一般科研工作者多了共情和同理心的气质,又比大部分互联网公司创业者多了些严谨求索的学术气息。他专注人工智能与物理声学融合领域13年,对连接数字世界和物理世界的未来充满了憧憬。就是因为这些梦想,2016年他带领团队创办了声智科技。


    陈孝良


    智慧生活 


    因为声学研究所的背景和技术沉淀,最开始声智科技专注于人机交互方式中语音交互技术的研究和在智慧生活方面的应用,赋能智能产品听见、听准和听懂的能力。

    语音交互作为人机交互最重要的入口,包括近场语音交互与远场语音交互。比如手机的语音打开方式,当我们要向手机发出语音指令时,需要先按下手机的语音按键,才能让智能手机作出反应,这便是近场语音交互。但从用户的角度来说,真正意义上的语音识别是可以解放双手输入的。远场语音功能省略了“按下手机语音键”这一程序,比如智能音箱,在适合人与人自然交互的距离之内,对机器说出指令,即可得到反馈。

     

    智能音箱灯


    从近场交互到远场交互,声智科技突破了多项远场语音交互的声学感知和语义理解关键技术,包括回声抵消技术、噪声消除技术、声源定位技术、语音识别技术等。2017年,声智科技联合Xilinx和Cypress发布FPGA远场语音交互开发板,支持百度SoundPi开放平台发布,支持小米发布小米AI智能音箱,凭借领先的智能语音交互技术以及开放、灵活的合作模式,赢得了智能设备、智能家居、智能汽车、智能安防、智能金融、智能教育和机器人等多个领域,包括小米、阿里、腾讯、百度、华为、360、亚马逊等众多行业头部客户的认可与青睐。 


    智慧健康 


    伴随着人工智能的快速发展,声智科技关注并意识到人机交互、协同过程中,单一技术能做的事情非常少,商业价值不高,需要将很多的技术组合起来,即多技能多模态,这样才能做出比较有影响力的成果。SoundAI Azero(壹元人工智能开发框架)是声智科技于2018年发布并在2019年进一步升级的,基于声智科技的远场声光融合、多模态识别(声音、文字、图像、手势等)、推理和翻译、推荐搜索等技术的AIoT基础开发框架,这是声智科技得以迅速发展的核心技术,也是声智科技在智慧健康领域实现应用落地的重要原因。  

    SoundAI Azero AloT基础开发框架


    2020年,突如其来的新冠疫情暴露出传统医疗信息化和公共卫生管理的短板,也加速了声智科技在智慧健康方面的加速创新和落地应用步伐这些服务和产品都快速渗透到后疫情时代的各个健康版块。

    北京核酸检测信息统一平台,是声智科技基于SoundAI Azero人工智能开发框架开发的重要抗疫平台之一,包含采集、识别、翻译和外呼等众多技能,使检测效率提升5-10倍;一站式疫情防控健康管理平台,居民可以使用小程序进行疫苗接种和核酸检测预约;医联网翻译设备IDA,利用AI翻译技术实现对卫生健康机构和防疫机构组织部门之间的数据互联互通,降低防疫链条成本、提升数据安全保护的能力。AI虚拟数字人红外测温系统,具备人工智能交互和预警能力,减少人工投入,降低一线安检人员感染风险,提高安检效率;AI电梯与安全监管平台,不仅提供全程非接触乘梯体验,并且支持多种方言识别,还可以将人、设备集中在“一个屏幕”进行呈现和管控,避免了疫情期间的交叉感染风险;此外,还包括AI医疗智能屏、智能流行病学调查系统等在内,累计用新产品智慧服务1亿+人次。

    核酸检测信息平台


    智慧电梯

    声智科技基于SoundAI Azero人工智能开发框架的多项抗疫、防疫应用成果纷纷落地,为助力科技抗疫做出了突出贡献。


    智慧城市 


    新基建浪潮下,声智科技也积极投身于智慧城市建设,提供覆盖城市生活出行、居住、办公等全方位的创新AI产品和方案

    北京智慧垃圾分类平台是声智科技在智慧城市领域的率先尝试。它融合了AI数字人、人脸识别 、智能语音交互、行为识别、视频监控等AI技术,实现全流程"AI数字人垃圾分类管家"引导与值守,使垃圾分类的管理快速见效、持续有效。智能垃圾桶检测到人路过时会语音提示,并且可以识别人员身份,支持多种智能辨识方式。使用时可以在设备端进行注册,信息会储存在云端,方便实时记录垃圾投递的个人积分、垃圾称重等数据,为后续监测提供可视化管理。


    智慧垃圾分类


    海淀区中关村壹号园区、海淀区万寿路街道,以及房山区合景领峰社区匹配的声智智能垃圾桶都在智慧运营管理平台的统一监管下,用一块大屏就可以对辐射范围内垃圾投递进行统一监测。垃圾投递站点是否已经溢满,垃圾堆积导致的空气质量状态,垃圾投递行为,各类垃圾的重量等信息都可以一览无遗。

    此外,声智科技在智慧文旅园区、城市大脑、平安社区等领域做出了创新应用,如位于通州智慧文旅园区的环球影城项目。

    截止目前,声智科技已获得国家/北京市专精特新“小巨人”企业、北京市科学技术进步二等奖、北京市知识产权试点和示范单位、中关村前沿技术企业、中国经济十大创新企业、十大AI产品创新奖等100余项荣誉资质与1000余项自主知识产权


     声智科技荣誉墙一角


    《e谷观察》认为人机交互技术是人工智能产业发展的核心驱动力,AI产业的发展将极大地加速人类的创新步伐和创造社会价值的效率。从世界上第一台通用计算机“ENIAC”采用打孔小纸条来实现指令与结果的输入输出开始,是人机交互的最原始形式;之后键盘直接解决了计算机文本输入难题,有了真正意义上的人机交互;鼠标、触摸屏、绘图板、手写笔等“指点设备”的诞生,实现了图形化可视化的人机交互;苹果公司将手机键盘改成屏幕手指交互从而彻底改变了人们的使用习惯;马斯克宣布的脑机接口技术的实现,开启人类脑机交互的新革命;而人工智能应用到军事领域,比如战斗机中的视觉跟踪,可以让作战飞行员能够“瞄哪儿打哪儿”……未来的人机交互将呈现多元化的交错式发展态势,谁能将各种不同的技术融合在一个平台上,谁就是赢家。

    应用场景落地难是当前人工智能产品普遍面临的困难,不少人工智能公司都在“持续技术投入”与“模式创新”中“夹缝求生”。声智科技通过对技术的持续研发投入,目前已在多个场景下实现应用,尤其是通过不断迭代的交互技术,让场景的落地更为便捷。《e谷观察》希望声智科技可以通过对多模态交互技术的不断投入与研发,持续提高行业技术壁垒,使SoundAI Azero最终成为“AI时代的行业底层操作系统”