解析声音奥秘 助力行业升级(经济新方位·走进国家制造业创新中心)

发布时间:2024-12-24 03:08:09 来源: sp20241224

  习近平总书记强调:“加强重大科技攻关,强化科技创新和产业创新深度融合,积极培育新业态新模式新动能,因地制宜发展新质生产力。”

  让科技成果从实验室走向生产线,国家制造业创新中心发挥着创新高地的作用。在已建成的29家国家制造业创新中心,创新链产业链资金链人才链深度融合,上下游紧密合作,产学研融通创新,原创性、颠覆性科技创新成果竞相涌现,加速向现实生产力转化,为推进新型工业化、建设现代化产业体系、发展新质生产力提供有力支撑。

  本报记者走进国家制造业创新中心,问成果、谈经验、探前景,看新产业、新模式、新动能如何培育壮大。

  ——编  者  

 

  向东,是中国科学技术大学高新校区;向北,是合肥市政府与中国科学院合肥物质科学研究院共同设立的合肥创新院——位于安徽合肥的中国声谷,是全国首个人工智能领域的国家级产业基地,已入驻科大讯飞、华米科技等2000余个企业,年产值超2000亿元。

  声谷北门,“国家智能语音创新中心”的牌子格外醒目。依托当地智能语音及人工智能产业集群,创新中心聚焦智能语音领域开展关键共性技术研究,产生了一批科技创新成果。在这里,如何加强科技创新特别是原创性、颠覆性科技创新?怎样及时将创新成果应用于产业?记者实地探访创新中心。

  智慧无人实验室——

  可24小时不间断智能语音交互检测

  “你好空调,屋里太热了。”“好的,已为您打开制冷模式。”人机对话越来越多出现在家庭中。和冰箱、洗衣机等家电相比,人们对空调的智能语音交互需求更强。然而,保证空调的“耳朵”足够灵敏,并不容易。

  “过去只能在密闭房间里,由测试人员播放声音并观察记录空调响应情况。”山东青岛海尔空调器有限总公司测试中心主任高孺说,人工测试方式不仅效率低下,而且很难模拟复杂使用场景。去年3月,高孺偶然听说国家智能语音创新中心在建智能语音交互的智慧无人实验室,便立刻去实地了解情况。

  进入智慧无人实验室,宛如置身专业录音棚——四周布满调节混响的吸音扩散板和亚克力半球,各式音箱分布其中。“通过混响调节,能模拟10平方米至300平方米的声场环境,19个音箱能模仿多种场景的背景噪声。50平方米的实验室可以还原95%以上的语音交互使用场景。”国家智能语音创新中心公共检测服务平台开发工程师李孟辉介绍,实验室可实现24小时不间断智能语音交互检测,依托中心数百万条的语料库,各类语音涵盖近200种语音、语言,以及各个年龄段、各类人群的口音。

  以空调检测为例,工作人员只需设置好相关参数,智能机器人即可到达指定地点,通过仿生人工嘴播放声音。测试台旁的拾音器,会自动识别空调反馈结果。实验室上方的摄像头,会对空调显示面板进行拍摄。检测任务结束,将自动生成检测报告,对响应成功率、响应时间、失败原因等进行反馈。

  通过与中心合作,海尔在青岛“复制”了实验环境。“今年投入使用。按一次测试20秒计算,一天可完成超4000次测试。”高孺说,有智慧无人实验室助力,如今海尔生产的空调,不仅可以进行普通话的语音交互,还可以“听懂”多地方言,部分出口产品掌握了多语种能力。

  据介绍,中心采用“公司+联盟”的形式组建,汇聚了国内智能语音领域的龙头企业、科研机构,中心则作为发动机,驱动股东单位以及联盟的协作运转。“这种模式有助于促进中心与企业、企业与企业之间的合作交流,推动科技创新成果在制造业中的应用发展。”国家智能语音创新中心总经理吴江照说。

  工业AI方案——

  变电站单站巡检时间缩短到30分钟以内

  当一个配备有20余台10千伏开关柜的变电站出现异响时,如何快速识别故障区域?“很难直接用耳朵分辨异响来源,过去只能逐个检查。”国网马鞍山供电公司运维检修专工汪隆臻说,“现在使用声纹识别装置,能快速锁定出现故障的位置。”

  所谓声纹识别装置,由中心联合科大讯飞与国家电网安徽电科院共同研发。“中心此前就在探索声纹技术如何应用于工业化场景,沟通后发现安徽电科院也有这方面需求,于是‘一拍即合’。”科大讯飞工业智能研究院副院长李俊说。

  声纹识别装置还能判断故障原因。“我们的专业技术人员加入研发,分析各类声音样本代表何种故障,进而训练装置的算法模型。”安徽电科院电力运检工程师张晨晨说。

  如今,声纹识别装置已应用于浙江、安徽、广东、宁夏等地的40余座变电站,能够准确发现局部放电、短路冲击、夹件松动、冷却器异响等问题,将单站巡检时间缩短至30分钟以内,还降低了人工现场作业的频次和安全风险。

  声纹识别只是中心提供的多种工业AI(人工智能)方案的一种。各类方案加速落地,为传统产业集聚新动能。

  中心工业AI项目负责人黄伟这段时间忙着和同事一起,给合肥海尔工业园的空调总装生产线安装智能质检设备。“此前有一条生产线安装了智能质检设备,效果不错,现在要在更多生产线上进行铺设。”黄伟说。

  过去,一名工人一天要检测千余台空调。“检查品牌标识时,因为反复观看,很可能会出现视觉疲劳。”合肥海尔空调器有限公司总经理戴永胜说,“如果是具备语音交互功能的产品,还需要工人发出语音指令。”为提高检测效率,戴永胜找到国家智能语音创新中心,联手研发智能质检设备。

  记者在现场看到,智能质检设备形如在生产线上加装了半封闭式长方体铁盒。当空调由生产线进入时,设备内部音箱发出语音指令,摄像头和录音设备则会判定产品给出的回应是否正确。分布在其他位置的扫码器、摄像头,还会对商标、能效等级、型号铭牌等信息进行确认。当产品“走”出质检设备时,检测结果随之在后台显示。

  “智能质检设备可以完成产品功能、语音交互、标识外观等7类20余条质检任务,准确率高达98.5%。”戴永胜介绍,一条生产线的质检设备,每天可完成超4000台产品的检测,未来计划在公司家电生产线上全面应用。

  AI模型全托管云服务平台——

  支持超过1000个算法模型上线运行

  作为语音领域头部企业,科大讯飞掌握大量语音识别、语音合成的算法模型。“不同语种涉及不同算法,过去每套算法各自分散落地,耗时周期长,人力投入大,需要做大量重复的建设和运维工作。”国家智能语音创新中心AI模型全托管云服务平台项目总监郑威说。

  吴江照也认同:“创新型企业或者科研院所如果想让某套算法落地,不仅需要算法工程师,还要有工程框架设计师、测试人员、运维人员,同时还要有算力资源的支持。”

  2020年初,中心和科大讯飞的语音云平台研发部共同开发了AI模型全托管云服务平台。将设计好的算法导入其中,就能实现科研成果落地,整个过程一般不超过两天。

  如今,平台托管的算法模型种类不限于智能语音领域。应用型企业可以选择需要的算法模型,“就像逛超市一样,大家对自然语言理解、图像识别、声纹识别等方面的需求,都可以在平台上找到对应的能力引擎。”吴江照说。

  平台为商汤科技、小牛翻译、中科大等多个厂商和高校提供托管服务,支持超1000个算法模型的运行。平台接入总应用数超200万,累计覆盖终端用户近40亿,日均总服务量超20亿次。

  围绕创新成果落地,一系列政策举措相继实施:合肥市经信局举办产业融合对接会,邀请20余家重点制造业企业参会,6家企业初步达成合作意向;安徽省印发《打造通用人工智能产业创新和应用高地若干政策》,提出加快全时全域场景应用,构建良好产业生态。

  “各项举措持续支持,中心的创新动能将不断增强。”吴江照说。

  《 人民日报 》( 2024年05月16日 02 版)

(责编:白宇、卫嘉)