4月19日开幕的上海车展发挥了引领全球汽车行业技术和市场的风向标作用。其中,“软件定义汽车”已从幕后走向前台,智能网联正成为全球车企逐鹿的产业高地之一,众多参展的整车和零部件企业纷纷亮出了自己的“家底”。
作为将人工智能赋能汽车的代表性企业,科大讯飞在本次上海车展的合作成果丰硕。车展现场,沃尔沃、别克、日产、红旗、广汽、长安、蔚来等超过20个汽车品牌的近百款车型搭载了讯飞的智能汽车产品。
说到科大讯飞,很多人的第一印象是语音。的确,在汽车智能化领域深耕的18年里,智能语音一直是科大讯飞面向市场的一面旗帜。从最初的命令词语音识别系统,再到后来的麦克风阵列降噪技术、AIUI对话式人机交互技术......科大讯飞构建了包括语音唤醒、语音识别、自然语言理解、语音合成、声纹识别、声源定位等在内的全闭环的汽车智能语音交互核心技术,并借此打破了国外厂商对中国语音市场的垄断,让超过2900万辆车上飘扬着讯飞的声音。
随着大数据、人工智能、云计算等各种科技不断发展,行业格局正在被快速重构,汽车正在进化成为一个可以自学习、自进化、自成长的个性化智能终端。汽车座舱需要有察言观色的能力,时刻思考用户需求,以便主动提供服务。融和语音和视觉的多模态交互能力变为刚需,这成为了科大讯飞技术升级的一个契机。科大讯飞研发的多模态人机交互和驾驶安全守护技术解决方案,包含了多项技术能力:
1、大规模人脸库训练的红外异质FaceID技术,能够实现活体检测和无感登录,并以此为基础实现个性化服务,让汽车更懂用户,让服务更周到。
2、基于眼睛和嘴巴开闭度的感知技术,能够判断用户疲劳程度,结合头姿估计和视线追踪技术,能够准确判断视线是否离开路面,并针对用户打电话和抽烟等行为,实现对应的车辆控制与提醒等。多种信息的融合处理,让车辆驾驶更安全。
3、汽车级视线追踪技术,让用户注视即可实现唤醒交互,目光所至皆可控制,极大减轻了交互步骤和语音交互所带来的问题。
4、唇音融合语音技术,具备唇音免唤醒、唇音检出、唇音增强三大核心能力,开口说话就能一语直达,就算是轻声细语,也能听清。
在多模输出上,讯飞多模态交互解决方案最终会以形象复刻、口型同步、动效展示、氛围灯律动等更具有科技感的方式呈现。
可以说,在强大的语音能力构建的基石上,科大讯飞实现了“听、说、看、显”全链路技术升级,并将其融入到核心产品中,带来了颠覆性的变革。不仅如此,科大讯飞在数字座舱的音效管理、车联网系统软件及数据服务等多个领域都成绩斐然,实现了技术突破、产品创新和服务升级。
目前,科大讯飞正基于“汽车AI技术、汽车云服务、汽车软件工程化”三大底座,围绕汽车“研产销服运”价值链,以及用户“买车,用车,养车和卖车”用户体验链,向客户提供车联网产品系统解决方案。全新一代飞鱼OS作为新一代模块化车联网软件解决方案,实现了视觉技术落地。飞鱼智能助理新增了多语种能力,正全面布局海外市场。飞鱼智云已经成长为全链服务数字化平台,将更好助力车企数智化转型。汽车智能销服解决方案的上线也将有利于挖掘汽车销服全业务环节价值。汽车音效产品能够实现车内声场重建,并根据需要提供引擎合声、电子提示音、雷达音等辅助驾驶提示,甚至通过声学处理,让普通的车也可以具备豪华车的音响体验。可以说,面向汽车行业,科大讯飞已经形成了更丰富的产品序列,具备了从算法到工程、从软件到硬件、从智能终端到云平台的全面能力。
未来可期,相信科大讯飞将能够继续围绕智能汽车未来产业发展方向,为汽车行业提供更多有竞争力的产品解决方案,协助汽车品牌打造智能汽车新时代发展的“数字化引擎”。






