清华大学团队研发出新颖唇语解读系统
来源:光明日报 本报北京3月25日电(记者邓晖)人说话时嘴唇动作跟语音同步,清华可以通过识别唇动来进行语言交流。大学读系对于声带、团队统喉舌损伤的研发颖唇语解失声人群,唇语是出新一种不占用双手的、日常无障碍交流的清华有效方式。但唇语对讲话者友好,大学读系对解读唇语的团队统听众来说却并不轻松。为降低唇语解读难度,研发颖唇语解现有技术手段常采用磁场、出新视觉图像、清华超声波等方法。大学读系以最流行的团队统非接触式视觉图像方法为例,尽管其唇语识别准确率较高,研发颖唇语解但依然容易受到面部角度、出新光强、头动和遮挡等因素的干扰。特别是在新冠肺炎疫情期间,佩戴口罩给基于视觉的唇动解读带来全新挑战。通过直接捕捉面部肌肉细微动作解读唇语技术具有重要的科学研究价值与广阔的应用前景。 近日,清华大学机械工程系智能与生物机械团队与中科院北京纳米能源与系统研究所团队合作,研发出了一种新颖的唇语解读系统。相关研究成果在线发表在《自然·通讯》期刊上。 该系统包含低成本、自供电的柔性摩擦电传感器和基于原型学习的深度学习模型。传感器将唇部肌肉运动产生的电信号传输到解码系统,翻译成可沟通的语言。该研究测试分析了传感器的机械与电气性能,采集并提取了选定元音、单词、短语、无声语音和发声语音的唇动信号特征。通过比较同步采集的唇动和声音信号,证明了无论是否发声,嘴唇运动信号都具有一致性。进一步分析了语速与唇动模式等不同参数对信号特征的影响规律。提出了一种基于原型学习的空洞循环神经网络模型,用于唇动信号的识别,在20个分类(100样本/类)情况下,测试准确率达到94.5%。 值得注意的是,上述自供电传感器由柔性聚合物薄膜与柔性电极组成,可提高人体佩戴的舒适性。研究团队利用该系统进行了多种场景应用展示,如解锁大门的身份识别、移动模型车的方向控制、唇动/语音的实时转换等,展示了该系统在唇动识别领域的可行性和应用潜力。 面向失声人群日常无障碍沟通需求,该工作为特殊场景下唇语翻译应用开拓了创新的研究方向。此外,该工作在控制、个人身份验证、人机界面、残疾辅助、无声语音、情报、反恐任务实施、康复、生物医学工程和虚拟现实等诸多领域中都具有较大的潜在应用价值。 团队相关负责人表示,尽管该工作已展示了该技术的有效性和应用前景,但仍然面临系统可靠性、稳定性等问题。研究团队相信,随着研究的深入,该技术有望切实为失声人群服务,提供无障碍语言交流的科技手段。
- 最近发表
- 随机阅读
-
- 蚂蚁集团韦韬:人工智能实现大规模应用,需深耕AI根技术
- 华为将于5月26日举行下一代数据中心发布会
- 半路杀出程咬金 格力电器终止受让盾安环境9.71%股份
- 乌总统泽连斯基已向最高拉达提交关于延长战时状态的法案草案
- 北京顺义区调整相关地区风险等级
- 刚刚,杭州楼市新政落地!三孩家庭可多一个购房名额,落户即可买二手房
- Stifel:Shopee前景不明 下调Sea目标价至115美元
- 截至18日15时 北京丰台区封管控区域有这些
- 精彩!上海建科IPO,活生生是一个“问题个人”占了国企信誉便宜的案例
- 延长石油巴拉素煤业违规使用锅炉两年被罚25万
- 水果烂了一点就得扔了?听听专家怎么说
- 90家百亿私募仅9家年内正收益,7家来自上海,私募大佬纷纷致歉,痛苦与反思后将如何前行?
- 监管从严审核核酸企业上市,IVD行业兼并购热潮前夕布局下沉市场
- 燃气表生产商真兰仪表IPO即将上会 实控人认定与股权稳定性屡遭质疑
- 邹澜担任央行货币政策司司长
- 5月18日0至18时,天津新增19名阳性感染者,详情公布
- 欧洲央行官员称将寻求利率“迅速”正常化以遏制通胀
- 腾讯降速换挡:净利连续三季度负增长 To B业务扛起增长大旗
- 俄罗斯总统普京:美国在乌克兰建生物实验室研究病毒传播
- 360创始人周鸿祎建言数字经济:用“安全大数据”,形成国家级分布式安全大脑
- 搜索
-