菜单总览
— 招生活动 —

【中大名师讲座】用于学习及保健的语音语言技术中的人工智能

  • 2018.09.07
  • 招生活动
口语是人类交流的主要形式之一。 人工智能在研究口语时必须结合声学、语音学和语言学的知识来分析语音。目前,人工智能在一般语音识别方面取得了很大的进步,使得AI语音识别能力与人类持平。但香港中文大学的研究团队仍一直专注于识别和分析非母语人士/语言学习者的语音,以便在计算机辅助发音训练中实现错误发音检测和诊断的功能。为了生成个性化的纠正反馈以增学习体验,我们还研发了语音后验概率(PPGs)技术。该技术基于语音转换,输入任意文本,即可实现个性化的跨语言文本转语音的合成功能。此外,我们还专注于替代和增强交流的辅助技术,探索如何能够自动识别和分析语音障碍人士的语音记录,让患有言语障碍的人也能从中受益。分析此类型的语音记录有助于我们为有需要的人士提供适合的干预策略。此外,我们进一步研究了语音转换技术,从而把有障碍的语音,哪怕只是零散的几句话,恢复为正常语音。 在本次演讲中,我将介绍以上工作中遇到的挑战,我们的解决方案,以及下一步的研究方向。

主题:用于学习及保健的语音语言技术中的人工智能

主讲嘉宾:蒙美玲 教授

日期:9月10日,周一

时间:16:30-17:30

地点:道远楼理事会会议室

语言:英文

嘉宾简介:

    蒙美玲教授是香港中文大学系统工程与工程管理系教授。她创立了香港中文大学利群计算及界面科技教育部-微软重点实验室,清华大学深圳研究生院-香港中文大学工程学院媒体科学、技术与系统联合研究中心,以及香港中文大学何鸿荣海量数据决策分析研究中心,并担任主任。她也是中国科学院深圳先进技术研究院-香港中文大学环绕智能与多模式系统研究室创始人,并于2007-2011年担任研究室主任。

讲座概要:

    口语是人类交流的主要形式之一。 人工智能在研究口语时必须结合声学、语音学和语言学的知识来分析语音。目前,人工智能在一般语音识别方面取得了很大的进步,使得AI语音识别能力与人类持平。但香港中文大学的研究团队仍一直专注于识别和分析非母语人士/语言学习者的语音,以便在计算机辅助发音训练中实现错误发音检测和诊断的功能。为了生成个性化的纠正反馈以增学习体验,我们还研发了语音后验概率(PPGs)技术。该技术基于语音转换,输入任意文本,即可实现个性化的跨语言文本转语音的合成功能。此外,我们还专注于替代和增强交流的辅助技术,探索如何能够自动识别和分析语音障碍人士的语音记录,让患有言语障碍的人也能从中受益。分析此类型的语音记录有助于我们为有需要的人士提供适合的干预策略。此外,我们进一步研究了语音转换技术,从而把有障碍的语音,哪怕只是零散的几句话,恢复为正常语音。 在本次演讲中,我将介绍以上工作中遇到的挑战,我们的解决方案,以及下一步的研究方向。