无障碍链接

中国时间: 04:43 2016年12月06日星期二

语音识别技术 - 2002-12-17


当美国人打电话预定飞机票或者查证一份银行结算单时,听到的第一个声音往往不是一个真人,而是一个电脑化的交流系统。

大多数自动答话者都会要求打电话的人按电话上某个键,以便听到某一类信息。可是,现在越来越多的答话者都给打电话的人提供若干种选择,让他们说出想要哪种选择。虽然语音识别系统已经更加精确,但它们还是会出现错误。它们在处理不同的讲话方式方面还会遇到麻烦。许多语音识别系统在听到带有外国口音的说话时就完全听不懂了。

*人际语言处理*

在打电话查询信息时,人们常常听到这类预先录制好的话,指导他们在许多选择当中找到自己想要的那一项。由于那些对人际语言交流着迷的语言专家的帮助,这种人机互动正在迅速变得更加迷人。研究人们的各种讲话的语言学教授达恩・朱拉夫斯基说:“我们做的是最基本的事情。我们整天都做这件事。除了睡觉以外,我们在工作日中花在研究语言方面的时间比在任何其他事情上花的时间都要长,而睡觉和研究相比较,趣味则要少得多。”

朱拉夫斯基在科罗拉多大学研究他最喜欢的课题。他开发了一种软件,让电脑弄懂人类语言的微妙,帮助电脑理解人们并且同人们谈话。朱拉夫斯基说:“你知道,当你听人家说话时,单词的中间是没有停顿的,对吧?它们都会连在一起。那么你如何知道这些单词的位置呢?你怎样听到词与词之间的界限呢?”

*话语下达指令*

朱拉夫斯基教授集中研究的是电脑语言系统,它使用户可以用话语来下达指令,而不必在键盘上打字输入。他的基本研究已经导致开发出一些电脑系统,例如科罗拉多大学口语研究中心的语言交流器软件。韦恩・沃德是朱拉夫斯基教授的同事,他帮助设计出这种电脑系统。沃德通过打电话订机票来演示这种系统是如何工作的。科罗拉多大学的语言交流器使用的是真正的订票数据。在你听的时候,请注意听沃德直接说话的风格以及他的南方人那种慢吞吞的拖腔。还要记住他是对电脑讲话。

“欢迎访问科罗拉多大学语言交流器。你有什么旅游计划呢?”

“我想订11月3号从丹佛到波士顿的机票。”

“让我看一下。我给你订的是11月3号从丹佛到波士顿的机票。对吗?”

“对。”

“你还要从波士顿返回丹佛吗?”

“对,第二天下午返回。”

“让我看一下。我给你订了11月4号从波士顿到丹佛的机票,对吗?”

“对。”

“你在波士顿需要租车吗?”

“要赫兹租赁公司一辆加长的车。”

“赫兹公司有一种加长的、带空调的自动车,没有里程限制。这可以吗?”

沃德清楚并简洁地和这个办理旅游业务的电脑说话。而在下面这段人机对话中,人的讲话有点儿语无伦次。还带点儿中西部人特有的鼻音。

“欢迎访问科罗拉多大学语言交流器。你有什么旅游计划?”

“我还没决定呢。”

“你有什么旅游计划?”

“我想去...我现在不知道该去哪里。去华盛顿纪念碑吧!”

尽管这台可怜的电脑做了非常艰苦的尝试,它还是弄错了。

“好吧,让我看看。我给你订从夏威夷州的阿尔伯克基市到堪萨斯城的机票,对吗?”

“不对,你这个蠢货。”

“哎哟!让我再试试。我是让你到达堪萨斯城,这一点对吗?”

“对了。非常感谢。”

“我给你订的是从夏威夷州的阿尔伯克基市出发的机票,我订的票对吗?”

“不对。”

“那你打算从夏威夷州哪个城市出发呢”

“我想从新墨西哥州出发。”

“你想从新墨西哥州哪个城市出发?”

“你总算搞对了!”

*人声识别困难*

尽管犯了一些错误,但是这台电脑理解各种不同谈话方式的能力给人的印象很深,它可以理解沃德的南方拖腔和另一个人的中西部鼻音。南方拖腔和中西部鼻音也许算不了什么,但是朱拉夫斯基教授说,语言上的一些微小的变异也能对电脑语音识别器造成比较大的问题。朱拉夫斯基说:“电脑在理解下面这3种人的话语方面有困难,这3种人是儿童、声音嘶哑的老人以及外国口音很重的人。在工程方面最有趣的研究领域之一就是如何使我们的语音识别器在识别口音方面具有强大功能。带西班牙口音的英语和美国中西部口音的英语区别在哪里呢?在选词造句和说话节奏方面的区别是什么呢?”

*改善人机关系*

朱拉夫斯基说,由于语言是在不断地变化,美国的电脑程序员将总是需要对于那些问题拿出新的解决方案。朱拉夫斯基说:“我们是一个移民国家。我们的每一代移民都有不同的口音。总会有人说话带口音的。”朱拉夫斯基教授说,他希望有朝一日,所有电脑都能理解各种口音和语言,因为这将使世界各地的人们更容易使用电脑技术。此外,由于能谈话的电脑似乎也具有个性,而语言学教授的理论是,比较好的语音识别系统将会改善我们同这些日益复杂的机器的关系。为了表彰朱拉夫斯基教授在人机对话方面所做的努力,麦克阿瑟基金会今年给了他50万美元的麦克阿瑟天才奖。

XS
SM
MD
LG