山东科威数控机床有限公司铣床官方网站今天是:2025-06-09切换城市[全国]-网站地图
推荐产品 :
推荐新闻
技术文章当前位置:技术文章>

语音导航设备及语音导航方法

时间:2025-06-09    作者: 管理员

专利名称:语音导航设备及语音导航方法
技术领域
本发明涉及一种导航技术,特别是语音导航设备及语音导航方法。
背景技术
当前,由于民用GPS (Global Position System,全球定位系统)技术的开放与发展,GPS技术已经越来越多的应用在民用的定位和导航中。当前大部分的车载导航设备都能够较为准确的指示当前的位置,并根据道路情况显示路线,极大的方便了驾驶者。但是,这些传统的导航设备却很难解决交互的问题。例如,驾驶者为了设置一个目的导航地不得不找个地方停下来,用手输入和查找目的地位置,这使得目的地导航的便捷性打了折扣。为了解决上述问题,具有语音识别功能的语音导航设备应运而生。所述语音识别是将人类语音中的词汇内容转换为电子设备的芯片可识别的输入。这样,驾驶者不需要用手输入和查找目的地位置,而只需发出语音指令即可实现导航设备自动向目的地导航的目的。然而,传统的具有语音识别功能的语音导航设备只能识别一些特殊的地名,如世界之窗、欢乐谷等,而不能对常规地名进行语音识别。此外,传统的语音识别技术在实现将人类的语音转换为电子设备的芯片可识别的输入时所使用的语法规则是将语音指令中的一句话作为一个整体跟模型库中的所有内容匹配一遍。例如,驾驶者发出的语音指令为“A市B区C路D号”,则原始的语法规则是将“A 市B区C路D号”作为一个整体,一次性与地名数据库(/模型库)中所有可能的地名组合匹配一遍。于是,当模型库的规模很大时,进行匹配识别的时间就会很长,严重浪费系统资源及时间。

发明内容
鉴于以上内容,有必要提供一种语音导航设备,其将输入的语音数据进行分段,采用多段识别的方法与地名数据库中的内容进行匹配,极大的减少了匹配识别的时间。此外,还有必要提供一种语音导航方法,其将输入的语音数据进行分段,采用多段识别的方法与地名数据库中的内容进行匹配,极大的减少了匹配识别的时间。一种语音导航设备,包括语音接收单元,用于接收关于导航目的地的语音数据V。 该语音导航设备还包括关键字数据库,其中存储有η个预设的关键字,其中,η为大于1的自然数;地名数据库,其中存储有地名信息的搜索树;语音识别单元,用于根据上述关键字数据库中存储的关键字对语音数据V进行分段,以生成η段语音数据Via =工ι),并采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备可以识别的输入形式;及电子地图,用于根据上述识别的输入形式,可视化地显示出导航目的地的位置与路线。一种语音导航方法,包括(a)语音导航设备接收关于导航目的地的语音数据V ; (b)从一个关键字数据库中获取η个预设的关键字,其中,η为大于1的自然数;(c)根据上述关键字对语音数据V进行分段,以生成η段语音数据Viii = ^n) ;(d)利用上述η段语音数据Viii 卜…采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备能够识别的输入形式;及(e)根据上述转换成的输入形式,在语音导航设备的电子地图上可视化地显示出导航目的地的位置与路线。本发明提供的语音导航设备及语音导航方法将输入的语音数据进行分段,采用多段识别的方法与地名数据库中的内容进行匹配,极大的减少了匹配识别的时间。


图1是本发明语音导航设备较佳实施例的硬件架构图。图2是本发明语音导航设备较佳实施例中一个地名信息的搜索树的示意图。图3是本发明语音导航设备较佳实施例中语音识别单元的功能模块图。图4是本发明语音导航设备较佳实施例中利用关键字对语音数据进行分割的示意图。图5是本发明语音导航方法较佳实施例的流程图。
主要元件符号说明
语音导航设备1
语音接收单元10
语音识别单元11
关键字数据库12
地名数据库13
电子地图14
中央处理器15
存储单元16
关键字获取模块110
分割模块111
地名信息获取模块112
匹配及权值计算模块113
路径选择模块114
地名整合模块115
定位模块11具体实施例方式
参阅图1所示,是本发明语音导航设备较佳实施例的硬件架构图。该语音导航设备1包括语音接收单元10、语音识别单元11、关键字数据库12、地名数据库13、及电子地图 14。所述的语音接收单元10可以是麦克风,用于接收外界的语音数据V。该语音数据V是驾驶者发出的导航目的地的语音命令。本实施例中,该语音数据V为“A市B区C路D号” 的格式。所述的语音识别单元11包括多个功能模块(详见图幻,用于根据上述关键字数据库12中存储的η个关键字对语音数据V进行分段,以生成η段语音数据Vi (i =工 n),之后采用多段识别的方法与地名数据库13中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备1可以识别的输入形式,并在电子地图14中可视化地显示出导航目的地的位置与路线。其中,η为大于1的自然数。本实施例中,所述关键字数据库12中存储着关键字的波形图。所述关键字可以是用户设定的。本实施例中,所述关键字包括“市”、“区”、“路”、及“号”。参阅图2,是地名数据库13中存储的地名信息的搜索树的示意图。本实施例中, 该搜索树的第一级节点,即根节点为省级单位,如广东省。该搜索树的第二级节点为市级单位,如广东省所包括的广州市、深圳市、珠海市、及东莞市等。该搜索树的第三级节点为区级单位,如深圳市所包括的罗湖区、南山区、及福田区等。该搜索树的的第四级节点为每个区的各条路,如宝安区所包括的油松路、建设路、人民路、及东环二路等。该搜索树的最后一级节点为每个路上的各个号,如东环二路1号、东环二路2号等。此外,所述语音导航设备1还包括用于执行语音识别单元11中各功能模块的中央处理器(central processing unit) 15,以及用于存储语音识别单元11中各功能模块的存储单元16,如硬盘等。参阅图3所示,是本发明语音导航设备1较佳实施例中语音识别单元11的功能模块图。所述语音识别单元11包括关键字获取模块110、分割模块111、地名信息获取模块 112、匹配及权值计算模块113、路径选择模块114、地名整合模块115、及定位模块116。所述关键字获取模块110用于从上述关键字数据库12中获取关键字的波形图。所述分割模块111用于将语音数据V中每个字的波形与关键字的波形进行比较, 当语音数据V中某个字的波形与其中一个关键字的波形相匹配时,从该字之后对语音数据 V进行分割,从而生成η段语音数据vi(i = i η)。参阅图4所示,关键字数据库12中存储有关键字“市”、“区”、“路”、及“号”的波形图。该分割模块111从语音数据V中第一个字的波形开始与上述几个关键字的波形进行比较,当语音数据V中某个字的波形与关键字“市”相匹配时,该分割模块111在该字之后对语音数据V进行分割。继续地,所述分割模块111将语音数据V中其余字的波形与余下的几个关键字的波形进行比较,当语音数据V中某个字的波形与关键字“区”的波形相匹配时,所述分割模块111在该字之后进行分割。如此直至语音数据V中每个字的波形都与上述关键字进行了匹配。所述地名信息获取模块112用于从地名数据库13中获取地名信息的搜索树。所述匹配及权值计算模块113用于从该搜索树的根节点开始执行遍历操作与上述η段语音数据中的第一段语音数据V1进行匹配,计算该根节点的每个子节点与上述语音数据V1的匹配度的权值,作为每个子节点的权值,并将该每个子节点的权值与一个预设的阈值相比较,并获取权值大于上述阈值的所有子节点。之后,该匹配及权值计算模块113继续从上述权值大于阈值的所有子节点开始执行遍历操作与下一段语音数据VMxttext = 2i)进行匹配、计算权值、与预设阈值相比较,获取权值大于阈值的所有子节点。如此直至第η段语音数据Vn都已经与上述搜索树进行了匹配。所述路径选择模块114用于计算所获取的所有子节点组成的每一条路径的权值总和,并选择其中权值总和最大的一条路径。本实施例中,每一条路径的权值总和的计算公式为
权利要求
1.一种语音导航设备,包括语音接收单元,用于接收关于导航目的地的语音数据V,特征在于,该语音导航设备还包括关键字数据库,其中存储有η个预设的关键字,其中,η为大于1的自然数; 地名数据库,其中存储有地名信息的搜索树;语音识别单元,用于根据上述关键字数据库中存储的关键字对语音数据V进行分段, 以生成η段语音数据Viii =卜…并采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备能够识别的输入形式;及电子地图,用于根据上述转换成的输入形式,可视化地显示出导航目的地的位置与路线。
2.如权利要求1所述的语音导航设备,其特征在于,所述的η个预设的关键字包括 “市”、“区”、“路”、及“号”。
3.如权利要求2所述的语音导航设备,其特征在于,所述的关键字以波形图的形式存储在关键字数据库中。
4.如权利要求3所述的语音导航设备,其特征在于,所述语音识别单元包括 关键字获取模块,用于从上述关键字数据库中获取关键字的波形图;所述分割模块,用于将语音数据V中每个字的波形与关键字的波形进行比较,当语音数据V中某个字的波形与其中一个关键字的波形相匹配时,从该字之后对语音数据V进行分割,从而生成η段语音数据Vm = ^^ ;地名信息获取模块,用于从上述地名数据库中获取地名信息的搜索树; 匹配及权值计算模块,用于从上述搜索树的根节点开始执行遍历操作与上述η段语音数据中的第一段语音数据V1进行匹配,计算该根节点的每个子节点与上述语音数据V1的匹配度的权值,并将该每个子节点的权值与一个预设的阈值相比较,并获取权值大于上述阈值的所有子节点,并继续从上述权值大于阈值的所有子节点开始执行遍历操作与下一段语音数据Vmxtfext = 2 η)进行匹配、计算权值、与预设阈值相比较,获取权值大于阈值的所有子节点,直至第η段语音数据Vn都已经与上述搜索树进行了匹配;路径选择模块,用于计算所获取的所有子节点组成的每一条路径的权值总和,并选择其中权值总和最大的一条路径;地名整合模块,用于整合上述权值最大的路径所代表的地名信息;及定位模块,用于根据上述地名信息在电子地图中进行定位,可视化地显示出导航目的地的位置与路线。
5.如权利要求4所述的语音导航设备,其特征在于,所述每一条路径的权值总和的计算公式为
6.一种语音导航方法,其特征在于,该方法包括(a)语音导航设备接收关于导航目的地的语音数据V;(b)从一个关键字数据库中获取η个预设的关键字,其中,η为大于1的自然数;(c)根据上述关键字对语音数据V进行分段,以生成η段语音数据Viii= ^n);(d)利用上述η段语音数据Viii= H),采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备能够识别的输入形式;及(e)根据上述转换成的输入形式,在语音导航设备的电子地图上可视化地显示出导航目的地的位置与路线。
7.如权利要求6所述的语音导航方法,其特征在于,所述的η个预设的关键字包括 “市”、“区”、“路”及“号”,及该η个预设的关键字以波形图的形式存储在关键字数据库中。
8.如权利要求7所述的语音导航方法,其特征在于,步骤(c)包括从语音数据V中第一个字的波形开始与所述“市”、“区”、“路”及“号”的波形进行比较, 当语音数据V中某个字的波形与关键字“市”的波形相匹配时,在该字之后对语音数据V进行分割;将语音数据V中其余字的波形与“区”、“路”及“号”的波形进行比较,当语音数据V中某个字的波形与关键字“区”的波形相匹配时,在该字之后进行分割;将语音数据V中其余字的波形与“路”及“号”的波形进行比较,当语音数据V中某个字的波形与关键字“路”的波形相匹配时,在该字之后进行分割;及将语音数据V中其余字的波形与“号”的波形进行比较,当语音数据V中某个字的波形与关键字“号”的波形相匹配时,在该字之后进行分割。
9.如权利要求6所述的语音导航方法,其特征在于,在步骤(d)包括 (dl)从所述η段语音数据Via = ^n)中获取第一段语音数据V1 ;(d2)从所述搜索树的根节点开始执行遍历操作与该第一段语音数据V1进行匹配,计算该根节点的每个子节点与语音数据V1的匹配度的权值,作为每个子节点的权值;(d3)将该每个子节点的权值与一个预设的阈值相比较,并获取权值大于上述阈值的所有子节点;(d4)从上述η段语音数据中获取下一段语音数据Vnrartfext = 2 n); (d5)从上述获取的权值大于阈值的每个子节点开始执行遍历操作与下一段语音数据 Vnext (next ^2 ^ η)进行匹配,计算该每个子节点的所有子节点的权值;(d6)将上述所有子节点的权值与一个预设的阈值相比较,并获取权值大于上述阈值的所有子节点;(d7)重复(d4)至(d6)直至不存在Vnrartfext = 2ι);(d8)计算所获取的所有子节点组成的每一条路径的权值总和,并选择其中权值总和最大的一条路径;(d9)整合上述权值最大的路径所代表的地名信息。
10.如权利要求9所述的语音导航方法,其特征在于,所述每一条路径的权值总和的计算公式为
全文摘要
本发明提供一种语音导航设备,包括语音接收单元,用于接收关于导航目的地的语音数据V;关键字数据库,其中存储有n个预设的关键字;地名数据库,其中存储有地名信息的搜索树;语音识别单元,用于根据上述关键字数据库中存储的关键字对语音数据V进行分段,以生成n段语音数据Vi(i=1~n),并采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备可以识别的输入形式;及电子地图,用于根据上述识别的输入形式,可视化地显示出导航目的地的位置与路线。本发明还提供一种语音导航方法。本发明可以缩短匹配识别的时间。
文档编号G01C21/26GK102374864SQ20101025322
公开日2012年3月14日 申请日期2010年8月13日 优先权日2010年8月13日
发明者丁国治, 吕启明, 龚贻华 申请人:国基电子(上海)有限公司, 鸿海精密工业股份有限公司

  • 专利名称:陈列柜用酒精温度计板的制作方法技术领域:本实用新型涉及温度检测装置,尤其涉及一种检测并指示陈列保存柜内实时温度的陈列柜用酒精温度计板。背景技术:一般来说,在一些高档商品(如高档烟、酒、药物、名贵植物等)或者文物字画的陈列展示现场,
  • 专利名称:一种饲料纤维检测装置的制作方法技术领域:本实用新型涉及饲料检测技术领域,尤其是一种检测饲料中纤维含量的装置。背景技术:目前饲料中纤维的常规检测,一般采用定量的酸、碱,在特定的条件下消煮样品,经冲滤和洗涤后,再经高温灼烧,最后扣除矿
  • 专利名称:一种用于检测多孔和面的综合检具的制作方法技术领域:本实用新型涉及检具技术领域,主要涉及一种检测水泵壳体的孔和各面的综合检具。背景技术:汽车行业的零部件产品,每年加工量在几十万到几百万件;有些零部件上需加工多个孔及面,且孔径、位置及
  • 专利名称:一种基于纳米材料表面催化发光识别蛋白质的装置及方法技术领域:本发明属于传感器阵列技术领域。特别涉及一种利用纳米材料表面催化发光识别 常见蛋白质的方法及其专用传感器阵列。背景技术:目前,模仿动物嗅觉或味觉器官而开发的交互响应传感器阵
  • 专利名称:一种热喷涂结合强度试样的粘接装置的制作方法技术领域:本实用新型属于热喷涂涂层性能测试领域,涉及一种热喷涂结合强度试样的粘接>J-U装直。背景技术:热喷涂技术在航空航天、汽车、能源等领域都具有非常广泛的应用,采用热喷涂
  • 专利名称:水下测波验潮工作站的制作方法技术领域:本实用新型属于海洋测绘技术领域,特别是一种水下测波验潮工作站。背景技术:在海洋观测领域中,需要将各种海洋仪器设备投放至海洋中以获取海洋大地、海底地形、地貌、地质、浪潮流、风压湿、温盐等数据。目
山东科威数控机床有限公司
全国服务热线:13062023238
电话:13062023238
地址:滕州市龙泉工业园68号
关键词:铣床数控铣床龙门铣床
公司二维码
Copyright 2010-2024 http://www.ruyicnc.com 版权所有 All rights reserved 鲁ICP备19044495号-12