山东科威数控机床有限公司铣床官方网站今天是:2025-06-06切换城市[全国]-网站地图
推荐产品 :
推荐新闻
技术文章当前位置:技术文章>

声音文档分类方法

时间:2025-06-05    作者: 管理员

专利名称:声音文档分类方法
技术领域
本发明总的来说涉及文档分类,而具体地,涉及基于音频换能器捕捉的声音对文档重量或文档厚度进行分类。有关诸如重量或厚度等文档特征的知识可被其他扫描系统使用。
背景技术
在文档传送系统中,具有不同厚度的文档被扫描并且通过传送器。当文档移动通过文档传送器时,存在与文档的移动相关联的声音。该声音可由其谱特征来表征。文档移动通过传送器的声音特征基于文档厚度的不同而变化。这些特征可用于文档分类。在文档扫描器中,文档重量可转化为其厚度,并且与文档的半透明性相关。通常以 下面的方式使用文档扫描器在同一批次中扫描许多不同重量的文档。文档的这些属性可能需要由其他系统特别处理,所述其他系统例如为在序号为6,511,064的美国专利中描述的超声波文档检测系统(ultrasonic document detection system, UDDS),其中,与较轻或较薄的文档相比,厚的文档会使超声波信号衰减更多。了解文档的重量或厚度可使得系统參数能够被调节为更好地满足给定文档的机器处理要求。超声波文档检测可提供与正被传送通过扫描器的文档相关的其他有用信息。例如,检测器可确定是否正在馈给多个文档,由于某些文档没有被扫描,这可能会导致来自扫描过程中的信息的丢失。另外ー个问题是检测器经常把厚文档与多个馈给文档弄混。因此,需要改进的用于确定文档的厚度、文档是否弄皱以及是否有多个文档被钉在一起的方法。

发明内容
简而言之,根据本发明的一方面,提供了基于声音对文档进行分类的方法,该方法包括将文档馈给到文档传送器;检测文档被传送时产生的声波特性;以及基于所述声波特性来确定文档特征。在一个实施例中,文档扫描器使用音频换能器来捕捉文档进入扫描器传送器时的音频信号。然后,对所述音频信号进行调节、数字化和处理,以提供与该信号相关的谱信息。接下来,将该谱信息(有时被称作声波特性(sonic profile))与已知的不同重量文档的谱属性相比较并进行分类。


图I是文档扫描器的侧视图,其中示出了音频换能器的大体位置,该音频换能器获取纸张进入文档传送器时的音频信号。图2示出了系统操作的流程图。图3示出了用来对文档进行分类的系统的框图。
具体实施方式
如图I所示,从扫描器4中的输入托盘10来馈给文档5。当文档进入扫描器时,馈给和分离辊15把文档彼此分开,这会产生声音。不同重量的文档产生不同的声音。如图2所示,文档的声音被音频换能器20拾取,并且音频信号55被调节、数字化和处理。如图I所示,音频换能器20拾取来自进入文档传送器30的不同厚度的文档5的音频信号。如图2所示,在音频信号被处理之前,可对其进行信号调节60,例如进行模拟滤波。然后由模数A/D转换器65以合适的速率对调节后的模拟信号进行采样和数字化,以避免信号中存在的最高频的混叠。从A/D转换器中获得的数字采样在数字信号处理器(digitalsignal processor, DSP) 70 中被处理。当把文档馈给到75扫描器4中时,文档产生的音频信号被捕捉80。从音频信号中提取特征85,并将该特征与存储器中的特征集相比较90。基于所捕捉的音频信号的被比较的特征以及特征集中的特征,文档被分类为特定的文档重量或文档厚度95。文档分类系统基本上包括两个阶段音频阶段和分类阶段。在音频阶段中,确定不同厚度的纸张的音频信号中的诸如音高(pitch)或谱重心(spectral centroid)或幅度等 各种谱特征,即声波特性。被选择用于学习的谱特征具有针对不同厚度的文档的良好的可区分特性。为了产生音频特征描述符,使用对音频采样的窗口扫描。窗口扫描包括以固定的增量在音频数据上滑动窗口,其中每个窗口代表时间窗口。使用短时傅里叶变换(shorttime Fourier transform, STFT)技术从滑动窗口中提取频谱特征。STFT提供能够对诸如首闻、响度、振幅等各种感知特征进行建1旲的丰富表不。然后,这些对应于不同的文档厚度的特征向量集合被存储在存储器中。在分类阶段中,目标是基于音频信号来确定当前进入扫描器的新文档相对于特定厚度的类别。分类的第一步是提取与在学习阶段确定的谱特征相同的谱特征。通过将这些提取的特征与存储在存储器51内的特征集相比较,将文档分类为特定的厚度。为了进行该比较,可米用支持向量机(Support vector machines, SVM)。当音频信号在处理器50中被处理时,文档继续移动通过传送器30。处理器50和存储器51可内置于扫描器4中,或置于扫描器4外部。在文档到达超声波传感器25之前,文档的厚度被确定并分类。文档继续通过传送器30到达上成像区40、下成像区45,移动出传送器30,并进入文档输出区域35。部件列表4扫描器5 文档10输入托盘15馈给和分离辊20音频换能器25超声波传感器30传送器35文档输出区域40上成像区45下成像区50处理器
51存储器55音频信号60信号调节65模数(A/D)转换器70DSP 处理器75馈给文档80捕捉馈给路径中的文档的音频信号
85从音频信号中提取特征90将特征与存储器中的特征集相比较95基于上述比较把文档分类为特定的厚度。
权利要求
1.一种基于声音将文档分类的方法,包括 将文档馈给到文档传送器; 检测文档被传送时文档产生的声波特性;以及 基于所述声波特性来确定文档特征。
2.如权利要求I所述的方法,其中所述声波特性包含频率。
3.如权利要求2所述的方法,其中所述声波特性包含不同频率的振幅。
4.如权利要求I所述的方法,其中所述声波特性是在所述文档被传送时在一时间段内捕捉的。
5.如权利要求4所述的方法,其中所述声波特性在所述时间段内被分析。
6.如权利要求I所述的方法,其中所述检测借助于音频换能器来进行。
7.如权利要求I所述的方法,其中在确定文档特征之前,从所述声波特性中滤除传送声音。
全文摘要
基于文档(5)移动通过文档传送器(30)时所发出的声音通过重量或厚度来识别并分类文档的方法。通过使用音频换能器(20),文档的声音被捕捉并且与以前保存和存储的各种重量的文档的特征进行比较,并且当与特定的特征集匹配时,文档被分类。
文档编号G01N29/14GK102844256SQ201180017107
公开日2012年12月26日 申请日期2011年3月23日 优先权日2010年3月29日
发明者大卫·M·斯哈特尔, 丹尼尔·P·菲尼, 斯瓦尼尔·萨哈尔什谢特 申请人:伊斯曼柯达公司

  • 专利名称:发动机高压导线检测装置的制作方法技术领域:本发明涉及一种应用于气缸体外的发动机高压导线检测装置。 背景技术:机动车中的发动机高压导线是一端与点火线圈连接、另一端与火花塞连接的导线,其作用是将点火线圈输出的高压电输送到火花塞,让火花
  • 专利名称:一种直齿圆锥齿轮节圆锥角的测量装置及其测量方法技术领域:本发明涉及直齿圆锥齿轮测量技术,具体涉及一种直齿圆锥齿轮节圆锥角的测量装置及其测量方法。背景技术:锥齿轮广泛应用在机床、汽车、矿山、建筑等机械设备上。直齿圆锥齿轮是磨床上的重
  • 专利名称:基于动态测量的皮带输送机计量装置的制作方法技术领域:本实用新型涉及一种计量装置,具体涉及一种基于动态测量的计量装置,用于对输送机皮带上输送的物料进行高速实时计量。背景技术:在仓储、港口、矿山及大型工矿企业,广泛采用皮带输送机,从而
  • 专利名称:光学镜片透射比测量装置的制作方法技术领域:本发明涉及一种测量镜片透射比的装置,特别是关于快速、准确测量光学镜片透光比的装置。背景技术: 近视或远视的视力矫正、眼睛防护眼镜等产品的镜片质量,关系到使用者的健康保护,国家和行业对各种光
  • 专利名称:热塑性模制的氧气传感器的低水蒸汽传输涂层的制作方法技术领域:本领域涉及用于检测大气中的目标气体的电化学气体传感器,特别是氧气传感器。背景技术:电化学氧气传感器传统上包括气体扩散工作电极,通常基于在PTFE带上散布的石墨钼催化剂。当
  • 专利名称:一种汽车b柱下护板检测工具的制作方法技术领域:一种汽车B柱下护板检测工具技术领域[0001]本实用新型涉及汽车零部件领域,具体的说是一种汽车B柱下护板检测工具。技术背景[0002]汽车内部很多零部件均为塑胶产品,塑胶产品出模后,会
山东科威数控机床有限公司
全国服务热线:13062023238
电话:13062023238
地址:滕州市龙泉工业园68号
关键词:铣床数控铣床龙门铣床
公司二维码
Copyright 2010-2024 http://www.ruyicnc.com 版权所有 All rights reserved 鲁ICP备19044495号-12