山东科威数控机床有限公司铣床官方网站今天是:2025-06-14切换城市[全国]-网站地图
推荐产品 :
推荐新闻
技术文章当前位置:技术文章>

一种粒子自动分类方法

时间:2025-06-13    作者: 管理员

专利名称:一种粒子自动分类方法
技术领域
本发明涉及粒子分类方法,尤其适用于流式细胞仪的自动分类方法。
技术背景
流式细胞仪以及基于流式细胞仪技术的血液分析仪、尿液分析仪及粒子分析仪等都是通过收集或者分析粒子的二维或者多维数据的方法来识别液体中的不同粒子以将它们分成不同的类别。如图1所示,在流式细胞仪中,细胞或者粒子的悬液在鞘液的包裹下逐个通过光照区域,在光照区域中粒子受到激光的照射而产生不同的光信号,如前向散射信号,侧向散射信号,以及多路荧光信号。大角度信号反映了细胞复杂度信息,小角度信号反映了细胞体积信息。分析系统将检测器收集来的这些信号生成二维或者三维数据的散点图,在散点图上划分多个区域,细胞或者粒子的多参数信号落在同一个区域的那些粒子被归为同一类,并统计这些类别内的粒子数目和百分比,用以分析样本的统计特性。传统的方法是在散点图上用固定边界进行分类,固定边界能体现出大部分正常样本特征,缺点是不能对不同的样本进行边界调整,当某些样本的粒子的信号特征显著不同于固定边界所表达的特征时就会出现较大的偏差。US. Pat. No. 4987086、4727020、4704891、4599037、4987086、 6014904都使用了一些方法识别和分类计数血液样本中的细胞的分类方法。
用事先划分好的边界可以在散点图上生成不同的区域代表着不同类粒子类别, 然而这些离散的区域可能会有重叠,落在重叠区域的粒子可能会被错误的识别分类。 U. S. Pat. No. 5627040使用了一种“重心引力因子“的方法解决了此问题。这种方法使用尺寸、形状、和方位固定而位置不固定的边界在散点图进行分类,用一种优化算法根据每个类的引力因子将这个类的边界位置固定下来。由于血液细胞个体差异很大,重心引力因子虽然可以调整尺寸,但是形状和方位还是固定的,因此这种方法只适合于大多数具有共性的样本的问题。
当出现个体差异的时候可以在散点图上手动重新划定边界,US. Pat. No. 6944338 指出了一种自动的分类方法,用修改后的Koonst and Fukimaga算法寻找二维数据的分界线即二维数据的波谷,使用这些分界线分别将落在同一区域中的粒子归为一类,以此将粒子分成多个类别。这种方法的局限性散点图上的数据不连续,非常离散,很多点周围没有数据,此算法会对这些点寻找边界并最终将它们归为单独一类,而实际上这些点不是一类而是某个大类的,只不过这些粒子比较分散而已;即使采样格数据平滑也很难解决问题,平滑的越厉害,计算出来的波谷到原始数据上出现的偏差越大;此算法对二维散点图上的每个点都进行一次运算,但是实际上散点图上真正有效的点并不多,有很多的区域都没有数据,二维的散点图实际上一个稀疏矩阵,如果对每个点都进行查找会导致算法的效率下降。
国内CN1012^190A公开了一种流式细胞术的自动分类方法和装置,使用了一种层次聚类的分类方法来分类粒子的类别。通过计算所有有效细胞或者粒子每两个粒子的有效距离,查找出距离最小的两个细胞或者粒子,用于将查找出的最小的细胞或者粒子合并到一个维数相同的新类中,用于在距离集合中删除与该细胞粒子相关的距离,用于计算新类与其他类粒子或者细胞之间的相关距离,每一个粒子都要找到与其最近的距离, 计算距离的计算量是(N*N*(N+1)/2)*0(N1),使用k均值聚类方法计算距离的计算量是 (3*N)*n*0(N~2),η次迭代结束,N总共的粒子数量,缺点是运算速度慢。发明内容
本发明提供一种粒子自动分类方法,解决以上重叠区域的粒子分类出现偏差和速度慢的问题,自动调整粒子的边界,大小和方向,提高对异常样本的适应能力和准确性。
本发明采取的技术方案是,包括以下步骤
Al、根据得到的每个细胞或粒子逐一通过光照区域时产生的至少两路光信号,将每个细胞或者粒子表示为每一个与其光信号强度相关的、至少二维的特征向量;
Bi、计算所有有效细胞或粒子与其每一类中心细胞的距离,即距离越近,每一类细胞或粒子之间的相似程度越高;
Cl、直到每一类细胞的中心位置与前一次中心位置小于一个足够小的值时,每一类的细胞或者粒子的相似程度达到最高;
D1、反复步骤Cl,至少将所有有效细胞或者粒子聚类成符合样本的测量原理所应有的类别数。
本发明一种实施方式是在步骤Al之后,步骤Bl之前包括如下步骤设定阈值, 将不符合阈值条件或者和周围数据差异很大的细胞或者粒子去掉。
本发明一种实施方式是所述Bl中距离用选自于欧式距离、绝对距离、最大距离、 最小距离、Minkowski距离、Chebyshev距离,方差加权距离和马氏距离中的任意一种方法来计算细胞或者粒子之间的距离。
本发明一种实施方式是所述步骤Cl中采用的聚类方法是一种k均值聚类方法, 该k均值聚类方法包括以下步骤
Cll、k均值聚类的初始中心采用了一种中心对称的高斯核,此高斯核适用于任意维度的数据,高斯核和图像的有效数据进行卷积,得到此数据的平滑效果图,再找到其每一类峰值作为初始的中心;
C12、计算出每一个有效细胞或者粒子与初始中心的距离,找到其距离的最小的细胞或者粒子;
C13、将该细胞或者粒子合并成与其最近的中心的一类;
C14、计算出中心,反复上述步骤C12,C13 ;
C15、直到其中心位置和前一次的中心位置小于一个很小的值时,聚类结束。
本发明一种实施方式是在所述的步骤Cll中,选择的高斯核一种基于中心对称、 旋转不变性、适用于任意维度的有效数据的滤波核函数。
本发明一种实施方式是在所述的步骤C12中,在合并过程中没有记录坐标,而是记录其要合并的编号。
本发明一种实施方式是在所述步骤Dl中,最后将所有有效细胞或者粒子聚集成为符合测量原理的类。
本发明一种实施方式是所述Dl之后还包括以下步骤
E1、进行聚类结束评价,确定此类别数和测量原理的类别数是否相符。
本发明一种实施方式是所属步骤El包括如下步骤
E11、如果此类别数c和测量原理M不符,即初始中心的选择有误,缩小核的大小重新确定中心,迭代超过一定次数后,还是不收敛,根据公式& =-α)计算每个类内的离差平方和,其中&为的类内的离差平方和,Xi为类内的第i个细胞或者粒子的特征数据向量(Xn,Xi2, Xi3,.. . Χ ρΓ,Χ^^ 内的中心;
Ε12、计算样本分成c个类时各类内的类内离差平方和在求和值和P ;
Ε13、离差平方和P是渐进下降之后上升的曲线,通过找到其最小值作为收敛次数。
本发明的有益效果是(1)本发明对流过的所有粒子的二维或者多维数据的集合进行分析处理,将某粒子归到某个类中,基于数据进行分析寻找边界,不是一维直方图,或者二维散点图,因此适合更多维的数据,相当于这种自动聚类的方法所产生的边界更能随样本的不同而不同,克服了散点图上使用固定方向的旋转来找到波谷值更能适应样本的不同变化,不能针对被测样本的特异性进行边界调整的缺陷。本发明只对粒子的数据进行计算,没有粒子的地方不参与计算。O)CN1012^190A层次聚类的方法反复计算所有有效细胞的粒子两两之间的距离,距离越近,相似程度越高,将相似程度高的粒子或者细胞聚为一类,而本发明采用的方法的距离是选择样本点与中心的距离,距离的计算量减少了,节省了时间,提高了效率,CN1012^190A层级聚类的方法尤其通过设置谱系系数,来选择聚为几类,谱系系数选择不当,很容易聚为一类、而本发明聚为几类,是根据初始中心的选择,初始中心的选择是根据整体样本的差异性进行选择,更适合粒子或者细胞的分类。(3)本发明首先删除了一些不合理的数据,这些不合理的数据包括一些差异性或者不需要计算的数据, 减少了计算量,提高了效率。


图1是白细胞散点图2是固定阈值方法分类的示意图3是白细胞散点各分类中心;
图4是流式细胞技术示意图5是白细胞三维立体直方图6是白细胞二维数据波谷分类的示意图7是白细胞一维滤波直方图8是白细胞一维数据波谷分类线;
图9是形态学的方法的每一类的中心位置;
图10是白细胞分类结果图。
具体实施方式
包括以下步骤
Al、根据得到的每个细胞或粒子逐一通过光照区域时产生的至少两路光信号,将每个细胞或者粒子表示为每一个与其光信号强度相关的、至少二维的特征向量;
Bi、计算所有有效细胞或粒子与其每一类中心细胞的距离,即距离越近,每一类细胞或粒子之间的相似程度越高;
Cl、直到每一类细胞的中心位置与前一次中心位置小于一个足够小的值时,每一类的细胞或者粒子的相似程度达到最高;
D1、反复步骤Cl,至少将所有有效细胞或者粒子聚类成符合样本的测量原理所应有的类别数。
本发明一种实施方式是在步骤Al之后,步骤Bl之前包括如下步骤设定阈值, 将不符合阈值条件或者和周围数据差异很大的细胞或者粒子去掉。
本发明一种实施方式是所述Bl中距离用选自于欧式距离、绝对距离、最大距离、 最小距离、Minkowski距离、Chebyshev距离,方差加权距离和马氏距离中的任意一种方法来计算细胞或者粒子之间的距离。
本发明一种实施方式是所述步骤Cl中采用的聚类方法是一种k均值聚类方法, 该k均值聚类方法包括以下步骤
Cll、k均值聚类的初始中心采用了一种中心对称的高斯核,此高斯核适用于任意维度的数据,高斯核和图像的有效数据进行卷积,得到此数据的平滑效果图,再找到其每一类峰值作为初始的中心;
C12、计算出每一个有效细胞或者粒子与初始中心的距离,找到其距离的最小的细胞或者粒子;
C13、将该细胞或者粒子合并成与其最近的中心的一类;
C14、计算出中心,反复上述步骤C12,C13 ;
C15、直到其中心位置和前一次的中心位置小于一个很小的值时,聚类结束。
本发明一种实施方式是在所述的步骤Cll中,选择的高斯核一种基于中心对称、 旋转不变性、适用于任意维度的有效数据的滤波核函数。
本发明一种实施方式是在所述的步骤C12中,在合并过程中没有记录坐标,而是记录其要合并的编号。
本发明一种实施方式是在所述步骤Dl中,最后将所有有效细胞或者粒子聚集成为符合测量原理的类。
本发明一种实施方式是所述Dl之后还包括以下步骤
E1、进行聚类结束评价,确定此类别数和测量原理的类别数是否相符。
本发明一种实施方式是所属步骤El包括如下步骤
E11、如果此类别数c和测量原理M不符,即初始中心的选择有误,缩小核的大小重新确定中心,迭代超过一定次数后,还是不收敛,根据公式& =-α)计算每个类内的离差平方和,其中&为的类内的离差平方和,Xi为类内的第i个细胞或者粒子的特征数据向量(Xn,Xi2, Xi3,.. . Χ ρΓ,Χ^^ 内的中心;
Ε12、计算样本分成c个类时各类内的类内离差平方和在求和值和P ;
Ε13、离差平方和P是渐进下降之后上升的曲线,通过找到其最小值作为收敛次数。
以下将结合在血液细胞分析仪中的应用来说明。
血液细胞分析仪可以检测血液中的白细胞、红细胞、血小板、血红蛋白等参数的数量。只有对于白细胞四分类的检测,使用了光学散射法的原理,通过吸入一定量的血细胞并与一定量的试剂作用,血样流过充满稀释液的流动室中,在稀释液形成的鞘液包裹下,细胞单个排列成排的流过流动室的中央,悬浮在鞘液中的细胞经过二次加速,通过激光检测区域,血细胞受到激光的照射,产生的散射光性质与细胞大小、细胞膜和细胞内部结构的折射率有关,小角度前向散射光反映了细胞的大小,大角度前向散射光反映了细胞的内部的复杂度信息。光电二极管接收这些散射光信号并转换为电脉冲,根据收到的电脉冲可以得到细胞的大小和复杂度的散点图。其余的测试分别采用了电阻抗、电阻抗和SLS法。电阻抗法红细胞\血小板经过稀释后进入具有小孔检测单元,小孔两侧有正负电极,细胞不是很好的导体,当细胞进入小孔时,电极间的直流电阻发生变化,会在两端形成与细胞体积大小变化的信号。SLS法在比色池中,被稀释的样本进入溶血剂后红细胞溶解,释放出血红蛋白,血红蛋白与溶血剂形成血红蛋白复合物,在比色池一端LED光照射通过波长为525nm的单色发光管照射血红蛋白复合物,另一端用光电管接收透射光,光信号放大转化为电压信号,通过与比色池只有稀释液透过LED产生的光信号转化为放大电压信号的比较,得到样本的血红蛋白浓度。而只有白细胞四分类的检测,即白细胞四分类包括淋巴细胞(Lym)、单核细胞 (Mono)、嗜酸性细胞(Eos)和中性粒细胞(Neut)这四种白细胞的分类才能使用上述提到的方法,通过对这四种细胞分别计数来计算每一类的百分比,来达到医学临床检验诊断的目的。在这张散点图上,也存在着影细胞((ihost)。人们通常对血液中的淋巴细胞、单核细胞、 中性粒细胞、噬酸细胞比较感兴趣,需要对这几种细胞进行分类统计,计算每一种细胞的数目和百分比,进而实现散点图的分类、计数。本发明具体实施内容就是对以上提到的5种粒子细胞进行分类。以图1显示的散点图的数据为基本原始数据。具体实施步骤如下
粒子分类统计方法包括收集每个粒子在检测仪中产生的至少两种特征的信号采集单元,用于选择其中的两种特征表征为二维向量并映射到二维散点图上的映射单元,用于在散点图上找到用于聚类的初始中心单元,开始聚类单元,聚类结束单元,统计各个区域的粒子个数的统计单元。
本实施实例中,对白细胞进行分类的方法包括以下步骤
1.在血细胞分析仪中,光照射血液样本的白细胞,收集到的白细胞至少两个方向的光信号,通常选择两个方向的光信号(例如前向小角度散射光,前向大角度散射光),将两个方向的信号通过光电转换和AD转换,得到对应的细胞的二维数据,将此数据映射到二维直角坐标系,形成白细胞散点图。
2.在散点图中,并不是每个数据点都是白细胞,有些数据点是血液中的红细胞碎片或者噪声产生的,这些无效数据点,通过使用固定阈值的方法将他们去掉,获得散点图中感兴趣的细胞。
3.选择初始的聚类中心,可以采用二维高斯滤波即采用了一种中心对称的高斯核,此高斯核适用于任意维度的数据,高斯核和图像的有效数据进行卷积,得到此数据的平滑效果图,(一维直方图数据滤波)找到的波峰值作为初始中心,具体过程
a)统计每一个坐标点的个数(xl,yl, nl),(x2, y2, n2),(x3, y3, n3),· · ·;
b)使用高斯核函数卷积a)提到的所有点的个数;
c)找到其三个波峰的初始位置作为聚类的初始中心召夕1,^3J3;
4.聚类单元
a)计算出每一个有效细胞或者粒子与初始中心的距离,找到其距离的最小的细胞或者粒子;
Min
Distance (xl - jd)2 + (yl - Jlf, (x2 - x2f + (y2 - y2f, (x3 - x3)2 + (y3 - y3)2 ;
b)将该细胞或者粒子合并成与其最近的中心的一类;
Xl(xl,yl),X2(x2,y2),X3(x3,y3),X4(x4,y4)...;
c)反复上述步骤a,b,计算出中心;
假设重复步骤a,b后,淋巴细胞有Ml个数据点,单核细胞有M2个数据点,中性粒细胞有M3个数据点,对每个区域进行一下计算(i = 1,2,3...)— γ Ml— \ Mlrnnflnn x^ = 7 ~Σηνχν,九=7 ~Σn'j-y'j _0]Σ ,=1Yjfly ^;=1 ;=1
d)反复迭代,直到两次的聚类中心变化最小为止,最终至少将所有有效细胞或者粒子聚类成符合样本的测量原理所应有的类别数。
5聚类结束评价单元
如果此类别数c和测量原理M不符,即初始中心的选择有误,缩小核的大小重新确定中心,迭代超过一定次数后,还是不收敛,根据公式& =-α)计算每个类内的离差平方和,其中&为(ik的类内的离差平方和,Xi为类内的第i个细胞或者粒子的特征数据向量(Xil,Xi2,xi3,... Xip)τ, 是(\内的中心;
计算样本分成c个类时各类内的类内离差平方和在求和值P ;
离差平方和P是渐进下降之后上升的曲线,通过找到其最小值作为收敛次数。
统计各个区域的细胞个数,对散点图进行分类、计数,统计每一类细胞的百分比信肩、ο
由于各类粒子边界的尺寸、形状、方向和位置不是固定的,而是随着该类粒子的分布的实际情况变化的,因此本文适应各种粒子的个体差异,自动调整边界的尺寸、方向、形状和位置,具有很强的适应能力。
以上所述为本文的优选实施例,并非因此限制本文的专利范围,凡是利用本文说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本文的专利保护范围内。
权利要求
1.一种粒子自动分类方法,其特征在于包括如下步骤Al、根据得到的每个细胞或粒子逐一通过光照区域时产生的至少两路光信号,将每个细胞或者粒子表示为每一个与其光信号强度相关的、至少二维的特征向量;Bi、计算所有有效细胞或粒子与其每一类中心细胞的距离,即距离越近,每一类细胞或粒子之间的相似程度越高;Cl、直到每一类细胞的中心位置与前一次中心位置小于一个足够小的值时,每一类的细胞或者粒子的相似程度达到最高;D1、反复步骤Cl,至少将所有有效细胞或者粒子聚类成符合样本的测量原理所应有的类别数。
2.如权利要求1所述的粒子自动分类方法,其特征在于,在步骤Al之后,步骤Bl之前包括如下步骤设定阈值,将不符合阈值条件或者和周围数据差异很大的细胞或者粒子去掉。
3.如权利要求1所述的粒子自动分类方法,其特征在于步骤Bl中距离用选自于欧式距离、绝对距离、最大距离、最小距离、Minkowski距离、Chebyshev距离、方差加权距离和马氏距离中的任意一种方法来计算细胞或者粒子之间的距离。
4.如权利要求3所述的粒子自动分类方法,其特征在于所属步骤Cl中采用的聚类方法是一种k均值聚类方法,所述的k均值聚类方法包括以下步骤Cll、k均值聚类的初始中心采用了一种中心对称的高斯核,此高斯核适用于任意维度的数据,高斯核和图像的有效数据进行卷积,得到此数据的平滑效果图,再找到其每一类峰值作为初始的中心;C12、计算出每一个有效细胞或者粒子与初始中心的距离,找到其距离的最小的细胞或者粒子;C13、将该细胞或者粒子合并成与其最近的中心的一类; C14、计算出中心,反复上述步骤C12,C13 ;C15、直到其中心位置和前一次的中心位置小于一个很小的值时,聚类结束。
5.如权利要求4所述的粒子自动分类方法,其特征在于在所述的步骤Cll中,选择的高斯核一种基于中心对称、旋转不变性、适用于任意维度的有效数据的滤波核函数。
6.如权利要求4所述的流式细胞术的自动分类方法,其特征在于在所述的步骤C12 中,在合并过程中记录其要合并的编号。
7.如权利要求1至6中任一项所述粒子自动分类方法,其特征在于在所述步骤Dl中, 最后将所有有效细胞或者粒子聚集成为符合测量原理的类。
8.如权利要求7所述粒子自动分类方法,其特征在于所述Dl之后还包括以下步骤 E1、进行聚类结束评价,确定此类别数和测量原理的类别数是否相符。
9.如权利要求8所述的粒子自动分类方法,其特征在于所属步骤El包括如下步骤 E11、如果此类别数c和测量原理M不符,即初始中心的选择有误,缩小核的大小重新确定中心,迭代超过一定次数后,还是不收敛,根据公式& =—Α)计算每个类内的离差平方和,其中&为(ik的类内的离差平方和,Xi为类内的第i个细胞或者粒子的特征数据向量(Xil,Xi2,xi3,... XipAXi^ 内的中心;E12、计算样本分成c个类时各类内的类内离差平方和在求和值和P ;E13、离差平方和P是渐进下降之后上升的曲线,通过找到其最小值作为收敛次数。
全文摘要
本发明涉及一种粒子自动分类方法,属于粒子分类方法。包括以下步骤通过收集粒子检测仪散射光信号获得至少两种特征信息、将粒子至少两种特征信息分别映射为二维散点图、在二维散点图上进行高斯滤波、通过选择高斯滤波的峰值作为均值聚类的初始值、使用均值聚类对二维散点图数据进行聚类、根据聚类的结果计算各个区域的粒子个数,统计每一个区域的粒子个数的百分比。本发明能调整区域的边界位置,形状,方向和大小,具有很强的准确性和稳定性,提高了散点图对各种样本的适应能力。
文档编号G01N15/10GK102507417SQ201110387439
公开日2012年6月20日 申请日期2011年11月29日 优先权日2011年11月29日
发明者丁立明, 孙媛媛, 宋洁, 朱海波 申请人:长春迪瑞医疗科技股份有限公司

  • 专利名称:平面显示器的测试装置与方法技术领域:本发明是有关于一种测试装置,且特别是有关于一种平面显示器的测试装置与方法。背景技术: 平面显示器近来已被广泛地使用,以取代阴极射线管显示器(CRT)。随着半导体技术的改良,使得平面显示器具有低的
  • 专利名称:流量检定装置的制作方法技术领域:本实用新型涉及一种检定装置,尤其涉及一种流量检定装置,属于流量检定技术 领域。背景技术:目前,现有的流量检定设备工作前或更换测试仪表后常由于管路中存在气体,如 果在测试前不排除干净,将严重影响测试校
  • 专利名称:校准设备的制作方法校准设备本发明涉及一种用于温度检测器的校准(calibration)设备,校准设备包括具有一开口的校准室,该开口用于容纳具有容纳温度检测器的通道以控制室中的热分布的插入件,其中,室具有几个热能元件,并且其中,该设
  • 专利名称:一种多功能可装配式量水槽的制作方法技术领域:本实用新型涉及一种渠道水量测量技术领域,具体是一种多功能可装配式量水槽。技术背景目前在灌区利用渠道量水槽测量流水量很普遍,而量水槽结构尺寸的精度是影响量水精度的关键因素,因此在现场施工中
  • 专利名称:汽车voc释放量测试环境箱的制作方法技术领域:汽车VOC释放量测试环境箱技术领域[0001]本实用新型涉及质量分析及环保检测技术领域,具体地说是一种用于检测汽车 内挥发性有机物和酮醛类物质的汽车VOC释放量测试环境箱。背景技术:[
  • 专利名称:一种通用型hart变送模块及工作方法技术领域:本发明涉及一种变送器,特别涉及一种通用型HART变送模块。技术背景HART协议作为一种工业现场总线标准协议,得到了广泛了应用,目前HART型智能 仪表的市场占有量已经超过50%,但仍有
山东科威数控机床有限公司
全国服务热线:13062023238
电话:13062023238
地址:滕州市龙泉工业园68号
关键词:铣床数控铣床龙门铣床
公司二维码
Copyright 2010-2024 http://www.ruyicnc.com 版权所有 All rights reserved 鲁ICP备19044495号-12