山东科威数控机床有限公司铣床官方网站今天是:2025-06-06切换城市[全国]-网站地图
推荐产品 :
推荐新闻
技术文章当前位置:技术文章>

质谱成像数据的差异分析方法及系统的制作方法

时间:2025-06-04    作者: 管理员

专利名称:质谱成像数据的差异分析方法及系统的制作方法
技术领域
本发明涉及质谱分析领域,尤其涉及质谱成像数据的差异分析方法及系统。
背景技术
质谱分析方法是将物质粒子(原子、分子)电离成离子,并通过适当的稳定或变化 的电场或磁场将它们按空间位置、时间先后等实现质荷比分离,并检测其强度来作定性、定 量分析的分析方法。由于其直接测量的本质和高灵敏、高分辨、高通量和高适用性的特性, 使得质谱仪和质谱分析技术在现代科学技术中举足轻重。随着生命科学、环境科学、医药科 学、纳米材料等学科的发展,以及食品安全、国家安全、国际反恐的需要,质谱仪已成为增长 速度飞快的分析仪器之一。尤其是色谱/质谱联用技术和仪器的出现,因其对复杂基体的 高分离功能和检测的高灵敏度,更是在上述各领域倍受青睐,甚至不可或缺。对于复杂基体的检测分析,其分析流程是样品前处理、色谱分离、质谱分析检测、 数据处理。其中,样品前处理占大部分工作量,操作环节多、而且非常复杂。不同分析目的, 前处理操作不同,但通常包括取样、称量、均勻化、粗分离、提纯、浓缩等步骤。复杂的前处 理很容易对被测物产生污染、流失、改性等阻碍真实、精确反映分析检测结果的影响。利用新兴质谱技术在无需任何样品前处理的情况下对复杂基体的样品的成像则 是当前研究的前沿和热点之一。自 1997 年美国范德堡大学(Vanderbilt University)的 Richard Caprioli 等首 次提出MALDI质谱分子成像技术以来,质谱成像技术作为质谱技术中的一个新领域迅速发 展,质谱成像技术就广泛用于样品表面直接质谱分析,特别是生物组织表面直接分析,用于 蛋白组学、代谢组学、脂类组学、药代动力学等领域研究。质谱成像分析的流程是将被用来研究的样品置于质谱仪的靶上或样品台上,按 照预先定义好的样品扫描范围、样品扫描方式、采样点扫描时间间隔和空间间隔,移动样品 台,对样品中的采样点(微区)进行离子化,离子化后的离子进入质谱仪,采集质谱数据信 息,如此逐步采集样品中扫描范围内的其他采样点,最后得到具有空间信息的整个样品的 质谱数据,这样就可以完成对样品的“分子成像”,该分子成像图是3维图,每个点的X,y与 其实际样品中采样点的对应,相对位置一样,ζ轴为m/z轴,表示该点化合物信息。设定离子m/z的范围,即可确定该样品区域所含分子的种类,并选定峰高或者峰 面积来代表分子的相对丰度。图像中的彩色斑点代表化合物的定位,每个斑点颜色的深浅 与该点上检测到的某离子信号大小相关。通过增加单位面积上离子化样品点数量和像素, 可以获得更多的样品信息,例如采用4000像素比200像素能够得到更好的样品图像。质谱 分子成像技术是一种半定量或相对定量技术,图像上颜色深的部分表明有更多的生物分子 聚集在样品的这个部分。然而,不可能据此确定分子在样品的不同部位的实际绝对含量。选 择组织图像上的任意一个斑点,图像都能够给出一个质谱谱图或者离子谱图,代表在样品 的该部位存在这种分子,然后与做指纹图谱类似,像做指纹图谱那样,将样品的离子谱图与 已知标准品进行对照,分析差异,从而进行生物标志物的发现和药物作用的监控。
对于复杂基体样品质谱检测,相对于经过色谱分离后再质谱检测的数据,质谱成 像数据更复杂、所包含数据信息丰富,每幅质谱数据往往不是单一组分,是多个组分的混合 物,在质谱图上有多个质谱峰,给后续的数据处理和数据解释带来了难度。特别在分析两 类不同的样品时,如病变与正常组织切片的差异分析、污染样品与正常样品的差异分析,改 性与正常样品的差异分析、实验组与对照组间的差异分析等,存在着很多困难,难以找出差
B. 升。不同样品质谱成像分析的差异有两类一、是物质差异,反映在质谱图上的不同, 种类不同或浓度不同;二是空间分布差异,同种含量的物质,在样品上分布明显不同。当前分析质谱成像数据的差异方法有两种,假定对A、B两类样品做相同条件的 质谱成像分析,获得A、B两类质谱成像数据一将A、B两类分别做质谱图叠加平均,对比 这两类的平均质谱图,找出差异;二是分别在A、B两类质谱成像数据图上选定样品的区域 Region of Sample (简称R0S),分别给对R0S区域做平均质谱图,对比R0S内的平均质谱 图,找差异。第一种方法的问题是在对比时增加了很多无关的信息,掩盖或弱化不同样品 间的真实差异,容易影响判断,不容易找出物质差异,不能找出空间差异;第二种方法的问 题是,如果R0S选大了,就会出现第一种方法的问题,如果R0S选小了,就存在选择的R0S大 小、形状、位置是否合适的问题,同时要求A类R0S内的数据一致性好、B类R0S内的数据一 致性也好,A类R0S内的数据与B类R0S内的数据差异明显。因此,很难给出两类样品的物 质差异,更难给出差异的所在区域。在分析两类不同的样品时,找出物质差异存时在如下的 困难一、同类样品间差异过大,容易掩盖不同样品间的差异;二、化学噪声或局部污染等 原因产生的差别,能够被误判为差异。

发明内容
为了解决上述的技术问题,提供了质谱成像数据的差异分析方法及系统,其目的 在于计算出实验组与对照组间质谱成像数据的物质差异和空间差异。本发明提供了质谱成像数据的差异分析方法,包括步骤1,从第一组被测样品的质谱成像数据集和第二组被测样品的质谱成像数据 集中分别选取进行差异分析的区域;步骤2,设定代表第一组被测样品最小区域和第二组被测样品最小区域的大小和 形状;步骤3,在为第一组被测样品和第二组被测样品所选取的进行差异分析的区域中 选定各最小区域对应的质谱成像数据;步骤4,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品 中的最小区域对应的质谱成像数据分别利用主成分分析方法、因子分析方法或统计方法比 较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对 应的质谱成像数据存在的差异程度是否符合预设条件;将符合预设条件的最小区域的空间 信息及相应的平均质谱图,或者符合预设条件的最小区域的空间信息及相应的样品点之间 的决定系数和相应的样品点平均质谱图之间的决定系数加入最小区域信息集;根据区域信 息集中的空间信息或者样品点之间的决定系数和样品点平均质谱图之间的决定系数计算 得到差异系数;
步骤5,按照差异系数进行排序,选择与每个差异系数对应的第一组被测样品中的 最小区域和二组被测样品中的最小区域;分别以第一组被测样品中的最小区域和第二组被 测样品中的最小区域为核心扩展样品点,扩展后的第一组被测样品中的区域和扩展后的第 二组被测样品中的区域存在的差异程度是否符合预设条件;扩展后的以第一组被测样品中 的区域为核心的区域的界限不超出第一组被测样品的界限,扩展后的以第二组被测样品中 的区域为核心的区域的界限不超出第二组被测样品的界限;将扩展后的第一组被测样品中 的区域和扩展后的第二组被测样品中的区域的空间信息及相应的平均质谱图,或者将扩展 后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的 样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入区域信息集。步骤4中,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样 品中的最小区域对应的质谱成像数据利用主成分分析方法比较第一组被测样品中的最小 区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差 异系数是否符合预设条件包括步骤21,将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品 中的最小区域对应的质谱成像数据合并,并标记质谱成像数据的来源;步骤22,对合并后的数据进行主成分分析,得到主成分分析载荷图信息和主成分 分析得分图信息;步骤23,设定以第一主成分为横坐标和以第二主成份为纵坐标的平面图,在该平 面图上绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点; 样品点的横坐标值为该样品对应的质谱成像数据在第一主成分上的得分值,样品点的纵坐 标值为该样品对应的质谱成像数据在第二主成份上的得分值;步骤24,在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组 被测样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域 包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。步骤4中,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样 品中的最小区域对应的质谱成像数据利用因子分析方法比较第一组被测样品中的最小区 域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异 系数是否符合预设条件包括步骤31,将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品 中的最小区域对应的质谱成像数据合并成数据集AB,并标记质谱成像数据的来源;步骤32,对数据集AB进行因子分析,得到因子载荷图信息和因子得分图信息;步骤33,设定以第一主因子为横坐标和第二主因子为纵坐标的平面图,在该平面 图上绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样 品点的横坐标值为该样品点对应的质谱成像数据在第一主因子上的得分值,纵坐标值为该 样品点对应的质谱成像数据在第二主因子上的得分值;步骤34,在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组 被测样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域 包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。利用几何判别法或聚类法判断第一组被测样品中的最小区域包含的样品点与第
10二组被测样品中的最小区域包含的样品点能否分开。步骤4中,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样 品中的最小区域对应的质谱成像数据利用统计方法比较第一组被测样品中的最小区域对 应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数 是否符合预设条件包括步骤41,对第一组被测样品中的最小区域对应的质谱成像数据做一致性检验,对 第二组被测样品中的最小区域对应的质谱成像数据做一致性检验;一致性检验通过后,执 行步骤42 ;步骤42,对第一组被测样品中的最小区域对应的质谱成像数据做平均,获得第一 平均质谱数据;对第二组被测样品中的最小区域对应的质谱成像数据做平均,获得第二平 均质谱数据;步骤43,提取第一平均质谱数据的质谱峰,提取第二平均质谱数据的质谱峰;步骤44,判断第一平均质谱数据图和第二平均质谱数据图的离子种类或离子强度 是否存在差异;预设条件为第一平均质谱数据图和第二平均质谱数据图的离子种类存在差 异,或者第一平均质谱数据图和第二平均质谱数据图的离子种类不存在差异但离子强度存 在差异,离子强度存在差异需要满足下述条件将第一平均质谱数据图的离子强度和第二 平均质谱数据图的离子强度做相关性比较后,决定系数大于或等于0.8。分别以第一组被测样品中的最小区域和第二组被测样品中的最小区域为核心扩 展样品点,扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域存在的 差异系数是否符合预设条件具体包括步骤51,选择一个第一组被测样品中的最小区域和一个第二组被测样品中的最小 区域;步骤51,固定所选定的第一组被测样品中的最小区域,以所选定的第二组被测样 品中的最小区域进行扩展,扩展后的以所选定的第二组被测样品中的最小区域为核心的区 域与所选定的第一组被测样品中的最小区域存在的差异系数符合预设的条件;步骤52,固定扩展后的以所选定的二组被测样品中的最小区域为核心的区域,以 所选定的第一组被测样品中的最小区域为核心进行扩展,扩展后的以所选定的第一组被测 样品中的最小区域为核心的区域与扩展后的以所选定的二组被测样品中的最小区域为核 心的区域存在的差异系数符合预设的条件。差异系数等于第一组被测样品中的最小区域包含的样品点组成的多边形的重心 与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间的距离除以第一组 被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被测样品中的最小区 域包含的样品点组成的多边形的面积之和,或者差异系数等于第一组被测样品中的最小区 域包含的样品点组成的多边形的重心与第二组被测样品中的最小区域包含的样品点组成 的多边形的重心间的距离减去第一组被测样品中的最小区域包含的样品点组成的多边形 的面积与第二组被测样品中的最小区域包含的样品点组成的多边形的面积之和。差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定系数平均 值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和除以第一组 被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最小区域包含的样品点的平均质谱图之间的决定系数,或者差异系数等于第一组被测样品中的最小区域 包含的样品点之间的决定系数平均值与第二组被测样品中的最小区域包含的样品点之间 的决定系数平均值之和减去第一组被测样品中的最小区域包含的样品点的平均质谱图与 第二组被测样品中的最小区域包含的样品点的平均质谱图之间的决定系数。
本发明提供了质谱成像数据的差异分析系统,包括差异分析区域选取模块,用于从第一组被测样品的质谱成像数据集和第二组被测 样品的质谱成像数据集中分别选取进行差异分析的区域;最小区域设定模块,用于设定代表第一组被测样品最小区域和第二组被测样品最 小区域的大小和形状;质谱成像数据选取模块,用于在为第一组被测样品和第二组被测样品所选取的进 行差异分析的区域中选定各最小区域对应的质谱成像数据;差异程度判决模块,用于将第一组被测样品中的最小区域对应的质谱成像数据和 第二组被测样品中的最小区域对应的质谱成像数据分别利用主成分分析方法、因子分析方 法或统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品 中的最小区域对应的质谱成像数据存在的差异程度是否符合预设条件;将符合预设条件的 最小区域的空间信息及相应的平均质谱图,或者符合预设条件的最小区域的空间信息及相 应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入最小区域信 息集;根据区域信息集中的空间信息或者样品点之间的决定系数和样品点平均质谱图之间 的决定系数计算得到差异系数;扩展模块,用于按照差异系数进行排序,选择与每个差异系数对应的第一组被测 样品中的最小区域和二组被测样品中的最小区域;分别以第一组被测样品中的最小区域和 第二组被测样品中的最小区域为核心扩展样品点,扩展后的第一组被测样品中的区域和扩 展后的第二组被测样品中的区域存在的差异程度是否符合预设条件;扩展后的以第一组被 测样品中的最小区域为核心的区域的界限不超出第一组被测样品的界限,扩展后的以第二 组被测样品中的最小区域为核心的区域的界限不超出第二组被测样品的界限;将扩展后的 第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的平均 质谱图,或者将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的 空间信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加 入区域信息集。将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最 小区域对应的质谱成像数据利用主成分分析方法比较第一组被测样品中的最小区域对应 的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是 否符合预设条件包括将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最 小区域对应的质谱成像数据合并,并标记质谱成像数据的来源;对合并后的数据进行主成分分析,得到主成分分析载荷图信息和主成分分析得分 图信息;设定以第一主成分为横坐标和以第二主成份为纵坐标的平面图,在该平面图上绘 制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横坐标值为该样品对应的质谱成像数据在第一主成分上的得分值,样品点的纵坐标值为该 样品对应的质谱成像数据在第二主成份上的得分值;在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样 品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的 样品点与第二组被测样品中的最小区域包含的样品点能分开。将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最 小区域对应的质谱成像数据利用因子分析方法比较第一组被测样品中的最小区域对应的 质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否 符合预设条件包括将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最 小区域对应的质谱成像数据合并成数据集AB,并标记质谱成像数据的来源;对数据集AB进行因子分析,得到因子载荷图信息和因子得分图信息;设定以第一主因子为横坐标和第二主因子为纵坐标的平面图,在该平面图上绘制 第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横 坐标值为该样品点对应的质谱成像数据在第一主因子上的得分值,纵坐标值为该样品点对 应的质谱成像数据在第二主因子上的得分值;在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样 品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的 样品点与第二组被测样品中的最小区域包含的样品点能分开。差异程度判决模块利用几何判别法或聚类法判断第一组被测样品中的最小区域 包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开。将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最 小区域对应的质谱成像数据利用统计方法比较第一组被测样品中的最小区域对应的质谱 成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合 预设条件包括对第一组被测样品中的最小区域对应的质谱成像数据做一致性检验,对第二组被 测样品中的最小区域对应的质谱成像数据做一致性检验;一致性检验通过后,对第一组被 测样品中的最小区域对应的质谱成像数据做平均,获得第一平均质谱数据;对第二组被测 样品中的最小区域对应的质谱成像数据做平均,获得第二平均质谱数据;提取第一平均质谱数据的质谱峰,提取第二平均质谱数据的质谱峰;判断第一平均质谱数据图和第二平均质谱数据图的离子种类或离子强度是否存 在差异;预设条件为第一平均质谱数据图和第二平均质谱数据图的离子种类存在差异,或 者第一平均质谱数据图和第二平均质谱数据图的离子种类不存在差异但离子强度存在差 异,离子强度存在差异需要满足下述条件将第一平均质谱数据图的离子强度和第二平均 质谱数据图的离子强度做相关性比较后,决定系数大于或等于0. 8。分别以第一组被测样品中的最小区域和第二组被测样品中的最小区域为核心扩 展样品点,扩展后的第一组被测样品中的最小区域和扩展后的第二组被测样品中的最小区 域存在的差异系数是否符合预设条件具体包括选择一个第一组被测样品中的最小区域和一个第二组被测样品中的最小区域;
固定所选定的第一组被测样品中的最小区域,以所选定的第二组被测样品中的最 小区域进行扩展,扩展后的以所选定的第二组被测样品中的最小区域为核心的区域与所选 定的第一组被测样品中的最小区域存在的差异系数符合预设的条件;固定扩展后的以所选定的二组被测样品中的最小区域为核心的区域,以所选定的 第一组被测样品中的最小区域为核心进行扩展,扩展后的以所选定的第一组被测样品中的 最小区域为核心的区域与扩展后的以所选定的二组被测样品中的最小区域为核心的区域 存在的差异系数符合预设的条件。差异系数等于第一组被测样品中的最小区域包含的样品点组成的多边形的重心 与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间的距离除以第一组 被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被测样品中的最小区 域包含的样品点组成的多边形的面积之和,或者差异系数等于第一组被测样品中的最小区 域包含的样品点组成的多边形的重心与第二组被测样品中的最小区域包含的样品点组成 的多边形的重心间的距离减去第一组被测样品中的最小区域包含的样品点组成的多边形 的面积与第二组被测样品中的最小区域包含的样品点组成的多边形的面积之和。差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定系数平均 值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和除以第一组 被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最小区域包含 的样品点的平均质谱图之间的决定系数,或者差异系数等于第一组被测样品中的最小区域 包含的样品点之间的决定系数平均值与第二组被测样品中的最小区域包含的样品点之间 的决定系数平均值之和减去第一组被测样品中的最小区域包含的样品点的平均质谱图与 第二组被测样品中的最小区域包含的样品点的平均质谱图之间的决定系数。本发明选定样品对比区域(从A类、B类样品质谱成像数据图中分别选定一个样 品区域 Region of Sample,简称 ROS),定义原子区域(Atom Regionof Sample,简称 AR0S, 能代表样品的最小的区域),在A类样品、B类样品R0S中分别选取AR0S,对比这两个AR0S 区域内的质谱数据差异,遍历对比A类、B类样品R0S区域内的所有AR0S,计算每对差异参 数,按差异系数大小排序,对有显著差异的AR0S进行增长,产生新的成对的子R0S区域(存 在显著差异的最大子区域),从而获得精确差异区域,每对差异区域的物质差异信息。本发明所提出的技术方案,使研究人员准确、精确分析A类样品与B类样品成像数 据图间的显著差异、差异所在的样品区域,物质种类与含量差异,对于复杂基体,如病变与 正常组织切片的差异分析、污染样品与正常样品的差异分析,改性与原始样品的差异分析、 用药组织切片与非用药组织切片的的差异分析,提供了准确、可靠的方法。


图1是本发明分析A样品与B样品质谱成像数据差异的方法流程图;图2是主成分分析计算差异参数并判断差异是否显著的方法流程图;图3是因子分析计算差异参数并判断差异是否显著的方法流程图;图4是统计分析计算差异参数并判断差异是否显著的方法流程图;图5是以AR0S为核心的扩增差异区域的方法流程图。
1具体实施例方式目前,两类复杂样品(A类、B类)的质谱成像数据图间的显著差异分析是一个难 题。本发明,首先通过选定样品对比区域排除无关信息干扰,设定原子区域,在A类样品、 B类样品中找出所有存在显著差别的原子区域,再以原子区域为核心逐步扩展区域,确保存 在显著差异的前提下最可能的扩展区域,排除重叠的区域,从而获得精确差异区域,每对差 异区域的物质差异信息。图1是本发明分析A样品与B样品质谱成像数据差异的方法流程图。如图所示, 包括以下步骤步骤S101,从A样品质谱成像数据集、B样品质谱成像数据集中分别选取要对比差 异的区域R0S。由于质谱成像数据集,是一张质谱成像数据图像(该图像中每一个点代表 一幅全扫描质谱数据),往往是整个质谱分析数据,真正样品数据包含在质谱成像数据图像 中,在质谱成像数据图像中选定样品所在的区域,避免将与样品无关的其他信息纳入对比, 影像判断。步骤S102,设定能代表样品的最小的区域原子区域AR0S的大小和形状。该AR0S 的样品点个数大于或等于1,不宜太大,也不宜太小,太大容易出现在AR0S就包含了多个不 同差异,太小了,给计算带来了负担,可以是2*2或2*3、或3*2、或3*3的区域,具体大小和 形状视具体实验特点和目的而定。步骤S103,按照空间顺序,分别在A样品、B样品质谱成像数据图像样品区域内选 定AR0S区域的数据,本步骤仅负责按空间顺序,分别选取不同的一对AR0S区域数据。选择 顺序可以是首先在A样品做上选一个AR0S区域,以该区域为对比对象,遍历B样品上样品 区域内所有不同的AR0S,每一次选择不同的一对AR0S,到步骤S104进行该对AR0S的对比 计算,完成后再在A样品上选下一个AR0S,以该区域为对比对象,遍历B样品上样品区域内 所有不同的AR0S;也可以在B样品上选一个AR0S,以该区域为对比对象,遍历A样品上样品 区域内所有不同的AR0S的选择顺序。要实现A样品区域内所有不同的AR0S与B样品区域 内所有不同的AR0S进行一次对比,既不遗漏也不重复。步骤S104,将A类样品中选定的AR0S与B样品中选定的AR0S进行对比,可以通过 主成分分析方法处理这两个AR0S的质谱数据来进行对比,判断是否存在显著差异(图2详 述),可以通过因子分析方法处理这两个AR0S的质谱数据来进行对比(图3详述),判断是 否存在显著差异,还可以通过统计方法处理这两个AR0S的质谱数据来进行对比,判断是否 存在显著差异(图4详述),计算各自的差别参数信息,代表其差异程度。如果存在显著差 异,将该对AR0S的空间信息及差异参数加入显著差异AR0S信息集,继续下一对AR0S的选 择进入步骤S103,直到所有的AR0S对比都完成,进入步骤S105。步骤S105,对存在显著差异AR0S信息集,按照差异系数大小排序,按从大到小选 择每一对存在显著差异的AR0S区域,以该对AR0S区域为核心,以样品区为边界,逐步增 加邻近样品点,判断增加邻近样品点后的区域是否还存在显著差别(判断方法类似步骤 S104),如果存在则该邻近样品点增加到AR0S为核心的区域,形成新区域,如果不存在则该 样品点不纳入,直到扩展到不能再扩展为止,将新的区域信息添加到A样品与B样品质谱成 像数据显著差异信息集。避免重复计算,扩增的顺序和策略图5详述。A样品与B样品质谱 成像数据显著差异信息集中每一元素表示一对差异区域信息,该差异区域信息该对区域在A样品上的空间位置(记为C1)、该对区域在B样品上的空间位置(记为C2)、该对区域 在A样品上的平均质谱图(记为C3)、该对区域在B样品上的平均质谱图(记为C4),差异 谱(该对区域在A样品上的平均质谱图_该对区域在B样品上的平均质谱图,记为C5)。显著差异信息集中每一元素形式如下 图2是主成分分析计算差异参数并判断差异是否显著的方法流程图。如图所示, 包括以下步骤步骤S201,将来自A样品AR0S质谱成像数据集A与B样品AR0S质谱成像数据集 B合并形成数据集AB,标记哪些数据来源于A,哪些数据来源于B。步骤S202,对数据集AB进行主成分分析(Principal Component Analysis,简称 PCA)。PCA分析对数据具有降维和精简数据结果的作用,在PCA之前可以对数据进行数据 标准化等预处理操作,PCA之后获得PCA载荷图信息和PCA得分图信息,从另一个角度来重 新表示数据集AB。PCA载荷图信息表示数据集AB的特征向量,PCA得分图信息表示数据集 AB在这些特征向量的投影值。PCA的计算和操作可以参照书籍(任若恩、王惠文.多元统 计数据分析——理论、方法、实例.北京国防工业出版社,1997)。步骤S203,设定以第一主成分(简称PC1)和第二主成分(简称PC2)为坐标轴 (PC1为横坐标轴、PC2为纵坐标轴)的平面图,在该平面图上绘制样品点,该样品的横坐标 值为该样品数据在PC1上的得分值,纵坐标值为该样品数据在PC2上的得分值。以此将数 据集AB上所有样品点均分布在该平面图上。步骤S204,在以PC1和PC2为坐标轴的平面图上判断A类点与B类点能否分开。 如果能分开则认为A样品点与B样品点存在显著差异,否则认为差异不明显。判断的方法很 多如方法一几何判别法,绘制出包含A样品所有的点的最小多边形,绘制包含B样品所 有的点的最小多边形,如果这两个多变型不相交则认为能分开,差异系数可以用A样品点 重心到B样品点重心的距离表示,重心距离越远,差异越大;方法二聚类法,将这些点聚类, 分成两类,判断这两类是否分别是A样品点、B样品点,如果是就能分开。如果A样品点与 B样品点存在显著差异则将信息增加到差异信息集中。差异信息集中每一元素代表一对区 域差异信息,每对区域差异信息包括:A样品点所在的空间区域、B样品点所在的空间区域, 主成分分析载荷图信息、A样品点所占多变形面积、B样品点所占多变形面积、A样品点多边 形与B样品点多边形间最近点间的距离,A样品点多边形与B样品点多边形重心间的距离, 差异系数。其中差异系数代表差异的程度,可以是差异系数=A样品点多边形与B样品点 多边形重心间的距离/(A样品点多边形的面积+B样品点多边形的面积),也可以是差异 系数=A样品点多边形与B样品点多边形重心间的距离_(A样品点多边形的面积+B样品 点多边形的面积)。图3是因子分析计算差异参数并判断差异是否显著的方法流程图。如图所示,包 括以下步骤步骤S301,将来自A样品AR0S质谱成像数据集A与B样品AR0S质谱成像数据集 B合并形成数据集AB,标记哪些数据来源于A,哪些数据来源于B。
16
步骤S302,对数据集AB进行因子分析。因子分析是一种多元统计分析的方法,通 过对数据矩阵进行特征分析、旋转变换等操作,可获取数据的相关信息。在因子之前可以对 数据进行数据标准化等预处理操作,可以设定80%以上的因子贡献率阈值,因子后获得因 子载荷图信息和因子得分图信息,从另一个角度来重新表示数据集AB,因子载荷图信息表 示数据集AB的特征向量,因子得分图信息表示数据集AB在这些特征向量的投影值。因子分 析的计算和操作可以参照书籍(王学民.应用多元分析.上海上海财经大学出版社,2009)步骤S303,设定以第一主因子和第二主因子为坐标轴(第一主因子为横坐标轴、 第二主因子为纵坐标轴)的平面图,在该平面图上绘制样品点,该样品的横坐标值为该样 品数据在第一主因子上的得分值,纵坐标值为该样品数据在第二主因子上的得分值。以此 将数据集AB上所有样品点均分布在该平面图上。步骤S304,在以第一主因子和第二主因子为坐标轴的平面图上判断A样品点与B 样品点能否分开。如果能分开则认为A样品点与B样品点存在显著差异,否则认为差异不 明显。判断的方法很多如方法一几何判别法,绘制出包含A样品所有的点的最小多边形, 绘制包含B样品所有的点的最小多边形,如果这两个多变型不相交则认为能分开,差异系 数可以用A样品点重心到B样品点重心的距离表示,重心距离越远,差异越大;方法二聚类 法,将这些点聚类,分成两类,判断这两类是否分别是A样品点、B样品点,如果是就能分开。 如果A样品点与B样品点存在显著差异则将信息增加到差异信息集中。差异信息集中每一 元素代表一对区域差异信息,每对区域差异信息包括A样品点所在的空间区域、B样品点 所在的空间区域,主成分分析载荷图信息、A样品点所占多变形面积、B样品点所占多变形 面积、A样品点多边形与B样品点多边形间最近点间的距离,A样品点多边形与B样品点多 边形重心间的距离,差异系数。其中差异系数代表差异的程度,可以是差异系数=A样品 点多边形与B样品点多边形重心间的距离/(A样品点多边形的面积+B样品点多边形的面 积),也可以是差异系数=A样品点多边形与B样品点多边形重心间的距离_(A样品点多 边形的面积+B样品点多边形的面积)。图4是统计分析计算差异参数并判断差异是否显著的方法流程图。如图所示,包 括以下步骤步骤S401,对B样品AR0S质谱成像数据集B做一致性检验,计算数据集B的相关 性,如果数据集B内的数据一致性优于0. 9,可认定为通过一致性检验,认为该数据集自身 是一样品数据,彼此间差异不显著,否则,退出计算。步骤S402,对A样品AR0S质谱成像数据集A做一致性检验,计算数据集B的相关 性,如果数据集B内的数据一致性优于0. 9,可认定为通过一致性检验,认为该数据集自身 是一样品数据,彼此间差异不显著,否则,退出计算。步骤S403,将B样品AR0S质谱成像数据集B做平均,获得平均质谱数据。步骤S404,将A样品AR0S质谱成像数据集A做平均,获得平均质谱数据。步骤S405,提取A平均质谱数据的质谱峰,提取B平均质谱数据的质谱峰,从离子 (m/z)种类和离子强度进行对比首选对比离子种类,看A样品有的离子种类,B样品是否都 有,B样品有的离子种类,A样品是否都有;对于A、B样品都有的离子种类,分别比较每一个 离子的信号强度是否相同,具体判断是否存在差异,进入步骤406。步骤S406,判断A、B质谱图是否存在差异。如果离子种类存在差异则认为存在显著差异,如果离子种类没行差异,但是离子强度存在显著差异也认为存在显著差异。离子种 类存在差异的判断方法如果存在A样品有的离子,B样品没有,或者B样品有的离子,A样 品没有则认为存在差异;离子强度存在显著差异的判断方法将两组离子强度做相关性分 析,设定离子强度表示al(xl,yl),a2 (x2,y2),……、ai (xi,yi)……、an (xn,yn),其中,ai 表示第i种离子,xi表示该离子在A样品中的信号强度、yi表示该离子在B样品中的信号强 度,计算其相关性(倪永年.化学计量学在分析化学中的应用.北京科学出版社,2004),应 用代表相关程度的决定系数(相关系数的平方)R2的大小来判断是否相关,如果相关则认 为不存在差异,不过不相关则认为存在差异,若R2小于0. 8则认为不相关,存在显著差异。 将存在显著差异的对比信息列入A样品与B样品质谱成像数据显著差异信息集。差异信息 集中每一元素代表一对区域差异信息,每对区域差异信息包括:A样品点所在的空间区域、 B样品点所在的空间区域,A样品点间的决定系数平均值、B样品点间的决定系数平均值、A 样品点平均质谱图与B样品点平均质谱图间决定系数,差异系数。其中差异系数代表差异 的程度,可以是差异系数=(A样品点间的决定系数平均值+B样品点间的决定系数平均 值)/A样品点平均质谱图与B样品点平均质谱图间决定系数,也可以是差异系数=(A样 品点间的决定系数平均值+B样品点间的决定系数平均值)_A样品点平均质谱图与B样品 点平均质谱图间决定系数。图5是以AR0S为核心的扩增差异区域的方法流程图。如图所示,包括以下步骤步骤S501,对A样品与B样品AR0S质谱成像数据显著差异信息,按照差异系数从 大到小排序。步骤S502,按序选取一对AR0S质谱成像数据显著差异信息,即按顺序分布选取A 样品AR0S区域和B样品AR0S区域的数据信息。步骤S503,判断步骤S502所选取的AR0S是否已经包含在扩展的新区域中,如果存 在就没有必要继续扩增,对下一对AR0S进行扩展。判断的方法是选取A样品的AR0S,与A 样品中已成功扩增区域的进行比对,若该AR0S包含在任何一个扩增的区域内,则进入步骡 S502 ;如果不是,选取B样品的AR0S,与B样品中已成功扩增的区域的进行比对,若该AR0S 包含在任何一个扩增的区域内,则进入步骤S502,否则进入步骤S504。步骤S504,以B样品AR0S为比较对象,以A样品AR0S为核心,逐步扩展A样品的 区域,可以按照顺时针方向或逆时针方向,围绕A样品AR0S向外临近区域扩增,每增加一个 样品点就应用步骤S505所示方法比对实验。步骤S505,以B样品AR0S为比较对象,对于以A样品AR0S为核心新增一个像素 形成的新区域,再对比这新区域是否存在差异,如果存在则新增像素加入到A样品区域,如 果不存在差异,则不需要该像素点,标记该点以免重复计算(该点向外扩增的区域不予考 虑)。如此,进入步骤S504,增加下一个点,在保证存在显著差异的前提下,将以A样品AR0S 为核心增加到最大,不能超过A样品区域边界,对已经判断不存在差异的像素点不再向外 扩展,形成A样品的新区域。步骤S506,以A样品新区域为比较对象,以B样品AR0S为核心,逐步扩展B样品的 区域,可以按照顺时针方向或逆时针方向,围绕B样品AR0S向外临近区域扩增,每增加一个 样品点就应用步骤S507所示方法比对实验。。步骤S507,以A样品新区域为比较对象,对于以B样品AR0S为核心新增一个像素形成的新区域,再对比这新区域是否存在差异,如果存在则新增像素加入到A样品区域,如 果不存在差异,则不需要该像素点,标记该点以免重复计算。如此,进入步骤S506,增加下一 个点,在保证存在显著差异的前提下,将以B样品AR0S为核心增加到最大,不能超过B样品 区域边界,对已经判断不存在差异的像素点不再向外扩展,形成B样品的新区域。保存A样 品的新区域、B样品的新区域的信息到A样品与B样品质谱成像数据显著差异信息(扩增 区域)。扩增区域信息包括:A样品的新区域空间信息、B样品的新区域的空间信息。步骤S508,判断是否所有的AR0S均扩增完毕,如果完毕就结束,没有就进行下一 对AR0S的扩展运算,进入步骤501。本领域的技术人员在不脱离权利要求书确定的本发明的精神和范围的条件下,还 可以对以上内容进行各种各样的修改。因此本发明的范围并不仅限于以上的说明,而是由 权利要求书的范围来确定的。
19
权利要求
质谱成像数据的差异分析方法,其特征在于,包括步骤1,从第一组被测样品的质谱成像数据集和第二组被测样品的质谱成像数据集中分别选取进行差异分析的区域;步骤2,设定代表第一组被测样品最小区域和第二组被测样品最小区域的大小和形状;步骤3,在为第一组被测样品和第二组被测样品所选取的进行差异分析的区域中选定各最小区域对应的质谱成像数据;步骤4,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据分别利用主成分分析方法、因子分析方法或统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异程度是否符合预设条件;将符合预设条件的最小区域的空间信息及相应的平均质谱图,或者符合预设条件的最小区域的空间信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入最小区域信息集;根据区域信息集中的空间信息或者样品点之间的决定系数和样品点平均质谱图之间的决定系数计算得到差异系数;步骤5,按照差异系数进行排序,选择与每个差异系数对应的第一组被测样品中的最小区域和二组被测样品中的最小区域;分别以第一组被测样品中的最小区域和第二组被测样品中的最小区域为核心扩展样品点,扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域存在的差异程度是否符合预设条件;扩展后的以第一组被测样品中的区域为核心的区域的界限不超出第一组被测样品的界限,扩展后的以第二组被测样品中的区域为核心的区域的界限不超出第二组被测样品的界限;将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的平均质谱图,或者将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入区域信息集。
2.如权利要求1所述的质谱成像数据的差异分析方法,其特征在于,步骤4中,将第一 组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质 谱成像数据利用主成分分析方法比较第一组被测样品中的最小区域对应的质谱成像数据 和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件 包括步骤21,将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的 最小区域对应的质谱成像数据合并,并标记质谱成像数据的来源;步骤22,对合并后的数据进行主成分分析,得到主成分分析载荷图信息和主成分分析 得分图信息;步骤23,设定以第一主成分为横坐标和以第二主成份为纵坐标的平面图,在该平面图 上绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品 点的横坐标值为该样品对应的质谱成像数据在第一主成分上的得分值,样品点的纵坐标值 为该样品对应的质谱成像数据在第二主成份上的得分值;步骤24,在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测 样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。
3.如权利要求1所述的质谱成像数据的差异分析方法,其特征在于,步骤4中,将第一 组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质 谱成像数据利用因子分析方法比较第一组被测样品中的最小区域对应的质谱成像数据和 第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包 括步骤31,将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的 最小区域对应的质谱成像数据合并成数据集AB,并标记质谱成像数据的来源;步骤32,对数据集AB进行因子分析,得到因子载荷图信息和因子得分图信息;步骤33,设定以第一主因子为横坐标和第二主因子为纵坐标的平面图,在该平面图上 绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点 的横坐标值为该样品点对应的质谱成像数据在第一主因子上的得分值,纵坐标值为该样品 点对应的质谱成像数据在第二主因子上的得分值;步骤34,在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测 样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含 的样品点与第二组被测样品中的最小区域包含的样品点能分开。
4.如权利要求2或3所述的质谱成像数据的差异分析方法,其特征在于,利用几何判别 法或聚类法判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小 区域包含的样品点能否分开。
5.如权利要求1所述的质谱成像数据的差异分析方法,其特征在于,步骤4中,将第一 组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质 谱成像数据利用统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二 组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括步骤41,对第一组被测样品中的最小区域对应的质谱成像数据做一致性检验,对第二 组被测样品中的最小区域对应的质谱成像数据做一致性检验;一致性检验通过后,执行步 骡42 ;步骤42,对第一组被测样品中的最小区域对应的质谱成像数据做平均,获得第一平均 质谱数据;对第二组被测样品中的最小区域对应的质谱成像数据做平均,获得第二平均质 谱数据;步骤43,提取第一平均质谱数据的质谱峰,提取第二平均质谱数据的质谱峰;步骤44,判断第一平均质谱数据图和第二平均质谱数据图的离子种类或离子强度是否 存在差异;预设条件为第一平均质谱数据图和第二平均质谱数据图的离子种类存在差异, 或者第一平均质谱数据图和第二平均质谱数据图的离子种类不存在差异但离子强度存在 差异,离子强度存在差异需要满足下述条件将第一平均质谱数据图的离子强度和第二平 均质谱数据图的离子强度做相关性比较后,决定系数大于或等于0. 8。
6.如权利要求1所述的质谱成像数据的差异分析方法,其特征在于,分别以第一组被 测样品中的最小区域和第二组被测样品中的最小区域为核心扩展样品点,扩展后的第一组 被测样品中的区域和扩展后的第二组被测样品中的区域存在的差异系数是否符合预设条 件具体包括步骤51,选择一个第一组被测样品中的最小区域和一个第二组被测样品中的最小区域;步骤51,固定所选定的第一组被测样品中的最小区域,以所选定的第二组被测样品中 的最小区域进行扩展,扩展后的以所选定的第二组被测样品中的最小区域为核心的区域与 所选定的第一组被测样品中的最小区域存在的差异系数符合预设的条件;步骤52,固定扩展后的以所选定的二组被测样品中的最小区域为核心的区域,以所选 定的第一组被测样品中的最小区域为核心进行扩展,扩展后的以所选定的第一组被测样品 中的最小区域为核心的区域与扩展后的以所选定的二组被测样品中的最小区域为核心的 区域存在的差异系数符合预设的条件。
7.如权利要求2或3所述的质谱成像数据的差异分析方法,其特征在于,差异系数等于 第一组被测样品中的最小区域包含的样品点组成的多边形的重心与第二组被测样品中的 最小区域包含的样品点组成的多边形的重心间的距离除以第一组被测样品中的最小区域 包含的样品点组成的多边形的面积与第二组被测样品中的最小区域包含的样品点组成的 多边形的面积之和,或者差异系数等于第一组被测样品中的最小区域包含的样品点组成的 多边形的重心与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间的距 离减去第一组被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被测样 品中的最小区域包含的样品点组成的多边形的面积之和。
8.如权利要求6所述的质谱成像数据的差异分析方法,其特征在于,差异系数等于第 一组被测样品中的最小区域包含的样品点之间的决定系数平均值与第二组被测样品中的 最小区域包含的样品点之间的决定系数平均值之和除以第一组被测样品中的最小区域包 含的样品点的平均质谱图与第二组被测样品中的最小区域包含的样品点的平均质谱图之 间的决定系数,或者差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定 系数平均值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和减 去第一组被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最小 区域包含的样品点的平均质谱图之间的决定系数。
9.质谱成像数据的差异分析系统,其特征在于,包括差异分析区域选取模块,用于从第一组被测样品的质谱成像数据集和第二组被测样品 的质谱成像数据集中分别选取进行差异分析的区域;最小区域设定模块,用于设定代表第一组被测样品最小区域和第二组被测样品最小区 域的大小和形状;质谱成像数据选取模块,用于在为第一组被测样品和第二组被测样品所选取的进行差 异分析的区域中选定各最小区域对应的质谱成像数据;差异程度判决模块,用于将第一组被测样品中的最小区域对应的质谱成像数据和第二 组被测样品中的最小区域对应的质谱成像数据分别利用主成分分析方法、因子分析方法或 统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的 最小区域对应的质谱成像数据存在的差异程度是否符合预设条件;将符合预设条件的最小 区域的空间信息及相应的平均质谱图,或者符合预设条件的最小区域的空间信息及相应的 样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入最小区域信息集; 根据区域信息集中的空间信息或者样品点之间的决定系数和样品点平均质谱图之间的决定系数计算得到差异系数;扩展模块,用于按照差异系数进行排序,选择与每个差异系数对应的第一组被测样品中的最小区域和二组被测样品中的最小区域;分别以第一组被测样品中的最小区域和第二 组被测样品中的最小区域为核心扩展样品点,扩展后的第一组被测样品中的区域和扩展后 的第二组被测样品中的区域存在的差异程度是否符合预设条件;扩展后的以第一组被测样 品中的最小区域为核心的区域的界限不超出第一组被测样品的界限,扩展后的以第二组被 测样品中的最小区域为核心的区域的界限不超出第二组被测样品的界限;将扩展后的第一 组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的平均质谱 图,或者将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间 信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入区 域信息集。
10.如权利要求9所述的质谱成像数据的差异分析系统,其特征在于,将第一组被测样 品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数 据利用主成分分析方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组 被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最小区 域对应的质谱成像数据合并,并标记质谱成像数据的来源;对合并后的数据进行主成分分析,得到主成分分析载荷图信息和主成分分析得分图信息;设定以第一主成分为横坐标和以第二主成份为纵坐标的平面图,在该平面图上绘制第 一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横坐 标值为该样品对应的质谱成像数据在第一主成分上的得分值,样品点的纵坐标值为该样品 对应的质谱成像数据在第二主成份上的得分值;在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中 的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的样品 点与第二组被测样品中的最小区域包含的样品点能分开。
11.如权利要求9所述的质谱成像数据的差异分析系统,其特征在于,将第一组被测样 品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数 据利用因子分析方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被 测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最小区 域对应的质谱成像数据合并成数据集AB,并标记质谱成像数据的来源; 对数据集AB进行因子分析,得到因子载荷图信息和因子得分图信息; 设定以第一主因子为横坐标和第二主因子为纵坐标的平面图,在该平面图上绘制第一 组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横坐标 值为该样品点对应的质谱成像数据在第一主因子上的得分值,纵坐标值为该样品点对应的 质谱成像数据在第二主因子上的得分值;在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中 的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。
12.如权利要求10或11所述的质谱成像数据的差异分析系统,其特征在于,差异程度 判决模块利用几何判别法或聚类法判断第一组被测样品中的最小区域包含的样品点与第 二组被测样品中的最小区域包含的样品点能否分开。
13.如权利要求9所述的质谱成像数据的差异分析系统,其特征在于,将第一组被测样 品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数 据利用统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样 品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括对第一组被测样品中的最小区域对应的质谱成像数据做一致性检验,对第二组被测样 品中的最小区域对应的质谱成像数据做一致性检验;一致性检验通过后,对第一组被测样 品中的最小区域对应的质谱成像数据做平均,获得第一平均质谱数据;对第二组被测样品 中的最小区域对应的质谱成像数据做平均,获得第二平均质谱数据;提取第一平均质谱数据的质谱峰,提取第二平均质谱数据的质谱峰;判断第一平均质谱数据图和第二平均质谱数据图的离子种类或离子强度是否存在差 异;预设条件为第一平均质谱数据图和第二平均质谱数据图的离子种类存在差异,或者第 一平均质谱数据图和第二平均质谱数据图的离子种类不存在差异但离子强度存在差异,离 子强度存在差异需要满足下述条件将第一平均质谱数据图的离子强度和第二平均质谱数 据图的离子强度做相关性比较后,决定系数大于或等于0. 8。
14.如权利要求9所述的质谱成像数据的差异分析系统,其特征在于,分别以第一组被 测样品中的最小区域和第二组被测样品中的最小区域为核心扩展样品点,扩展后的第一组 被测样品中的最小区域和扩展后的第二组被测样品中的最小区域存在的差异系数是否符 合预设条件具体包括选择一个第一组被测样品中的最小区域和一个第二组被测样品中的最小区域;固定所选定的第一组被测样品中的最小区域,以所选定的第二组被测样品中的最小区 域进行扩展,扩展后的以所选定的第二组被测样品中的最小区域为核心的区域与所选定的 第一组被测样品中的最小区域存在的差异系数符合预设的条件;固定扩展后的以所选定的二组被测样品中的最小区域为核心的区域,以所选定的第一 组被测样品中的最小区域为核心进行扩展,扩展后的以所选定的第一组被测样品中的最小 区域为核心的区域与扩展后的以所选定的二组被测样品中的最小区域为核心的区域存在 的差异系数符合预设的条件。
15.如权利要求10或11所述的质谱成像数据的差异分析系统,其特征在于,差异系数 等于第一组被测样品中的最小区域包含的样品点组成的多边形的重心与第二组被测样品 中的最小区域包含的样品点组成的多边形的重心间的距离除以第一组被测样品中的最小 区域包含的样品点组成的多边形的面积与第二组被测样品中的最小区域包含的样品点组 成的多边形的面积之和,或者差异系数等于第一组被测样品中的最小区域包含的样品点组 成的多边形的重心与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间 的距离减去第一组被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被 测样品中的最小区域包含的样品点组成的多边形的面积之和。
16.如权利要求13所述的质谱成像数据的差异分析系统,其特征在于,差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定系数平均值与第二组被测样品中 的最小区域包含的样品点之间的决定系数平均值之和除以第一组被测样品中的最小区域 包含的样品点的平均质谱图与第二组被测样品中的最小区域包 含的样品点的平均质谱图 之间的决定系数,或者差异系数等于第一组被测样品中的最小区域包含的样品点之间的决 定系数平均值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和 减去第一组被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最 小区域包含的样品点的平均质谱图之间的决定系数。
全文摘要
本发明涉及质谱成像数据的差异分析方法及系统,该方法包括选取需要进行差异分析的区域并确定最小区域的形状和大小,得到被测样品的质谱数据集;分析所选定的最小区域间存在的差异,得到差异系数;按照差异系数进行排序,并以选定的最小区域为核心进行扩展,判定扩展后的区域之间的差异程度是否符合预设的条件。本发明能够使研究人员准确、精确分析不同样品成像数据图间的显著差异、差异所在的样品区域,物质种类与含量差异。
文档编号G01N27/62GK101865880SQ20101019463
公开日2010年10月20日 申请日期2010年5月28日 优先权日2010年5月28日
发明者张玉奎, 方向, 江游, 熊行创, 黄泽建 申请人:中国计量科学研究院

  • 专利名称:一种非电学量测定系统及方法技术领域:本发明涉及非电学量测定领域,更准确的说是涉及一种非电学量测定系统及方 法。背景技术:电容传感器被广泛应用,但是电容传感器具有非线性的特性,而且其非线性特性 随温度的变化而变化。为了保证电容传感器
  • 专利名称:Pccp管道接口环圆度测量装置的制作方法技术领域:本实用新型涉及一种PCCP管道接口环圆度测量装置,应用于PCCP生产领域,用于测量PCCP成品管道钢制承插口环圆度的测量。背景技术:PCCP是预应力钢套筒混凝土管的简称,它主要由混
  • 专利名称:一种电推进发动机试验的锂推进剂供给装置及其供给方法技术领域:本发明涉及一套适用于电推进发动机试验的固体推进剂供给装置,具体涉及磁等离子动力学发动机(MPDT)的一种固体碱金属推进剂——锂(Lithium)的供给技术。背景技术:磁等
  • 专利名称:用高压氙灯实现点火的硼颗粒燃烧观测装置的制作方法技术领域:本发明涉及一种燃烧试验装置,特别涉及高压环境下硼颗粒点火燃烧观测的装置。背景技术:由于硼具有较高的质量热值和体积热值,使含硼富燃料推进剂成为固体火箭冲压发动机的首选燃料。但
  • 专利名称:煤粉给粉计量监测装置的制作方法技术领域:本实用新型属于监测技术领域,主要涉及的是一种煤粉给粉计量监测装置。为实现上述目的,本实用新型是通过以下技术方案实现的在锅炉煤粉下粉管内设置一监测计量刮板,该监测计量刮板位置角度的变化信号由传
  • 专利名称:估计管线中的最严重套管侵蚀的制作方法技术领域:本发明涉及管线检查领域。在其一个方面,本发明针对从所采样的测量估计管线中的最严重套管侵蚀。背景技术:保持管线完整性是保证经济成功并且使得现代油气生产场所和系统对环境的影响最小化的基本功
山东科威数控机床有限公司
全国服务热线:13062023238
电话:13062023238
地址:滕州市龙泉工业园68号
关键词:铣床数控铣床龙门铣床
公司二维码
Copyright 2010-2024 http://www.ruyicnc.com 版权所有 All rights reserved 鲁ICP备19044495号-12