汇服科技有限公司

简体中文

|

English
解决方案
Application Area
您的位置:汇服科技 首页 > 解决方案

拉曼光谱的相关性算法原理

    

过去十年见证了手持和便携式工具的发展,它们为制药行业的质量保证、质量控制和制造可追溯性引入了新的有价值的分析能力。这些设备的性能得到了显着提高,并且在某些情况下可以生成与实验室级台式仪器相当的数据质量。

一种广泛使用的用于快速鉴定未知化合物的便携式技术是拉曼光谱。本文介绍了手持拉曼光谱作为光谱数据决策工具使用的两种最常见的数学表示,即命中质量指数 (HQI) 和显着性水平(p 值)。HQI 是未知材料库匹配的首选方法,p 值是验证已知材料身份的理想选择。

谱库匹配

谱库匹配是光谱学中一种常用的方法,用于从 NIR、FTIR 或拉曼光谱研究未知材料。这是通过将材料的测量光谱与已知材料的经过验证的光谱库进行互相关来执行的。然后通过以下定义的 HQI 计算量化每个潜在匹配的相似度,

w1.png

HQI通过将库光谱与未知材料的点积平方,除以库光谱与自身的点积乘以未知光谱与自身的点积来表示两个光谱之间的光谱相关系数。HQI 值介于 0 和 1 之间,按 100 缩放时,完美匹配将为 100。

谱库匹配主要用作调查未知材料的工具,需要快速将未知材料的光谱与许多潜在的光谱匹配进行比较,如表 1 所示。

w2.png

成分验证

为了验证已知材料的身份,使用更高级的统计方法很重要,以确保材料符合预期的概率高于某个阈值(通常为 95% 置信度)。

本文重点介绍 Svante Wold 在 1970 年代和 1980 年代首创的类类比软独立建模 (SIMCA) 方法,目前用于NanoRam 手持式拉曼光谱仪(美国 B&W Tek)。这种多元分析方法基于为每种材料开发主成分分析 (PCA) 模型来模拟每个类别的结构化方差,是一种广泛使用的分类工具。

SIMCA 基于确定每个类别内的相似性,使其成为验证已知化合物的理想选择。SIMCA方法总结如下:

使用已使用批准的分析方法验证的材料样本集测量所需材料的训练光谱集

使用训练集开发主要能力分析 (PCA) 模型,并基于 95% 的置信度建立成员资格限制。

测量新样本的光谱,并将其投影到 PCA 模型上,看看它是否在模型限制内。

p 值的定义是在总体中没有影响时获得比估计结果更极端的观察值的概率。

w3.png

图 3 显示了在 NanoRam (B&W Tek, USA) 上开发的 L-丙氨酸 (I)、L-天冬氨酸 (II) 和 L-半胱氨酸盐酸盐 (III) 的三种方法的结果。 它们的结构完全不同并且可以使用先前表 1 中所示的 HQI 值明确识别。

e4.png

w5.pngw6.png

图 4 显示结果允许在分析测量光谱时对“通过”/“失败”决策进行统计确定。为了总结这些模型的结果并证明其特异性,表 2 中显示了一个邻近矩阵,它表明当针对三种方法中的每一种运行测试样品时,每种方法都通过了正确的方法。

w7.png