當(dāng)前位置:熒颯光學(xué)儀器(上海)有限公司>>技術(shù)文章>>紅外應(yīng)用|聊聊光譜相關(guān)性
紅外應(yīng)用|聊聊光譜相關(guān)性
作為紅外光譜QC人員,在日常工作中最常用的一項(xiàng)任務(wù)就是確認(rèn)所采集的樣本紅外光譜是否和標(biāo)準(zhǔn)樣本一致,或者在對(duì)未知物進(jìn)行確認(rèn)時(shí),需要從海量的標(biāo)準(zhǔn)光譜庫(kù)中尋找到最佳匹配的樣本,這個(gè)時(shí)候往往就需要一個(gè)方法來(lái)評(píng)判。
這個(gè)方法我們通常使用光譜“相關(guān)系數(shù)”或者“匹配系數(shù)”,也有稱之為“HQI”(相似度指標(biāo))來(lái)衡量。這里有兩個(gè)核心問(wèn)題:(1)兩張光譜“相關(guān)性”怎么計(jì)算?(2)“相關(guān)性”達(dá)到多少算好?
圖1是熒颯光學(xué)公司S-IR軟件中未知樣本光譜在光譜庫(kù)中進(jìn)行檢索的示例,根據(jù) “相關(guān)系數(shù)”計(jì)算,軟件給出了最為匹配的可能物質(zhì)是聚苯乙烯,其相關(guān)系數(shù)達(dá)到88.98%。
圖1 譜庫(kù)檢索
下面我們簡(jiǎn)單聊聊這個(gè)過(guò)程,看看有沒有豁然開朗的感覺。
如圖2,有一個(gè)未知樣本光譜和兩張標(biāo)準(zhǔn)樣本光譜,假設(shè)每張光譜只由三個(gè)波長(zhǎng)點(diǎn)組成,分別是未知樣本[1, 2, 3],標(biāo)樣1[1.2, 2.1, 2.8]和標(biāo)樣2[2, 2.5, 1.8],將其繪制在3D坐標(biāo)系中,肉眼可見,未知樣本和標(biāo)樣1靠的很近,和標(biāo)樣2相隔很遠(yuǎn)。我們就可以輕而易舉地給出判斷和結(jié)論。但當(dāng)光譜從3個(gè)波長(zhǎng)點(diǎn)擴(kuò)展到N個(gè)點(diǎn)(比如4000-400cm-1)時(shí),這時(shí)候人腦和肉眼就根本不夠用了,只能借助算法來(lái)計(jì)算,并給出判斷結(jié)果。
圖2
兩張光譜之間的相關(guān)系數(shù)用于衡量它們之間的相關(guān)程度,常用的方法是皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient),在光譜分析中,即兩張光譜對(duì)應(yīng)波長(zhǎng)處的強(qiáng)度值之間的線性關(guān)系。通常其取值范圍在[-1,1]之間:
-
值為 1 表示完全正相關(guān),即兩張光譜的變化趨勢(shì)完全一致。
-
值為 -1 表示完全負(fù)相關(guān),即兩張光譜的變化趨勢(shì)完全相反。
-
值為 0 表示不存在線性相關(guān)關(guān)系。
為了便于理解,我們通常取絕對(duì)值來(lái)表達(dá)其相關(guān)性強(qiáng)度。
假設(shè)有兩張光譜,分別為 X=[x1,x2,...,xn] 和 Y=[y1,y2,...,yn],它們的皮爾遜相關(guān)系數(shù)的計(jì)算公式為:
是不是有點(diǎn)眼熟?妥妥的就是平常使用的最小二乘法嘛。恭喜你答對(duì)了!
我們將圖2中的未知樣本和兩個(gè)標(biāo)樣計(jì)算一下,相關(guān)系數(shù)分別0.99和0.27,所以也驗(yàn)證了我們?nèi)庋鄣臏?zhǔn)確性。除了皮爾遜相關(guān)系數(shù)之外,還有其他很多類似的算法,比如歐式距離法、馬氏距離法、夾角余弦距離法等等,匹配值在有些軟件中也就會(huì)變成最大到999。不一而論,主要思想都差不多。
下面關(guān)于第二個(gè)問(wèn)題,則比較主觀了,需要根據(jù)自己實(shí)驗(yàn)室要求來(lái)做確定。小編在此給一個(gè)參考,在制藥領(lǐng)域中,通常將最小HQI設(shè)置為0.95,以此來(lái)判定未知樣品與標(biāo)準(zhǔn)圖譜是否匹配。
?