1、兩步識(shí)別保證鑒別模型的準(zhǔn)確性
提高鑒別模型的正確率是建立紅外鑒別模型的核心。在建模過程中,我們遇到兩類問題:第一類問題,模型的分辨能力不夠,使對(duì)一些紅外譜圖差異較小的物質(zhì)不能被正確識(shí)別。如注射用阿莫西林鈉與注射用阿莫西林鈉/克拉維酸鉀(5:1)制劑,在全譜(4000~12000cm-¹)范圍內(nèi)比較,二者的紅外光說非常相似,采用全譜識(shí)別時(shí),二者不能相互識(shí)別;但利用局部特征譜段(如4100~4800cm-¹)識(shí)別,二者的差異顯現(xiàn)。
第二類問題,閾值無法彼此兼顧,使得一些原本具有差異的紅外圖譜錯(cuò)誤識(shí)別。如對(duì)羅紅霉素片的鑒別,由于國(guó)內(nèi)18家生產(chǎn)企業(yè)的工藝、處方不同,使得在大環(huán)內(nèi)酯抗生素(包括紅霉素、琥乙紅霉素、依托紅霉素、羅紅霉素、克拉霉素、阿奇霉素、乙酰螺旋霉素、麥迪霉素、麥白霉素、吉他霉素、、乙酰吉他霉素)片劑鑒別模型中,羅紅霉素片的鑒別閾值(0.72)偏大;導(dǎo)致在驗(yàn)證中300張維生素C片的紅外光譜(維生素C片平均光譜與羅紅霉素片平均光譜間的距離為0.68)有281張被錯(cuò)誤的識(shí)別為羅紅霉素片。
為解決上述問題,我們確定了以下建模思路:(1)結(jié)構(gòu)相近的同系物藥物放在一組進(jìn)行識(shí)別,如對(duì)抗感染藥物,按其化學(xué)結(jié)構(gòu)分為頭孢菌素類、青霉素類、大環(huán)內(nèi)酯類、氨基糖苷類等,再根據(jù)其制劑(粉針劑、膠襄劑、片劑)的形式,分別建立鑒別型。(2)采用兩步鑒別的方案。第一步識(shí)別模型,利用同第物藥物紅外圖譜的差異(必要時(shí)利用相對(duì)較窄的特征譜段),主要解決模型中同系物之間的相互識(shí)別問題;第二步確證模型,利用較寬的說段,解決可能與模型外品種的混淆問題,提高鑒別模型的準(zhǔn)確性。
2、閾值調(diào)整保證鑒別模型的穩(wěn)健性
建立定性模型時(shí),我們以樣品光譜與該品種平均光譜的距離(Hit)表征光譜的差異,并以Hit值為指標(biāo)進(jìn)行聚類分析,進(jìn)而實(shí)現(xiàn)對(duì)樣呂的識(shí)別。常用的距離表示方法有歐氏距離法和馬氏距離法。歐氏距離法計(jì)算距離時(shí),只能給出樣品與平均光譜的吻合程度,即相對(duì)距離,不能反映一類樣品的分布情況;而馬氏距離法在計(jì)算距離時(shí),根據(jù)樣品的分布情況在不同方向上給出不同的權(quán)重。在二維坐標(biāo)上中,由歐氏距離法劃定的邊界圓形,而由馬氏距離法劃定的邊界通常為橢圓形。只有當(dāng)樣品在平均光譜周圍呈完全隨機(jī)分布時(shí),歐氏的距離法與馬氏距離法劃定的邊界才相生合。我們?cè)谔囟ㄊ噶靠臻g中,對(duì)Hit值的分布規(guī)律進(jìn)行了探討,證明Hit值的分布基本呈正態(tài)分布;不同工藝的相同產(chǎn)品的NIR圖譜的差異越大,其分布越寬。如在注射B-內(nèi)酰按類抗生素鑒別模型中,15個(gè)企業(yè)33批注射用頭孢哌酮鈉,594張圖譜的Hit值呈下態(tài)分布;而在大環(huán)內(nèi)酯類抗生素片劑鑒別模型中,300張紅霉素片的圖譜的Hit值雖然偏態(tài)分布,但可作為正態(tài)分布處理。由于Hit值的分布基本呈正態(tài)分布,理論上90%的樣品的Hit值應(yīng)分布在MD+1.65Sdeu(MD 為樣品光譜距離平均光譜的平均距離,Sdeu為其標(biāo)準(zhǔn)偏差)范圍內(nèi),95%的樣品的Hit值應(yīng)分布在MD+2Sdeu范圍內(nèi),99%的樣品的Hit值應(yīng)分布在MD+3Sdeu范圍內(nèi)。因此實(shí)驗(yàn)中可根據(jù)統(tǒng)計(jì)規(guī)律對(duì)閾值進(jìn)行調(diào)整,保證模型至少對(duì)95%的樣品能夠識(shí)別。
對(duì)于多企業(yè)不同工藝生產(chǎn)品種,由于收集到的樣品可能不均衡,使得樣本的各種差異的權(quán)重不同。如39批注射用頭孢唑林鈉,在建模譜段進(jìn)行聚類分析,所有樣品可以分為6組,第1組包括15批,第2組包括8批,第3級(jí)包括1批,第4級(jí)包括3批,第5組包括9批,第6組包括3批,籌備組組樣品的物理特性(結(jié)晶度、粒度)不同。如果用全部樣呂求其每一亞類的平均光譜,再利用求得的平均光譜構(gòu)建該樣品的平均光譜,以調(diào)整收集樣本不均勻所造成的平均光譜的偏差。對(duì)注射用頭孢唑林鈉樣品,比較兩種方法構(gòu)建的平均光譜的差異:由所有樣品Hit值的概率密度分布圖可見,平均光譜調(diào)整后樣本更趨于正態(tài)分布,且Hit值的標(biāo)準(zhǔn)偏差變小,即樣品的分布更為均勻。
3、已建立的模型
從2004年12月至今,我們已經(jīng)建成了各種定性模型約150個(gè),可對(duì)約300余種藥物進(jìn)行鑒別。涉及抗感染藥物(抗生素)、消化系統(tǒng)藥物、心血管藥物、呼吸系統(tǒng)藥物等常用基本藥物。并已經(jīng)完成了建立通用性定量模型的可行性探討,建立了10余種定量模型。26種頭孢菌素粉針劑定性模型的結(jié)構(gòu)。