在進行分層分析時,所分層的因素一般分為兩類,包括“混雜因素”和“感興趣因素”。這兩類因素雖然都可以作為分層的依據(jù),但因素的來源及意義完全不同。本文將對這兩類分層分析進行歸納總結(jié),以供參考。
對體外診斷試劑臨床試驗數(shù)據(jù)進行分析時,一般會對數(shù)據(jù)進行整體的統(tǒng)計分析,得到總受試人群中試劑的臨床性能。此外,我們還會根據(jù)某些因素將總的受試人群分成若干“層”以進行分層分析,表明在具有某一特征人群中的試劑性能,有時也稱其為亞組分析。在進行分層分析時,所分層的因素一般分為兩類,包括“混雜因素”和“感興趣因素”。這兩類因素雖然都可以作為分層的依據(jù),但因素的來源及意義完全不同。本文將對這兩類分層分析進行歸納總結(jié),以供參考。
一、基于混雜因素的分層分析
在了解基于混雜因素的分層分析之前,首先應(yīng)了解“混雜因素”的定義?!盎祀s因素”來源于流行病學,又稱干擾因子、干擾變量,是指與研究因素和研究疾病均有關(guān)的因素,若在比較的人群組中分布不勻,可以歪曲(掩蓋或夸大)因素與疾病之間真正聯(lián)系。也就是說混雜因素的存在,可以直接導致整體臨床數(shù)據(jù)出現(xiàn)波動,使所得到的統(tǒng)計結(jié)果無法反映真實的臨床性能。因此通常通過分層分析的方法對混雜因素的每個分類進行單獨統(tǒng)計,從而消除該因素各分類的之間的比例不平衡對整體性能評價的影響。混雜因素一般通過科研結(jié)果、小范圍試驗、文獻檢索、臨床經(jīng)驗等方面獲得。體外診斷試劑臨床試驗中,常見的混雜因素一般包括來自于受試者年齡、病程、疾病分型、病毒載量、樣本等。
例如,在新型冠狀病毒抗原檢測試劑臨床試驗中,試劑的整體臨床性能并不是很好,即使跟核酸結(jié)果去比,性能也不是很理想,同時,各家數(shù)據(jù)也沒有可比性。通過對檢測原理的分析及閱讀文獻,抗原檢測試劑的檢測結(jié)果會受到樣本的病毒載量的影響。病毒載量既與受試者的疾病狀態(tài)相關(guān),同時也影響著檢測結(jié)果。因此,我們將病毒載量作為混雜因素,以核酸結(jié)果的CT值作為病毒載量的分層依據(jù)進行分層分析。當進行高、低載量分層后,試劑顯示出了與高載量核酸檢測結(jié)果很好的一致性,同時各家數(shù)據(jù)也顯示出了相同的模式。據(jù)此,我們對抗原試劑的預(yù)期用途進行了合理的限定。
以上這個例子是在整體臨床性能結(jié)果不好的情況下,為了解釋結(jié)果所進行的混雜因素的分層分析。除此之外,在臨床性能可接受時也需要進行分層分析,使臨床試驗的結(jié)果更加穩(wěn)定。例如,在進行新冠抗體檢測試劑臨床性能評價時需根據(jù)受試者病程進行分層分析,其中發(fā)病0至7天為疾病早期,8到14天為疾病的中期,15天以后進入疾病的后期。在這個過程中,抗體水平會根據(jù)病程呈現(xiàn)相對固定的變化趨勢。IgG抗體的水平會持續(xù)升高,IgM抗體水平會呈現(xiàn)疾病早期低、中期高、后期逐漸降低的趨勢(如圖A)。我們在對于一個試劑的臨床試驗數(shù)據(jù)進行審評時發(fā)現(xiàn),這個試劑所展現(xiàn)的抗體水平與所認知的一般性能完全不符,兩種抗體水平均呈現(xiàn)早、晚高,中期低(如圖B)。但這個試劑整體臨床性能卻相當不錯。這是因為它入組了較多的早期和后期受試者,從而提高了整體臨床性能數(shù)據(jù)。如果僅進行整體入組人群的靈敏度、特異度分析是很難發(fā)現(xiàn)這樣的問題的。
從以上兩例子可以看出,進行混雜因素的分層分析的目的就是要對試劑的檢測性能以現(xiàn)有的認知進行全面、準確的評價。
二、基于感興趣因素的分層分析
在進行體外診斷試劑的臨床性能評價時,還需要對于臨床實踐中關(guān)心的特定人群的分析。所感興趣的因素與檢測結(jié)果在臨床診療、患者管理中的應(yīng)用有關(guān)。一般這類因素包括年齡、性別、病程、基因型等。這類因素在進行分析時通常需要與臨床醫(yī)生進行充分的溝通,同時也可以通過臨床閱讀診療指南、文獻總結(jié)得到。
比如對于新冠抗體試劑來說,在疫情初期我們就是要準確地找到新發(fā)的新冠患者,因此對于早期病例,也就是發(fā)病后0-7天的患者進行單獨的性能分析,以證明試劑在新發(fā)病例中的檢測性能。另外,對于新發(fā)病原體,我們要了解標志物的變化模式。因此在新冠抗體試劑審評要點中要求了納入連續(xù)病例,通過圖示法對標志物檢測結(jié)果進行展示、分析,了解試劑檢測結(jié)果的變化,并將其與該標志物的一般認知以及不同產(chǎn)品間所顯示的變化趨勢進行比較和評價。
有時所關(guān)心的亞組性能不理想也并不能說明試劑在這個亞組中的性能出現(xiàn)了問題,而應(yīng)該分析具體原因。在一個基于熒光PCR法的乙型肝炎病毒核酸定量檢測試劑盒的臨床評價中,針對乙肝病毒的基因型這一感興趣的因素進行了分層分析。對于臨床較罕見的乙肝病毒D基因型的核酸定量性能進行評價時發(fā)現(xiàn),考核試劑對D基因型的定量水平與對比試劑出現(xiàn)了嚴重的偏差(大于2個數(shù)量級)。經(jīng)過實驗室驗證、臨床試驗數(shù)據(jù)及操作記錄重新核驗后發(fā)現(xiàn),并不是試劑對于D基因型的定量性能出現(xiàn)了問題,而是由于D基因型屬于稀缺的基因型,在臨床試驗中采用了富集研究,針對這部分樣本進行了較為集中的檢測。而在試驗操作中此部分檢測由于熒光閾值調(diào)整出現(xiàn)了批次間不一致導致。通過對熒光閾值進行標準化標定后,D基因型的定量水平與對比試劑之間不存在顯著的差異。同時,也根據(jù)臨床試驗中出現(xiàn)的問題在說明書中加入了對熒光閾值設(shè)定的標準化標定步驟及注意事項內(nèi)容。
分層分析的本質(zhì)就是對特定的亞組進行分析,但亞組需要科學的設(shè)置和選擇。這里面包括為準確評價試劑檢測性能的基于混雜因素的分層分析,以及為準確評價試劑臨床應(yīng)用性能的基于感興趣因素的分層分析。在進行試劑的臨床性能評價時,要將兩種分層分析的方式有機的結(jié)合,才能對試劑的臨床性能進行全面、準確的評價。