科普:人工智能醫療器械監管研究進展
發布日期:2022-03-29 23:07瀏覽次數:1638次
近日,威爾史密斯是個話題,不由得想起很多年前的大學時期,看過的他主演的有關人工智能的電影,由此想到了人工智能在醫療器械行業的逐漸應用。因此,為大家帶來科普文章,有關人工智能醫療器械監管研究進展。
近日,威爾史密斯是個話題,不由得想起很多年前的大學時期,看過的他主演的有關人工智能的電影,由此想到了人工智能在醫療器械行業的逐漸應用。因此,為大家帶來科普文章,有關人工智能醫療器械監管研究進展。
人工智能醫療器械具有自身特性,其監管問題已成為國際醫療器械監管領域的研究焦點之一,亟需深入研究。本文介紹了人工智能醫療器械所面臨的監管挑戰,提出了人工智能醫療器械監管的總體思路,在分類界定、技術審評、體系核查等方面重點討論了人工智能醫療器械的監管考量,并就今后的人工智能醫療器械監管研究方向提供相關建議。
人工智能醫療器械具有自身特性,特別是當前代表產品所用深度學習技術具有黑盒特性,存在可解釋性差等問題,其監管問題已成為國際醫療器械監管領域的研究焦點之一,亟需加強監管研究。
2019 年7 月, 我國成立人工智能醫療器械創新合作平臺,以促進人工智能醫療器械監管研究;同時在全球率先發布《深度學習輔助決策醫療器械軟件審評要點》,明確人工智能醫療器械審評關注重點,引發國際廣泛關注。2020 年至今,我國大力推進人工智能醫療器械監管研究,積極參與國際醫療器械監管機構論壇(IMDRF)人工智能醫療器械工作組、國際電信聯盟/ 世界衛生組織醫學人工智能焦點組(ITU/WHO Focus Group on Artificial Intelligence for Health)等國際監管協調工作;先后制定和發布多項相關指導原則、審評要點和行業標準,陸續批準20 余項第三類深度學習輔助決策類獨立軟件產品上市,標志著我國人工智能醫療器械監管研究已取得階段性成果。
時值醫療器械監督管理新法規實施之際,及時對人工智能醫療器械監管研究進行總結和展望,不僅有利于提升監管能力和水平,持續推進人工智能醫療器械監管研究,而且有利于指導注冊申請人做好產品質控工作,切實促進人工智能醫療器械產業健康發展。
一、人工智能醫療器械的監管挑戰
人工智能醫療器械是采用人工智能技術實現其醫療用途的醫療器械,其監管挑戰主要源自于人工智能技術所具有的特性。
人工智能技術具有快速迭代特性,特別是基于數據的算法。算法更新對于人工智能醫療器械安全性和有效性的影響具有不確定性,可能會提升產品性能,也可能會降低產品性能,甚至導致產品召回。若每次算法更新均需變更注冊,不僅會大幅增加注冊人負擔,而且會占用大量監管資源。如何規范人工智能醫療器械算法更新的監管要求,是監管研究的重點。
人工智能技術需要高質量醫學數據進行算法訓練,尤其是基于數據的算法。由于受多方面客觀條件的限制,算法訓練所用數據存在數據質量不高、數據量不足、數據多樣性不夠、數據分布不合理等問題,易引入算法偏倚,降低算法泛化能力,導致產品難以在臨床落地。如何控制人工智能醫療器械的算法偏倚以保證算法泛化能力,也需要深入研究。
人工智能技術包含黑盒算法,黑盒算法可解釋性差。由于醫療決策路徑復雜,存在不確定性和開放性,故因果性對于醫療決策至關重要。而黑盒算法僅是反映輸出與輸入的相關性而非因果性,難以與現有醫學知識建立有效關聯,用戶知其然不知其所以然,不利于后續醫療決策。如何提升人工智能醫療器械所用黑盒算法的透明度以增強可解釋性,亦需加強研究。
此外,人工智能技術包含多種算法,不同算法雖有不同技術特征,但相互之間存在著交叉、包含等關系,沒有清晰嚴格的劃分界線。同時,不同算法在醫療場景應用的情況和程度也不同,存在著單獨使用、組合使用等情況,劃分界線也不清晰。這些模糊性使得人工智能醫療器械的監管范圍難以確定。
二、人工智能醫療器械的監管思路
人工智能醫療器械從醫療器械軟件角度可分為人工智能獨立軟件(軟件本身即為醫療器械,SaMD)和人工智能軟件組件(醫療器械內含的軟件,SiMD),二者雖存在技術差異,但軟件生存周期過程質控原則相同,故監管要求基本一致。
人工智能醫療器械作為醫療器械軟件的子集,亦屬于數字醫療(Digital Health)范疇,其監管思路遵循數字醫療監管的框架和原則,同樣采用基于風險的全生命周期管理方法進行監管,同時兼顧國際監管經驗和技術發展趨勢。
基于風險是指人工智能醫療器械的監管要求取決于其風險水平,風險水平越高監管要求越嚴,其風險水平采用軟件安全性級別進行表述,分為輕微、中等、嚴重三個級別,可結合人工智能醫療器械的預期用途、使用場景、核心功能進行綜合判定。全生命周期管理是指在醫療器械質量管理體系框架下,明確人工智能醫療器械生存周期過程質控要求,涵蓋上市前和上市后監管要求,并可參考良好機器學習實踐(GMLP)進行完善。
同時,需要將國際監管經驗和中國國情相結合,綜合考慮人工智能醫療器械的監管要求。不同國家的國情不同,醫療器械監管的范圍、模式、資源、條件等方面均有所不同,因此國際監管經驗可以參考借鑒,但不能簡單照搬照抄。比如,美國FDA 正在制定“預定變更控制計劃”用于控制人工智能獨立軟件的更新,待成熟時擴至人工智能軟件組件,其核心思想是取消原有“算法鎖定”要求,制造商可在經美國FDA 批準的軟件預定更新計劃下進行軟件更新而無需重新申請注冊。由于軟件預定更新計劃所含內容可能涉及重大軟件更新,按照我國現行法規要求需要申請變更注冊,因此“預定變更控制計劃”在我國存在法規沖突,難以完全實施。再比如,美國FDA 正在試點“軟件預認證”項目,嘗試將獨立軟件監管模式由基于產品改為基于制造商質量與組織卓越文化(Cultureof Quality and Organizational Excellence,CQOE), 也適用于人工智能獨立軟件,后續將擴至軟件組件。“軟件預認證”在優化產品上市流程等方面雖有參考借鑒價值,但從產品上市角度類似于我國已取消的免檢產品項目,不適合當前國情。
此外,需要結合人工智能技術發展趨勢,穩妥考慮人工智能醫療器械監管要求。采用傳統人工智能技術的醫療器械已有眾多產品獲批上市,需要考慮監管要求的延續性,不能置之不顧推翻重來。采用深度學習技術的醫療器械是當前人工智能醫療器械的代表產品,并且處于快速發展階段,可作為切入點予以重點研究。采用人工智能新技術的醫療器械處于研發階段,亦需提前開展監管研究,做好技術儲備以應對新挑戰。
三、人工智能醫療器械的監管考量
圍繞人工智能醫療器械所面臨的監管挑戰,基于人工智能醫療器械的監管思路,人工智能醫療器械監管研究在分類界定、技術審評、體系核查等方面取得相應進展。
(一)分類界定
人工智能醫療器械需要明晰分類界定原則確定監管范圍。因其屬于醫療器械軟件子集,故可參考醫療器械軟件的分類界定原則,結合其自身特性予以考慮。獨立軟件是否作為醫療器械管理,通常結合預期用途、核心功能進行判定,管理類別主要基于風險水平進行判定。軟件組件作為醫療器械的組成部分,其管理類別通常與所屬醫療器械相同,特殊情況參考獨立軟件分類界定情況并按風險從高原則進行判定。下面以獨立軟件為例進行重點討論。
由于醫學知識的真偽優劣評判不屬于醫療器械監管范圍,故基于知識管理的醫學人工智能軟件不是人工智能獨立軟件, 其代表產品是采用自然語言處理(NLP)技術對電子病歷的文本信息進行處理分析,生成知識圖譜或量表并以此為基礎向用戶提供醫療決策建議。此類軟件的預期用途、核心功能與人工智能獨立軟件類似,需要引入易于操作的分類界定新維度加以區分。考慮到人工智能獨立軟件的處理對象基于醫療器械數據(即醫療器械產生的用于醫療用途的客觀數據),而此類軟件的處理對象基于非醫療器械數據,并且處理對象概念清晰易于操作,故可引入處理對象作為分類界定新維度。因此,醫學人工智能軟件是否為人工智能獨立軟件,需結合其預期用途、核心功能、處理對象進行綜合判定。
人工智能獨立軟件的管理類別判定需要基于其風險水平,兼顧已上市產品的監管延續性。風險水平可從預期用途、算法成熟度兩個維度細化,其中預期用途可分為輔助決策和非輔助決策,前者提供醫療決策建議,后者提供醫療參考信息,前者風險高于后者;算法成熟度可分為成熟算法和全新算法,前者是指算法安全性和有效性已在醫療應用中得到充分證實,后者是指算法未上市或其安全性和有效性尚未在醫療應用中得到充分證實,后者潛在風險多于前者。全新算法若用于輔助決策按第三類醫療器械管理,若用于非輔助決策按第二類醫療器械管理;成熟算法無論何種預期用途管理類別保持不變,以保證監管延續性。
(二)技術審評
人工智能醫療器械的技術審評不僅要考慮人工智能醫療器械指導原則要求,而且要考慮數字醫療等相關指導原則要求,包括但不限于醫療器械軟件、醫療器械網絡安全、醫療器械人因設計、移動醫療器械、醫療器械臨床評價、醫用軟件通用名稱命名等指導原則。
技術審評主要結合算法特征和產品特性,綜合權衡風險和受益,系統評價安全性和有效性。算法特征不同,評價重點也不同,比如,黑盒算法可解釋性劣于白盒算法,需要關注其可解釋性提升問題;有監督學習數據標注要求高于無監督學習,需要關注其數據標注質控問題;基于數據的算法對于訓練數據量的要求高于基于模型的算法,需要關注其數據質控問題。產品的預期用途、使用場景不同,即使采用同一算法,其產品特性亦不同,評價亦有所側重。風險主要關注過擬合和欠擬合等算法風險,以及假陰性和假陽性等醫療決策風險,進口產品還需考慮中外差異風險。系統評價需結合算法訓練、算法性能評估、臨床評價等結果對產品的適用范圍、使用場景、核心功能進行規范和必要限制,對于前期已開發且不滿足要求的產品允許開展差距分析并采取補救措施。
在算法更新控制方面,將算法更新分為算法驅動型更新和數據驅動型更新并區分要求,前者是指算法發生實質性變化或者重新訓練,屬于重大軟件更新,需申請變更注冊;后者是指僅由訓練數據量增加而發生的算法更新,若算法性能評估結果與前次注冊相比存在統計學差異則屬于重大軟件更新,需申請變更注冊,反之屬于輕微軟件更新,無需申請變更注冊,通過質量管理體系進行控制,待下次變更注冊時提交相應注冊申報資料,即無需“算法鎖定”。同時,通過軟件版本命名規則進行算法更新控制,軟件版本命名規則需涵蓋算法驅動型更新和數據驅動型更新,列舉重大算法更新常見典型情況,在方法學上實與“軟件預定更新計劃”相同,但更早實施。
在算法泛化能力保證方面,訓練數據需結合目標疾病流行病學特征,盡可能來源于多家、多地域、多層級的代表性臨床機構,以及多家、多種、多參數的代表性采集設備,從而提高數據充分性和多樣性,從源頭保證算法泛化能力。算法訓練需提供訓練數據量- 評估指標曲線等證據,持續監測算法泛化能力。算法驗證所用測試集需不同于訓練集,以客觀評價算法泛化能力,并可結合壓力測試和對抗測試深入評價算法泛化能力。算法確認需保證臨床評價數據集不同于訓練數據集,機構數量盡可能多,地域分布盡可能廣泛,以全面評價算法泛化能力。上市后亦需在真實世界持續開展算法泛化能力研究。
在黑盒算法可解釋性提升方面,算法設計需對黑盒算法開展算法性能影響因素分析,研究影響算法性能的主要因素及其影響程度,根據分析結果明確產品使用限制,并在說明書中予以警示和提示,以提升算法可解釋性。同時,明確算法開發生存周期過程質控要求,以提升算法透明度。此外,建議與現有醫學知識建立關聯,以進一步提升算法可解釋性。
此外,在人工智能新技術應對方面,針對當前處于研發階段尚無產品注冊的人工智能新技術,僅作原則性要求,提供算法基本信息、算法選用依據和算法驗證與確認資料即可,預留監管空間。在算法評價方法方面,提出可基于測評數據庫進行算法確認,測評數據庫需滿足權威性、科學性、規范性、多樣性、封閉性、動態性等要求,公開數據庫因不具備封閉性而不能用作測評數據庫,但可用于算法性能評估或算法訓練。
(三)體系核查
人工智能醫療器械的體系核查需要基于醫療器械生產質量管理規范、獨立軟件附錄(軟件組件參照執行,含網絡安全)及其現場檢查指導原則,并可參考人工智能醫療器械指導原則相關要求,其以有監督深度學習為例明確了人工智能醫療器械生存周期過程質控要求,涵蓋需求分析、數據收集、算法設計、驗證與確認、更新控制等階段。
考慮到有些注冊申請人剛進入醫療器械行業,對于質量管理體系文檔化要求的認識和理解不到位,著重加強體系記錄的要求,包括數據采集質量評估、數據標注質量評估、數據擴增、算法更新等方面。
數據質控對于保證產品質量至關重要,特別是基于數據的算法,因此著力規范數據質控要求,明確并細化數據采集、數據整理、數據標注、數據集構建等環節質控要求,涵蓋人員、過程、結果等方面。
算法更新質控是體系核查的重點,特別是對數據驅動型更新,因其輕微軟件更新主要通過質量管理體系進行控制。以算法更新與軟件版本命名規則的匹配性作為切入點,將是算法更新體系核查的基本方法。
算法可追溯性分析作為算法質量保證的重要方法,也是體系核查的重點,需追溯算法需求、算法設計、算法實現(即源代碼)、算法測試、算法風險管理的相互關系。算法更新亦需開展算法可追溯性分析。
四、人工智能醫療器械的監管研究展望
我國人工智能醫療器械監管研究雖已取得階段性成果,但所面臨的監管挑戰依然存在且將長期存在,一是現有挑戰尚未全部得到根本解決,二是人工智能新技術層出不窮,亦會帶來新挑戰,因此需要持續推進監管科學研究,進一步提升國際競爭力和話語權。
持續學習/ 自適應學習具備自學習能力,此時用戶亦成為產品開發者,與注冊申請人共同承擔法律責任和質量責任,同時算法更新迭代速度更快,用戶不同算法更新情況亦不同,對于產品安全性和有效性的影響具有高度不確定性,因此當前限定持續學習/ 自適應學習僅可用于算法訓練或醫學研究,不得用于醫療決策。從長遠角度來看,需要從法規、產品質量評價等方面深入研究其監管模式,明確注冊申請人和用戶的責任劃分,利用年度報告等制度及時、精確評價算法更新影響。
人工智能醫療器械安全有效性評價體系亦需全面研究。一是大力推進重點產品指導原則和審評要點的制修訂,與人工智能醫療器械產品發展趨勢相匹配,不斷完善人工智能醫療器械指導原則體系的構建工作。二是充分利用真實世界數據客觀評價人工智能醫療器械的算法泛化能力,實現全生命周期閉環監管。三是繼續探索測評數據庫的評估要求和作用價值,測評數據庫具有封閉性,注冊申請人無法直接評估,需要結合醫療器械主文檔登記事項予以評估,在此基礎上進一步探索測評數據庫在產品質量評價中的作用和價值。
有些人工智能醫療器械預期在基層醫療機構使用,由于基層醫療機構不具備醫療器械臨床試驗機構的備案條件,故這些產品難以在真實臨床場景下開展臨床試驗進行算法確認,影響產品質量評價結果。以基層醫療機構的業務主管醫療機構作為臨床試驗的牽頭單位或許是解決方法。
隨著人工智能新技術的快速發展,人工智能醫療器械新產品形態也會出現,其監管的范圍、模式和方法可能均需調整,分類界定、技術審評、體系核查等方面具體工作的關注重點亦需隨之調整,這樣方能及時、有效地解決人工智能新技術所帶來的監管挑戰。
關鍵詞:人工智能醫療器械注冊