\u003c/p>\u003cp class=\"textAlignCenter picIntro\">圖注1:構(gòu)建虛擬生化生理人體的時間和空間尺度。時間尺度橫跨由分子事件(µs)、細(xì)胞信號傳導(dǎo)(ms)、細(xì)胞功能(s)到人體壽命 (decades) 的10^15跨度。空間尺度橫跨由分子(nm)、細(xì)胞(µm)、器官(cm)到軀干 (m) 的10^9跨越。\u003c/p>\u003cp>虛擬生理心臟研究可追溯與上世紀(jì)五十年代。1952年諾貝爾獎得主Hodgkin和Huxley建立了世界上第一個細(xì)胞計算模型 — 烏賊神經(jīng)元細(xì)胞模型[1],開創(chuàng)了用計算模型研究生物問題的先河。1960年Denis Noble[2]在Nature雜志上發(fā)表了第一個心肌細(xì)胞計算模型 — 浦肯野心肌細(xì)胞模型,開創(chuàng)虛擬生理心臟模型的先例。此后幾十年的研究中,不斷有研究人員研發(fā)針對不同物種、心臟不同組織、復(fù)雜精密的心肌細(xì)胞電生理模型[3]。1991年,Peter Hunter等人[4]基于犬實驗數(shù)據(jù)構(gòu)建了第一個心臟解剖結(jié)構(gòu)模型,融合多物理尺度與電生理的虛擬心臟模型研究進(jìn)入新階段。此后,多尺度、多物理模態(tài)的心臟計算模型陸續(xù)出現(xiàn),并被成功應(yīng)用于心臟功能研究與藥物安全性評估[5-8]。\u003c/p>\u003cp>在早期虛擬生理心臟研究中,心臟一個生物秒的電生理活動往往需要數(shù)日甚至數(shù)月來仿真計算。隨著顯存技術(shù)的發(fā)展,這個時間縮短到數(shù)天。近年,有研究致力于提升虛擬生理心臟的計算速度。比如通過將三維心臟空間劃分為矩形子區(qū)域來實現(xiàn)并行心臟模擬[9],使運算速度大大提升。另一項研究通過WebGL將高性能心臟模擬擴展到普通計算機上[10],甚至有GPU的手機也可以模擬三維心室的電動態(tài)。一些研究試圖通過自適應(yīng)時間步長來提高運行速度[11,12],結(jié)果表明,固定時間步長比自適應(yīng)時間步長方法具有更好的效率[11]。\u003c/p>\u003cp>但這些研究僅能達(dá)到“準(zhǔn)實時運算”,離真正意義上的“實時運算”,即仿真時間與生物時間比達(dá)到1:1,還有難以逾越的距離,更不用說仿真精度的提升帶來的運算量爆炸式增長。高計算復(fù)雜度帶來的海量運算,使得虛擬生理心臟模型難以實現(xiàn)實時計算,阻礙其大規(guī)模應(yīng)用。\u003c/p>\u003cp>\u003cstrong>2\u003c/strong>\u003c/p>\u003cp>\u003cstrong>實時計算\u003c/strong>\u003c/p>\u003cp>為了在更高分辨率、更高精度和更大規(guī)模的心臟模型上實現(xiàn)實時仿真,智源研究院開發(fā)了\u003cstrong>具有精細(xì)細(xì)胞電生理與解剖結(jié)構(gòu)的人心室模型\u003c/strong>。該模型包含了19種細(xì)胞生理狀態(tài)變量和70多個公式,能夠\u003cstrong>實現(xiàn)復(fù)雜的心臟電生理與病理仿真\u003c/strong>,為臨床與醫(yī)藥工業(yè)應(yīng)用提供豐富的場景。\u003c/p>\u003cp>為實現(xiàn)實時計算,智源對模型底層計算進(jìn)行了深度優(yōu)化。針對心臟仿真中計算強度大和I/O密集等瓶頸問題,智源充分結(jié)合A100平臺的硬件特點,設(shè)計了多種優(yōu)化策略,如量化和循環(huán)展開。這些措施有效降低了計算復(fù)雜度和I/O,使得在更大規(guī)模和更高復(fù)雜度的心臟模型上實現(xiàn)了180倍的速度提升。\u003c/p>\u003cp>最終,智源虛擬心臟仿真系統(tǒng)實現(xiàn)了對心臟電生理功能的實時仿真,達(dá)到生物時間與計算時間比為1:0.84。這一成果不僅提升了心臟仿真系統(tǒng)的性能,還為更廣泛的醫(yī)學(xué)研究和臨床應(yīng)用提供了強有力的支持,標(biāo)志著心臟仿真技術(shù)的又一重大里程碑進(jìn)展。\u003c/p>\u003cp class=\"textAlignCenter detailPic\">\u003cimg class=\"empty_bg\" data-lazyload=\"https://x0.ifengimg.com/res/2024/0B6471109CAC33409CBFF1746CDAC6FF58184A24_size182_w1080_h608.png\" src=\"\" style=\" width: 640px; height: 360px;\" alt=\"圖注2:實時心臟計算概覽圖\" />\u003c/p>\u003cp class=\"textAlignCenter picIntro\">圖注2:實時心臟計算概覽圖\u003c/p>\u003cp>\u003cstrong>2.1 技術(shù)路線\u003c/strong>\u003c/p>\u003cp>在GPU的架構(gòu)設(shè)計中,順序訪問內(nèi)存(如連續(xù)的數(shù)據(jù)訪問)相較于隨機訪問具有更高的性能。此外,在執(zhí)行順序訪問時,通常會采用預(yù)取技術(shù)提前加載數(shù)據(jù),以進(jìn)一步提高訪問效率。\u003c/p>\u003cp>同時,在虛擬心臟模型中,大約有2/3的物理空間位置是空余腔體空間,有效心肌組織僅占1/3的物理空間。心臟仿真的主要計算和I/O操作都集中在對有效心肌組織中的每一個單細(xì)胞中的離子通道和細(xì)胞膜電位進(jìn)行時間上的精細(xì)更新,同時考慮鄰近細(xì)胞的電耦合影響。\u003c/p>\u003cp>基于GPU訪存特點和心臟解剖結(jié)構(gòu)的特殊性,我們設(shè)計了適合稀疏數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。利用順序訪存提升I/O速度,確保并行線程僅處理有效細(xì)胞,從而最大限度地提高GPU內(nèi)存的利用率。通過這種創(chuàng)新的結(jié)構(gòu),顯著優(yōu)化了計算性能,使得心臟仿真能夠在IO訪存上達(dá)到最優(yōu)效果。\u003c/p>\u003cp class=\"detailPic\">\u003cimg class=\"empty_bg\" data-lazyload=\"https://x0.ifengimg.com/res/2024/A3F3DC6FC51F7CC2B45B1390088D92DBBA47D89E_size281_w1080_h608.png\" src=\"\" style=\" width: 640px; height: 360px;\" alt=\"圖注3:心臟模型有效數(shù)據(jù)在GPU內(nèi)存上的排布\" />\u003c/p>\u003cp class=\"textAlignCenter picIntro\">圖注3:心臟模型有效數(shù)據(jù)在GPU內(nèi)存上的排布\u003c/p>\u003cp>在計算層面,采用量化策略,有效簡化模型中的對數(shù)和指數(shù)等復(fù)雜計算,從而顯著降低了計算復(fù)雜度。\u003c/p>\u003cp>此外,為進(jìn)一步減少I/O操作次數(shù),采用循環(huán)展開策略,實現(xiàn)在一次讀取中進(jìn)行多次計算,大大降低I/O,顯著提升SM核心的計算利用率。\u003c/p>\u003cp>基于A100平臺,我們設(shè)計了高效的P2P通訊方式,利用GPU直連實現(xiàn)在節(jié)點內(nèi)快速的數(shù)據(jù)交換,確保數(shù)據(jù)傳輸?shù)牡脱舆t與高帶寬。在節(jié)點之間,采用RDMA(遠(yuǎn)程直接內(nèi)存訪問),進(jìn)一步增強跨節(jié)點數(shù)據(jù)傳輸?shù)男剩浞职l(fā)揮硬件平臺的并行計算與通訊能力。\u003c/p>\u003cp>\u003cimg class=\"empty_bg\" data-lazyload=\"https://x0.ifengimg.com/res/2024/445BA1EE72613BE69C526B46778FDACC70E65848_size174_w1080_h584.png\" src=\"\" style=\" width: 640px; height: 346px;\" />\u003c/p>\u003cp class=\"textAlignCenter\">圖注4:技術(shù)路線圖\u003c/p>\u003cp>\u003cstrong>2.2 仿真結(jié)果\u003c/strong>\u003c/p>\u003cp>我們測試了不同優(yōu)化策略對仿真2生物秒心臟功能所用計算時間的影響,結(jié)果如下圖所示。對2生物秒心臟功能的模擬,基準(zhǔn)模型在未優(yōu)化的情況下A100單卡需要計算時間為304.25秒。在采用分布式、量化、循環(huán)展開策略后,其所用時間分別是9.75、3.93、1.68秒。其中采用循環(huán)展開后,計算時間達(dá)到2秒內(nèi),達(dá)到計算時間/生物比小于1,實現(xiàn)實時/超實時計算的要求。其中,分布式計算對于系統(tǒng)仿真速度影響最大,達(dá)到了32倍提速。量化策略和循環(huán)展開策略分別將仿真速度提升了2.48和2.34倍。在同時采用分布式、量化、循環(huán)展開策略的情況下,系統(tǒng)仿真速度整體提升了181倍。\u003c/p>\u003cp class=\"textAlignCenter detailPic\">\u003cimg class=\"empty_bg\" data-lazyload=\"https://x0.ifengimg.com/res/2024/27EFCB408C8731DBF26239B1DAB9E44F889959DC_size28_w612_h401.png\" src=\"\" style=\" width: 612px; height: 401px;\" alt=\"圖注5:不同優(yōu)化策略的計算時間\" />\u003c/p>\u003cp class=\"textAlignCenter picIntro\">圖注5:不同優(yōu)化策略的計算時間\u003c/p>\u003cp class=\"textAlignCenter detailPic\">\u003cimg class=\"empty_bg\" data-lazyload=\"https://x0.ifengimg.com/res/2024/21151F0F442F38A3AE01264920543F5D34F83990_size27_w612_h402.png\" src=\"\" style=\" width: 612px; height: 402px;\" alt=\"圖注6:不同優(yōu)化策略的速度提升\" />\u003c/p>\u003cp class=\"textAlignCenter picIntro\">圖注6:不同優(yōu)化策略的速度提升\u003c/p>\u003cp>\u003cstrong>2.2.1 拓展曲線\u003c/strong>\u003c/p>\u003cp class=\"textAlignCenter detailPic\">\u003cimg class=\"empty_bg\" data-lazyload=\"https://x0.ifengimg.com/res/2024/1BE02261040D980519CDA08A6A91D120C48063E6_size113_w1080_h703.png\" src=\"\" style=\" width: 640px; height: 416px;\" alt=\"圖注7:不同優(yōu)化策略的拓展曲線\" />\u003c/p>\u003cp class=\"textAlignCenter picIntro\">圖注7:不同優(yōu)化策略的拓展曲線\u003c/p>\u003cp>如圖7擴展曲線所示,隨著GPU卡數(shù)的增加,基準(zhǔn)模型和優(yōu)化后的模型仿真時間都在減少。基準(zhǔn)模型在增加到48卡后,計算時間不再減小。此時的生物:計算時間比為1:5。再采用量化和循環(huán)展開策略后,32張卡即可實現(xiàn)實時計算,生物:計算時間比達(dá)到1:0.84。\u003c/p>\u003cp>\u003cstrong>2.2.2 主要GPU指標(biāo)\u003c/strong>\u003c/p>\u003cp class=\"textAlignCenter\">\u003cimg class=\"empty_bg\" data-lazyload=\"https://x0.ifengimg.com/res/2024/D8434D4D9F145214AD9EA31587CAB20369F6DB0C_size56_w595_h410.png\" src=\"\" style=\" width: 595px; height: 410px;\" />\u003c/p>\u003cp class=\"textAlignCenter\">圖注8:不同優(yōu)化策略的計算密度和計算強度\u003c/p>\u003cp class=\"textAlignCenter detailPic\">\u003cimg class=\"empty_bg\" data-lazyload=\"https://x0.ifengimg.com/res/2024/4D0DF2B736AD4055D79C7AB2D64C06DE5A80CE20_size57_w626_h440.png\" src=\"\" style=\" width: 626px; height: 440px;\" alt=\"圖注9:不同優(yōu)化策略的內(nèi)存和SM利用率\" />\u003c/p>\u003cp class=\"textAlignCenter picIntro\">圖注9:不同優(yōu)化策略的內(nèi)存和SM利用率\u003c/p>\u003cp>通過GPU指標(biāo)可以看出(圖8,圖9)量化策略通過提升IO同時降低計算的方式提高整體計算性能;循環(huán)展開通過大幅度降低I/O同時提高計算密度的方式提高計算性能。\u003c/p>\u003cp>\u003cstrong>2.2.3 計算精度\u003c/strong>\u003c/p>\u003cp>我們統(tǒng)計了加速前與加速后的結(jié)果誤差,仿真的膜電位V的時程差別<2 ms (0.6%),模電位平均誤差為0.72mV(0.4%),均滿足生理準(zhǔn)確度要求。優(yōu)化前后主要離子通道的仿真曲線吻合(如圖10所示)。\u003c/p>\u003cp class=\"detailPic\">\u003cimg class=\"empty_bg\" data-lazyload=\"https://x0.ifengimg.com/res/2024/1A1ECAB6B7DA889FD2C506231266AF39BF45B135_size113_w1080_h534.png\" src=\"\" style=\" width: 640px; height: 316px;\" alt=\"圖注10:仿真前后細(xì)胞主要離子通道電流與胞內(nèi)離子濃度在一心律節(jié)拍間的變化\" />\u003c/p>\u003cp class=\"textAlignCenter picIntro\">圖注10:仿真前后細(xì)胞主要離子通道電流與胞內(nèi)離子濃度在一心律節(jié)拍間的變化\u003c/p>\u003cp>\u003cstrong>3\u003c/strong>\u003c/p>\u003cp>\u003cstrong>總結(jié)\u003c/strong>\u003c/p>\u003cp>智源研究院從心臟模型的解剖結(jié)構(gòu)、心肌細(xì)胞電生理的計算特點及計算系統(tǒng)的硬件架構(gòu)出發(fā),設(shè)計了\u003cstrong>心臟仿真系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)和優(yōu)化策略\u003c/strong>,以提高計算效率。我們采用先進(jìn)的并行處理方法,充分利用現(xiàn)代GPU設(shè)備的強大計算能力,優(yōu)化數(shù)據(jù)傳輸和通訊方式,以減少延遲并提高數(shù)據(jù)吞吐量。通過這些策略,不僅提升了仿真系統(tǒng)的計算速度,還保證了在可接受誤差范圍內(nèi)的計算精度,最終成功實現(xiàn)了心臟仿真的實時計算目標(biāo),達(dá)到超實時計算結(jié)果。這一成果為進(jìn)一步研究心律失常產(chǎn)生的離子通道與分子機制等關(guān)鍵醫(yī)學(xué)問題,也為手術(shù)規(guī)劃如房顫射頻消融方案等臨床應(yīng)用,以及新藥研發(fā)與其心臟安全性篩選奠定了堅實基礎(chǔ),同時也為其它超大復(fù)雜物理系統(tǒng)的實時仿真提供堅實基礎(chǔ)。\u003c/p>","type":"text"}],"currentPage":0,"pageSize":1},"editorName":"于雷","editorCode":"PT032","faceUrl":"","vestAccountDetail":{},"subscribe":{"cateid":"智源研究院","type":"source","catename":"智源研究院","description":"","cateSource":"","backgroud":"http://p1.ifengimg.com/ifengimcp/pic/20160919/d236177a15798b010c4c_size104_w720_h186.png","api":"http://api.iclient.ifeng.com/api_wemedia_list?type=source&keyword=%E6%99%BA%E6%BA%90%E7%A0%94%E7%A9%B6%E9%99%A2","originalName":"","redirectTab":"article","newsTime":"2024-11-28 10:01:06","authorUrl":"http://mp.weixin.qq.com/s?__biz=MzI2MDcxMzQzOA==&mid=2247546575&idx=1&sn=f1120f6ea59417bab00c2d1e13909728&chksm=eb682034c3010cea7597c611b549b21bca592f2ba52d6a93c277b7b82af3517d1c36d7405a0b&mpshare=1&scene=1&srcid=1128GtR8g3EG0cHzqcDNTnWq&sharer_shareinfo=90990d382ab0452dc83f06ad146c580d&sharer_shareinfo_first=90990d382ab0452dc83f06ad146c580d#rd"}},"keywords":"心臟,生理,模型,策略,細(xì)胞,實時,病理,尺度,內(nèi)存,智源","safeLevel":0,"isCloseAlgRec":false,"interact":{"isCloseShare":false,"isCloseLike":false,"isOpenCandle":false,"isOpenpray":false},"hasCopyRight":false,"sourceReason":"公開信息"}; var adKeys = ["adHead","adBody","topAd","logoAd","topicAd","contentAd","articleBottomAd","infoAd","hardAd","serviceAd","contentBottomAd","commentAd","commentBottomAd","articleAd","videoAd","asideAd1","asideAd2","asideAd3","asideAd4","asideAd5","asideAd6","bottomAd","floatAd1","floatAd2"]; var __apiReport = (Math.random() > 0.99); var __apiReportMaxCount = 50; for (var i = 0,len = adKeys.length; i

杭州吐腿建材有限公司

中國自研“數(shù)字心臟”:仿真速度提升180倍

中國自研“數(shù)字心臟”:仿真速度提升180倍

心臟,作為重要器官之一,其功能正常與否直接影響人類的生命延續(xù)。電生理特性反映了心臟的健康和疾病狀態(tài)。心臟電生理活動的異常,往往會導(dǎo)致心律失常,從而引至心臟泵血功能衰竭等嚴(yán)重健康問題。因此,深入理解和研究心臟的電生理過程,對于提高心臟病的診斷和治療水平至關(guān)重要。

傳統(tǒng)的心臟電生理研究多依賴于實驗室內(nèi)的動物模型和臨床數(shù)據(jù),但這類方法往往受限于倫理問題、實驗條件和數(shù)據(jù)獲取的復(fù)雜性。隨著計算技術(shù)的發(fā)展,計算機仿真成為了一種新興且強大的研究工具。通過建立數(shù)學(xué)模型和計算機程序,研究人員可構(gòu)建數(shù)字孿生心臟,能夠在虛擬環(huán)境中仿真并重現(xiàn)心臟器官的電生理活動(虛擬生理心臟),分析其動態(tài)特性,并進(jìn)行不同生理與病理條件下的實驗。

虛擬心臟電生理仿真對計算資源要求極高,即使是幾毫秒的仿真,也需要累積求解數(shù)十億次微分方程。使用復(fù)雜的虛擬心臟模型進(jìn)行研究時,重現(xiàn)1秒鐘的心臟電活動也可能需要數(shù)小時或更長。這給虛擬生理心臟的臨床應(yīng)用與藥物研發(fā)帶來重大挑戰(zhàn)。

為解決這一問題,智源研究院開發(fā)了一套實時心臟電生理仿真系統(tǒng)。該系統(tǒng)不僅能夠實時模擬心臟的3D電活動,還能通過多種參數(shù)的調(diào)節(jié),深入探討不同生理、病理因素對心臟功能的影響

這一實時心臟仿真平臺,一方面可在醫(yī)學(xué)基礎(chǔ)研究領(lǐng)域發(fā)揮作用,幫助臨床醫(yī)生和研究人員更直觀地理解心臟的電生理過程,探究心律失常產(chǎn)生機制、預(yù)測猝死發(fā)生率等;另一方面,可用于構(gòu)建虛擬藥物安全性評估平臺,對推動藥物安全評估發(fā)展具有重要意義;更重要的是,可以在臨床應(yīng)用中提供手術(shù)方案預(yù)演與決策支持,比如射頻消融方案規(guī)劃,心臟起搏器最佳植入方案規(guī)劃等。該技術(shù)的推進(jìn)將為醫(yī)學(xué)研究和臨床治療提供新的范式。

1

虛擬心臟仿真發(fā)展史

虛擬生理心臟的構(gòu)建可利用生理組學(xué)的研究方法,綜合分子生物學(xué)、生物化學(xué)、生理學(xué)、解剖學(xué)及臨床醫(yī)學(xué)的最新成果,數(shù)學(xué)化以及模式化地整合從基因、蛋白質(zhì)、細(xì)胞、組織到器官的解剖(多物理尺度:空間尺度跨越10^9量級,跨時間尺度:時間尺度跨越10^15量級,如圖1所示)、生理和生化信息,應(yīng)用計算機強有力的計算和圖形顯示能力,通過賦予其心臟所具有的動力學(xué)特性、生化特性和各種生理病理特點,使之從形態(tài)、結(jié)構(gòu)和功能等方面逼真地再現(xiàn)心臟的生理和病理活動過程。

圖注1:構(gòu)建虛擬生化生理人體的時間和空間尺度。時間尺度橫跨由分子事件(µs)、細(xì)胞信號傳導(dǎo)(ms)、細(xì)胞功能(s)到人體壽命 (decades) 的10^15跨度。空間尺度橫跨由分子(nm)、細(xì)胞(µm)、器官(cm)到軀干 (m) 的10^9跨越。

圖注1:構(gòu)建虛擬生化生理人體的時間和空間尺度。時間尺度橫跨由分子事件(µs)、細(xì)胞信號傳導(dǎo)(ms)、細(xì)胞功能(s)到人體壽命 (decades) 的10^15跨度。空間尺度橫跨由分子(nm)、細(xì)胞(µm)、器官(cm)到軀干 (m) 的10^9跨越。

虛擬生理心臟研究可追溯與上世紀(jì)五十年代。1952年諾貝爾獎得主Hodgkin和Huxley建立了世界上第一個細(xì)胞計算模型 — 烏賊神經(jīng)元細(xì)胞模型[1],開創(chuàng)了用計算模型研究生物問題的先河。1960年Denis Noble[2]在Nature雜志上發(fā)表了第一個心肌細(xì)胞計算模型 — 浦肯野心肌細(xì)胞模型,開創(chuàng)虛擬生理心臟模型的先例。此后幾十年的研究中,不斷有研究人員研發(fā)針對不同物種、心臟不同組織、復(fù)雜精密的心肌細(xì)胞電生理模型[3]。1991年,Peter Hunter等人[4]基于犬實驗數(shù)據(jù)構(gòu)建了第一個心臟解剖結(jié)構(gòu)模型,融合多物理尺度與電生理的虛擬心臟模型研究進(jìn)入新階段。此后,多尺度、多物理模態(tài)的心臟計算模型陸續(xù)出現(xiàn),并被成功應(yīng)用于心臟功能研究與藥物安全性評估[5-8]。

在早期虛擬生理心臟研究中,心臟一個生物秒的電生理活動往往需要數(shù)日甚至數(shù)月來仿真計算。隨著顯存技術(shù)的發(fā)展,這個時間縮短到數(shù)天。近年,有研究致力于提升虛擬生理心臟的計算速度。比如通過將三維心臟空間劃分為矩形子區(qū)域來實現(xiàn)并行心臟模擬[9],使運算速度大大提升。另一項研究通過WebGL將高性能心臟模擬擴展到普通計算機上[10],甚至有GPU的手機也可以模擬三維心室的電動態(tài)。一些研究試圖通過自適應(yīng)時間步長來提高運行速度[11,12],結(jié)果表明,固定時間步長比自適應(yīng)時間步長方法具有更好的效率[11]。

但這些研究僅能達(dá)到“準(zhǔn)實時運算”,離真正意義上的“實時運算”,即仿真時間與生物時間比達(dá)到1:1,還有難以逾越的距離,更不用說仿真精度的提升帶來的運算量爆炸式增長。高計算復(fù)雜度帶來的海量運算,使得虛擬生理心臟模型難以實現(xiàn)實時計算,阻礙其大規(guī)模應(yīng)用。

2

實時計算

為了在更高分辨率、更高精度和更大規(guī)模的心臟模型上實現(xiàn)實時仿真,智源研究院開發(fā)了具有精細(xì)細(xì)胞電生理與解剖結(jié)構(gòu)的人心室模型。該模型包含了19種細(xì)胞生理狀態(tài)變量和70多個公式,能夠實現(xiàn)復(fù)雜的心臟電生理與病理仿真,為臨床與醫(yī)藥工業(yè)應(yīng)用提供豐富的場景。

為實現(xiàn)實時計算,智源對模型底層計算進(jìn)行了深度優(yōu)化。針對心臟仿真中計算強度大和I/O密集等瓶頸問題,智源充分結(jié)合A100平臺的硬件特點,設(shè)計了多種優(yōu)化策略,如量化和循環(huán)展開。這些措施有效降低了計算復(fù)雜度和I/O,使得在更大規(guī)模和更高復(fù)雜度的心臟模型上實現(xiàn)了180倍的速度提升。

最終,智源虛擬心臟仿真系統(tǒng)實現(xiàn)了對心臟電生理功能的實時仿真,達(dá)到生物時間與計算時間比為1:0.84。這一成果不僅提升了心臟仿真系統(tǒng)的性能,還為更廣泛的醫(yī)學(xué)研究和臨床應(yīng)用提供了強有力的支持,標(biāo)志著心臟仿真技術(shù)的又一重大里程碑進(jìn)展。

圖注2:實時心臟計算概覽圖

圖注2:實時心臟計算概覽圖

2.1 技術(shù)路線

在GPU的架構(gòu)設(shè)計中,順序訪問內(nèi)存(如連續(xù)的數(shù)據(jù)訪問)相較于隨機訪問具有更高的性能。此外,在執(zhí)行順序訪問時,通常會采用預(yù)取技術(shù)提前加載數(shù)據(jù),以進(jìn)一步提高訪問效率。

同時,在虛擬心臟模型中,大約有2/3的物理空間位置是空余腔體空間,有效心肌組織僅占1/3的物理空間。心臟仿真的主要計算和I/O操作都集中在對有效心肌組織中的每一個單細(xì)胞中的離子通道和細(xì)胞膜電位進(jìn)行時間上的精細(xì)更新,同時考慮鄰近細(xì)胞的電耦合影響。

基于GPU訪存特點和心臟解剖結(jié)構(gòu)的特殊性,我們設(shè)計了適合稀疏數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。利用順序訪存提升I/O速度,確保并行線程僅處理有效細(xì)胞,從而最大限度地提高GPU內(nèi)存的利用率。通過這種創(chuàng)新的結(jié)構(gòu),顯著優(yōu)化了計算性能,使得心臟仿真能夠在IO訪存上達(dá)到最優(yōu)效果。

圖注3:心臟模型有效數(shù)據(jù)在GPU內(nèi)存上的排布

圖注3:心臟模型有效數(shù)據(jù)在GPU內(nèi)存上的排布

在計算層面,采用量化策略,有效簡化模型中的對數(shù)和指數(shù)等復(fù)雜計算,從而顯著降低了計算復(fù)雜度。

此外,為進(jìn)一步減少I/O操作次數(shù),采用循環(huán)展開策略,實現(xiàn)在一次讀取中進(jìn)行多次計算,大大降低I/O,顯著提升SM核心的計算利用率。

基于A100平臺,我們設(shè)計了高效的P2P通訊方式,利用GPU直連實現(xiàn)在節(jié)點內(nèi)快速的數(shù)據(jù)交換,確保數(shù)據(jù)傳輸?shù)牡脱舆t與高帶寬。在節(jié)點之間,采用RDMA(遠(yuǎn)程直接內(nèi)存訪問),進(jìn)一步增強跨節(jié)點數(shù)據(jù)傳輸?shù)男剩浞职l(fā)揮硬件平臺的并行計算與通訊能力。

圖注4:技術(shù)路線圖

2.2 仿真結(jié)果

我們測試了不同優(yōu)化策略對仿真2生物秒心臟功能所用計算時間的影響,結(jié)果如下圖所示。對2生物秒心臟功能的模擬,基準(zhǔn)模型在未優(yōu)化的情況下A100單卡需要計算時間為304.25秒。在采用分布式、量化、循環(huán)展開策略后,其所用時間分別是9.75、3.93、1.68秒。其中采用循環(huán)展開后,計算時間達(dá)到2秒內(nèi),達(dá)到計算時間/生物比小于1,實現(xiàn)實時/超實時計算的要求。其中,分布式計算對于系統(tǒng)仿真速度影響最大,達(dá)到了32倍提速。量化策略和循環(huán)展開策略分別將仿真速度提升了2.48和2.34倍。在同時采用分布式、量化、循環(huán)展開策略的情況下,系統(tǒng)仿真速度整體提升了181倍。

圖注5:不同優(yōu)化策略的計算時間

圖注5:不同優(yōu)化策略的計算時間

圖注6:不同優(yōu)化策略的速度提升

圖注6:不同優(yōu)化策略的速度提升

2.2.1 拓展曲線

圖注7:不同優(yōu)化策略的拓展曲線

圖注7:不同優(yōu)化策略的拓展曲線

如圖7擴展曲線所示,隨著GPU卡數(shù)的增加,基準(zhǔn)模型和優(yōu)化后的模型仿真時間都在減少。基準(zhǔn)模型在增加到48卡后,計算時間不再減小。此時的生物:計算時間比為1:5。再采用量化和循環(huán)展開策略后,32張卡即可實現(xiàn)實時計算,生物:計算時間比達(dá)到1:0.84。

2.2.2 主要GPU指標(biāo)

圖注8:不同優(yōu)化策略的計算密度和計算強度

圖注9:不同優(yōu)化策略的內(nèi)存和SM利用率

圖注9:不同優(yōu)化策略的內(nèi)存和SM利用率

通過GPU指標(biāo)可以看出(圖8,圖9)量化策略通過提升IO同時降低計算的方式提高整體計算性能;循環(huán)展開通過大幅度降低I/O同時提高計算密度的方式提高計算性能。

2.2.3 計算精度

我們統(tǒng)計了加速前與加速后的結(jié)果誤差,仿真的膜電位V的時程差別<2 ms (0.6%),模電位平均誤差為0.72mV(0.4%),均滿足生理準(zhǔn)確度要求。優(yōu)化前后主要離子通道的仿真曲線吻合(如圖10所示)。

圖注10:仿真前后細(xì)胞主要離子通道電流與胞內(nèi)離子濃度在一心律節(jié)拍間的變化

圖注10:仿真前后細(xì)胞主要離子通道電流與胞內(nèi)離子濃度在一心律節(jié)拍間的變化

3

總結(jié)

智源研究院從心臟模型的解剖結(jié)構(gòu)、心肌細(xì)胞電生理的計算特點及計算系統(tǒng)的硬件架構(gòu)出發(fā),設(shè)計了心臟仿真系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)和優(yōu)化策略,以提高計算效率。我們采用先進(jìn)的并行處理方法,充分利用現(xiàn)代GPU設(shè)備的強大計算能力,優(yōu)化數(shù)據(jù)傳輸和通訊方式,以減少延遲并提高數(shù)據(jù)吞吐量。通過這些策略,不僅提升了仿真系統(tǒng)的計算速度,還保證了在可接受誤差范圍內(nèi)的計算精度,最終成功實現(xiàn)了心臟仿真的實時計算目標(biāo),達(dá)到超實時計算結(jié)果。這一成果為進(jìn)一步研究心律失常產(chǎn)生的離子通道與分子機制等關(guān)鍵醫(yī)學(xué)問題,也為手術(shù)規(guī)劃如房顫射頻消融方案等臨床應(yīng)用,以及新藥研發(fā)與其心臟安全性篩選奠定了堅實基礎(chǔ),同時也為其它超大復(fù)雜物理系統(tǒng)的實時仿真提供堅實基礎(chǔ)。

親愛的鳳凰網(wǎng)用戶:

您當(dāng)前使用的瀏覽器版本過低,導(dǎo)致網(wǎng)站不能正常訪問,建議升級瀏覽器

第三方瀏覽器推薦:

谷歌(Chrome)瀏覽器 下載

360安全瀏覽器 下載

百家乐佣金计算| 百家乐视频小游戏| 万达百家乐娱乐城| 百家乐官网百战百胜| 香港六合彩资料大全| 澳门百家乐的公式| 百家乐官网包台| 大发888娱乐城df888| 百家乐视频美女| 电子百家乐官网博彩正网| 大发888棋牌游戏下载| 大发888在线娱乐游戏| 疯狂百家乐官网游戏| 在线百家乐官网官方网| 本溪亿酷棋牌下载| 百家乐正式版| 百家乐投注方法新版| 百家乐官网完美一对| 百家乐官网庄闲机率分析| 网上澳门| 大发888下载亚洲城| 678百家乐博彩赌场娱乐网规则 | 易发国际娱乐场| 百家乐追号| 百家乐娱乐网备用网址| 百家乐官网暗红色桌布| 百家乐官网电子作弊器| 金臂百家乐| 万盛区| 立博博彩| 58娱乐城开户| 百家乐庄闲出现几| 百家乐套装| 百家乐赌场策略大全| 百家乐作弊知识| 玩百家乐出千方法| 城口县| 百家乐官网金币游戏| 百家乐官网国际娱乐城| 百家乐官网如何投注| 翼城县|