正文

疫情防控:數(shù)據(jù)科學(xué)助力了解傳染病特性、規(guī)律及控制策略

admin

每當(dāng)你開啟疫情通報(bào),去注視那個(gè)數(shù)字之際,可曾思索過其背后隱匿著多少我們?nèi)粺o法瞧見的戰(zhàn)爭(zhēng)呢?數(shù)據(jù)科學(xué),絕非僅僅是將確診人數(shù)繪制成一張柱狀圖這般輕易——它是在病毒尚未吐露言辭以前,就強(qiáng)行追問出它的傳染途徑、致命弱點(diǎn),甚至預(yù)先推導(dǎo)出哪一道防線最為有效。

從一口水井到統(tǒng)計(jì)學(xué)革命

倫敦蘇豪區(qū)在1854年的時(shí)候,沒有人去在意霍亂致使多少人死亡,僅僅是覺得空氣不夠潔凈罷了。然而約翰·斯諾醫(yī)生卻并非如此認(rèn)為。他挨著一家又一家去敲死亡患者以及健康居民的家門 ,對(duì)他們的水源 、住房 、還有收入水平進(jìn)行對(duì)比。他沒有顯微鏡 ,但卻擁有一張手繪的地圖以及幾百份訪談?dòng)涗洝?/p>

他察覺到了分水嶺,死者基本上全都采用寬街水泵的水,活人卻并不使用。存在兩組人群,唯一的不同之處便是那一口水井。這種于統(tǒng)計(jì)學(xué)里被稱作“假設(shè)檢驗(yàn)”的方法,使得流行病學(xué)首次擁有了精準(zhǔn)的目標(biāo)。現(xiàn)今我們借助大數(shù)據(jù)去追蹤新冠傳播鏈,所做的仍舊是斯諾醫(yī)生160年前做的那件事情,即尋找差異,確定因果關(guān)系。

從3300個(gè)出境者反推整座城

在2020年剛開始的時(shí)候,也就是武漢封城那一刻的前夕,每一天都存在著3300人朝著境外飛去??茖W(xué)家們把這些前往境外的人當(dāng)做了采取隨機(jī)抽樣形式選取出來的樣本,其患病的周期時(shí)間是10天。所以總體的樣本框數(shù)量是33000人。在這些人員里,出現(xiàn)了7個(gè)人被確診。7除以3300,之后再乘上10,最終得出了一個(gè)感染概率。

沿著這個(gè)概率朝著相反方向進(jìn)行推算,武漢的感染人數(shù)便清晰地顯現(xiàn)出來了。這個(gè)數(shù)字于當(dāng)時(shí)引發(fā)了極大的爭(zhēng)議,原因在于其并非官方所通報(bào)的內(nèi)容,然而卻與后來血清學(xué)調(diào)查的結(jié)果極為相近。它并不精準(zhǔn),不過卻具備統(tǒng)計(jì)學(xué)方面的意義,它向我們表明,在大規(guī)模檢測(cè)開始啟動(dòng)之前,病毒早已廣泛傳播開來了。

三個(gè)人群一臺(tái)戲

所有的流行病模型,無論其復(fù)雜程度如何,核心都在于三撥人即易感者、傳染者、移除者,易感者數(shù)量的增減情況是怎樣的,傳染者增長速度是快還是慢,移除者究竟是已然痊愈還是被實(shí)施了隔離措施 ,這三股力量呈現(xiàn)出此消彼長的態(tài)勢(shì),進(jìn)而決定疫情到底是被壓制住還是爆發(fā)開來。

SIR模型針對(duì)這三群人的流動(dòng)情況進(jìn)行分量確定,比方說方艙醫(yī)院的實(shí)質(zhì),是將傳染者快速歸到”移除者“范疇,并非由于他們都康復(fù)了,而是他們不再具有傳染他人的能力,隔離同樣是一種治愈方式,是對(duì)社會(huì)的一種治愈。

恢復(fù)速率是道算術(shù)題

感染者康復(fù),或者被隔離,在此轉(zhuǎn)化過程當(dāng)中所呈現(xiàn)的速度,被稱作恢復(fù)速率。它并非是一個(gè)生物學(xué)常數(shù),而是與政策執(zhí)行能力直接存在掛鉤關(guān)系。每早一天實(shí)現(xiàn)發(fā)現(xiàn),早一天達(dá)成隔離,早一天運(yùn)用上有效療法,如此一來這個(gè)速率則會(huì)快上一截。

武漢在建設(shè)方艙醫(yī)院那兩周期間,恢復(fù)的速率顯著地被拉升起來了。然而部分國家在后來出現(xiàn)了疫情反復(fù)的情況,這并非是由于病毒變得更強(qiáng)了,而是因?yàn)闄z測(cè)根本排不上隊(duì),隔離也執(zhí)行不下去,致使感染者長時(shí)間滯留在社會(huì)當(dāng)中進(jìn)而繼續(xù)傳播。恢復(fù)的速率較為緩慢,疫情的曲線也就無法被壓平。

R0不是病毒發(fā)的畢業(yè)證

感染人數(shù)平均到個(gè)體,所得到的那個(gè)數(shù)字,便是R0。這個(gè)數(shù)字并非病毒一開始就設(shè)定好的,而是由三個(gè)變量相乘得來:傳播的概率,接觸的比率,還有感染的時(shí)期。傳播概率是關(guān)于病毒自身方面的情況,接觸率是和社會(huì)行為相關(guān)的情況,感染期則是跟醫(yī)療干預(yù)關(guān)聯(lián)的情況。

因此,對(duì)武漢進(jìn)行封城,削減的是接觸率,興建方艙醫(yī)院,降低的是感染期,然而病毒發(fā)生變異致使傳播概率升高,于是我們通過接種疫苗來扳回這一局面。R0超過1并不一定就會(huì)失控,下降到1以下也不一定就能安穩(wěn)。它僅僅是一個(gè)動(dòng)態(tài)的開關(guān),關(guān)鍵在于看我們處于哪一種情形。

用數(shù)字模擬一場(chǎng)還沒發(fā)生的風(fēng)暴

曾在2018年時(shí),BBC實(shí)施了一項(xiàng)項(xiàng)目,借由真實(shí)的手機(jī)定位數(shù)據(jù)以及人際交互記錄,對(duì)1918年西班牙大流感予以反演,他們并非靜候疫情出現(xiàn),而是徑直于模擬環(huán)境當(dāng)中去推演封城、停課、戴口罩所產(chǎn)生的效果,其結(jié)果與真實(shí)歷史極為吻合。

這就是數(shù)據(jù)科學(xué)最為硬核的那一面,它并非“事后諸葛亮”,并非等到醫(yī)院人滿為患了才去分析傳播鏈,它能夠在一款新病毒尚只是實(shí)驗(yàn)室里的一段序列之際,就對(duì)其可能的傳播速度予以預(yù)測(cè),對(duì)哪種干預(yù)成本最低且見效最快進(jìn)行測(cè)試。中國具備全球最為密集的手機(jī)信令、消費(fèi)記錄、出行軌跡,這些數(shù)據(jù)倘若今天最大的用處僅僅是推送外賣,那就實(shí)在太可惜了。

可曾設(shè)想過,要是當(dāng)下就運(yùn)用城市層面的數(shù)據(jù)去跑一跑下一回大流感的模擬預(yù)案,究竟能提前察覺到多少漏洞呢?歡迎于評(píng)論區(qū)交流你的看法,還請(qǐng)將文章轉(zhuǎn)發(fā)給在意這座城市免疫力狀況的人喲。

疫情防控:數(shù)據(jù)科學(xué)助力了解傳染病特性、規(guī)律及控制策略