· 이론적 시뮬레이션

 

확진자 수 증가가 S자 커브 (로지스틱 모형)을 따른다고 가정하고, 그동안 일별 확진자 증가 데이터를 대입해서 모양을 추정하면 바이러스가 퇴치될 날짜를 예측할 수 있다. 

 

이 모형은 바이러스 확산이 초기에는 더디다가 어느 시점을 지나면 급속히 증가하고 절정을 지나면 다시 급격하게 사그라드는 형태를 표현하는 비선형 회귀 모형이다. 

 

코로나19 데이터 대입
메르스 데이터 대입시

1. 중국 확진자 수 데이터가 정확하고

2. 메르스와 전파양상이 같다

 

이 두가지 가정이 참이라면, 발생 후 약 60일이 되는 2020년 2월말~3월초에 코로나19 바이러스는 거의 종결된다 (2월 10일 데이터 기준). 그러나 중국과 한국의 감염대응 및 진단 수준은 다르기 때문에 꼭 이 모형대로 전개된다는 보장은 없다. 코로나19는 메르스보다 치사율은 낮지만 전파력은 훨씬 높은 것으로 알려져있다.

 

(2월21일~ 추가데이터)

중국 측 확진기준이 여러번 변경되면서 통계에 혼선이 오고 있다. 한국도 대구경북 확진자 수가 이상폭증하면서 비상사태로 변했다. 유럽에서는 이탈리아 확진자 수가 110명을 넘겼다. 이탈리아는 2월 1일 국가비상사태를 선포하고 중국을 오가는 모든 항공편을 금지하는 등 초기부터 가장 강력한 조치를 취했던 나라다.

 

* 한국 누적 확진자수 양상

~18일 : 총 31명

19일 : 51명 (+20)

20일 : 107명 (+56)

21일 : 204명 (+97)

22일 : 433명 (+229)

 

23일~24일이 고비로 보인다.

 

한국 예측그래프 (95% CI)

2월22일 forecast

 

24일, 보건당국은 경보단계를 '심각'으로 격상하고 대구 지역을 4주 내로 안정화시키겠다고 발표했다. 통제·지휘 체계도 사고수습본부에서 범정부 차원인 중앙재난안전대책본부로 격상된다. 바꿔 말하면 조기 수습은 물건너갔고 최소 3월까지는 간다는 뜻이다. 상황이 돌변한만큼 기존의 예측은 무의미해졌다.

 

같은날, JP모건은 ‘확산하는 코로나19: 감염의 정점과 증시 조정의 규모·기간’ 보고서에서 “JP모건 보험팀의 역학모델에 따르면 한국의 코로나19 사태는 3월 20일이 정점이고, 최대 감염자 수는 1만명에 달할 것”이라고 밝혔다. 이 수치는 대구 시민 240만 명 중 3%가 바이러스에 노출됐고, 중국과 비슷한 양상으로 2차 감염이 일어난다고 가정했을 때의 결과다. 그러나 한국이 중국과 비슷한 양상일지는 의문이다.

 

28일, 이탈리아 밀라노대 연구팀은 코로나19 병원체의 게놈정보 분석 결과, 초기 환자 1인당 2.6명이 전파되고, 감염자는 4일마다 두배 증가하는 것으로 추정했다. 일반 독감이 환자 1인당 1.2명 전파인 것을 감안하면 실로 무서운 전파력이다. 다만 전염 속도는 단계마다 달랐다고 연구팀은 밝혔다.

 

숙주인 동물에서 인간으로 전파되고 이후 인간 사이에 첫 전염이 이뤄지는 과정은 느렸지만, 작년 12월 인간 사이에서 확산할 때는 무서운 속도를 보였다는 것이다. 그 과정을 역으로 올라가면 느려서 알려지지 않았을뿐, 작년 11월 초순 즈음 이미 중국에서 전염된 것으로 보고 있다.

 

3월4일, 신천지 전수검사가 거의 끝나면서, 1일 신규 확진자 증가세가 한풀 꺾였다.

 

3월8일, 안심하기는 이르지만 1일 증가 추세가 꺾인 것은 확연히 보인다.

 

 

중국 사례를 참고한다면, 확진 억제까지 두달 정도가 소요되었다.

 

 

3월 9일, 드디어 누적 그래프에서 S자 큰 윤곽이 잡히기 시작했다. 이 모양대로면 총 누적은 9천명 전후로 예상된다. 

 

 

3월10일, 마크 핸들리 그래프

(영국 런던 UCL 컴퓨터공학과 교수)

 

마크 교수는 한국 제외 세계 주요국 "독일, 프랑스, 스페인, 미국, 스위스, 영국 등은 전부 9~14일 후에 이탈리아처럼 될 것"이라고 예상했다. 일본(빨간선)에 대해서는 "한 국가만 다른 국가와 다른 곡선을 보이고 있다"고 언급했다.

 

 

11일, 대한예방의학회 코로나19 대책위원장 기모란 교수는 '해외유입이 없고 새로운 집단감염이 없는' 단순 모델에서는 4월말 종식으로 계산되지만 세계 환자가 점점 많아지고 지역 집단감염이 터질 경우 장기화될 가능성이 크다고 말했다. 같은날, 독일 메르켈 총리는 기자회견에서 "전문가들에 따르면 인구의 60∼70%가 코로나바이러스에 의해 감염될 것"이라고 밝혔다. 상당히 충격적인 전망이다.

 

 

한국의 확진자는 9000명 선에서 통제될 것이라는 SIR모델 기반 예측이 나왔다. 이탈리아는 낙관적인 경우 5만, 비관적인 경우 10만으로 예상되고 있다. 한국은 집중발병기간을 지난 2월 26일부터 3월 8일까지 12일간으로 억제시킨 것이 주효했다.

 

 

19일, 김홍빈 교수는 지난 1~2주 수도권 확진자 수는 전혀 감소하지 않았다며 일종의 착시 효과라는 점을 지적했다. 대구쪽의 대량 확진이 완화되었을뿐 전체적인 상황은 나아지지 않았고 방심했다가는 바로 대규모 감염이 발생한다는 것이다. 결국 면역이 생기거나 치료제·백신이 개발되기 전까지는 사회적 거리두기를 유지하는 수밖에 없다. 질병관리본부 역시 코로나19가 장기화될 것을 예고했다.

 

미국 쿠오모 뉴욕주지사는 '상승곡선이 하나가 아닐 것'이라며 여러 차례의 파도, 봉우리를 보게 될 것이라고 말했다. 또한 5~6주 후인 5월초 정점에 달하여 그 시점에 11만개의 병상이 필요할 것으로 예상했다. 

 

 

3월 13일 기준 

세계의 코로나바이러스 전파양상

 

 

 

※ 로지스틱 (logistic) 모형이란

 

베르누이 시행은 앞이 나올 확률을 p, 뒤가 나올 확률을 (1-p)라 놓고 계속 독립시행하는 것을 말한다.

 

베르누이 확률변수 x 에 대해 

p와 (1-p)의 확률비 즉 성공/실패 (=odds) 로 나타낸 것을 f(p)라고 하자.

 

f(p) = p / (1-p) 

 

이 f(p)에 대해 말그대로 "log it" - 로그를 씌운 것을 logit, 로짓 함수라고 한다.

 

logit( f(x) ) = log( x/(1-x) )

 

앞뒤가 동일한 동전던지기라면 

p=0.5 가 되어 f(x) =1 이 된다. 

p=0.8 이라면 f(x) = 4 가 된다.

 

어떤 약을 투여했을때 치료될 확률이 0.8, 효과가 없을 확률이 0.2라면 odds= 4가 되는 것이다. 

 

로지스틱 함수란 이 logit 함수의 역함수를 가리킨다.

그래프 모양은 맨 위 그림과 같고 함수식으로는 다음의 식으로 표현된다.

logistic (t) = 1 / (1+exp(-t))  

 

proof)

x = log ( y / (1-y) )

exp(x) = y / (1-y)

exp(x) (1-y) = y

exp(x) - exp(x) y = y

exp(x) = (exp(x) + 1 ) y

y = exp(x) / (exp(x) + 1)

y = 1/ ( 1 + exp(-x) )

 

∴ logistic(t) = 1/ ( 1+ exp(-t) )

 

또는 g(t) = exp(t) / (exp(t) + 1)

 

t → ∞ : g(t) = 1

t -∞ : g(t) = 0

 

즉 g라는 함수는 모든 입력 t에 대해서 g(t) = [0,1] 값으로 변환-출력시켜주는 역할을 한다.

 

로짓 시그모이드 변환
직선 모형보다 곡선 로지스틱의 설명력이 높다

위에서 구한 g(t) = 1/ (1+exp(-t)) 에서

t를  "β와 다중변수 X=(x1, x2, ... )"의 식으로 치환한 것이다.

 

이때 관측 데이터를 입력해서 계수를 추정하면 S자 커브의 전체 모양을 그려낼 수 있다. 실제 적합모델을 구할때는 회귀 계수 β를 구할 수 있는 식이 존재하지 않으므로 수치해석 방법으로 구한다. 

 

Posted by 영애니멀
,