新冠肺炎患者数量增长模型分析 目前,对新型冠状病毒肺炎疫情的研究已经得到了一些结果,有必要对这些结果进行批判性的分析,本文中笔者将尝试对预测患者数量增长的模型做一些这方面的工作。 增长模型是通过严格的数学计算得到的,计算过程本身不是本文要讨论的。笔者要指出的是:建立数学模型所根据的事实即便再充分也是有限的,所以模型的适用范围也必然是有限的,给出这一范围很有必要;任何数学模型都是用很少的几个数量来描述复杂的现实世界,不可避免地带有明显的片面性,所以根据事实验证模型的准确性几乎和建立模型同样重要。 在文章[1](需翻墙)中笔者曾考虑建立患者数量增长的长期模型,粗略考虑了从今年1月23日到4月2日的情况。最终得到的结果也相当不确切,在各种增长模型中笔者不得不选择指数增长模型的回归分析结果,这一计算结果显示患者数量每天比前一天增长8%都不止。如果这一结果是准确的,那么没到8月患者数量就会超过全球人口,显然这一模型不适用于长期预测。 作为短期预测其准确度也不会太高:相关系数r=0.92030,其平方为0.847,并不算接近1。所以只能这样利用计算结果:“再过一周,当t=80(2020/4/9)时,根据指数回归分析的结果,估算可得患者数量约为170万,估计那时患者的实际数量不会超过这一数字。”[1]根据世界卫生组织的报告[2],2020年4月9日新型冠状病毒肺炎患者总数约为144万,笔者的估算结果作为上限大体上是可以接受的。 考虑到患者总数不会减少这一情况,要比较科学地检验结果的准确性,就应该拿预测患者增量同实际增量比较,而不是直接拿预测患者数量与实际数量比较。4月2日患者数量就差不多有90万了[2],笔者预测1周后患者会增加80万而实际上只增加了54万,笔者的预测结果比实际情况多了大约一半,实在是过于宽泛了。 为了比较准确地预测疫情发展,模型是一定要改进的。构建前面模型时用到的事实时间跨度超过两个月,这期间疫情的增长趋势发生了多次改变,把不同的趋势考虑在一起会带来很大的不确定性。模型涉及时间不宜过长,同样道理,模型用到的数据也不宜过多。更多的数据会带来更大的计算量和偶然性,使得规律更难以显现,结合疫情选取足够多的数据即可。 新冠肺炎的潜伏期常常为14天,考虑时间达到或超过14天才能在一定程度上反映出疫情的发展规律。考虑一个月左右的情况也可能是有必要的:潜伏期有时长达24天,但更长时间(比如四五十天)的追踪对建立以定量计算为目的的模型意义不大,因为追踪期间疫情的增长规律可能明显改变。 综合考虑上述情况以及数据的时效性和表达的简单程度,笔者决定通过研究4月1-15日的患者数量与时间的关系来把握疫情的发展趋势。世界卫生组织给出的报告[2]每个都很权威,为了贴近事实,在列入考虑的时间段里每一天的数据笔者都打算利用。数据整理如下表(报告的截止时间为对应日期欧洲中部时间上午10:00):
对4月日期(t)与新冠肺炎确诊人数(x)进行简单线性回归分析,可得:x=at+b(a为理论上的单日患者增量)=79005t+735942,相关系数r=0.99975。两者的简单线性相关度极高,相关系数的平方为0.9995,也就是说该模型可以解释新冠肺炎确诊人数变化的99.95%,理论上相当可靠。 |
E_mail: redchinacn@gmail.com
2010-2011http://redchinacn.net