搜索
热搜: 体质 药证 方证
12
返回列表 发新帖
楼主: syzr

[其他] 大数据计算新冠肺炎中医疗效的探讨 (原创)

[复制链接]

31

主题

2626

积分

6332 小时

在线时间

硕士生

Rank: 5Rank: 5

积分
2626
 楼主| 发表于 2020-2-29 21:16:25 | 显示全部楼层

RE: 大数据计算新冠肺炎中医疗效的探讨 (原创)

coorus 发表于 2020-2-29 19:48
湖北治愈率的变化原因已经在上一个回帖中说明,它是由两个稳定值按不同比例组合成的,变化的是比例,不是 ...

您如果看懂了统计数据的趋势曲线,明白了它背后的原因,就不会说湖北的中后期的治愈率到达97%以上这样的话。这可以用以后的数据验证。您可以用以后任意一天的数据带入您的公式计算来验证。

您哪个混合比例的算法,虽有一点道理,但那个比例如果由您自己任意给定的话,那个公式的结果就难以让人接受了。

对治愈率的看法中有一点我们似乎一致。您所说的治愈率和我说的最终治愈率是同样的。其他的部分我们意见不相同。

统计学是现在普遍应用的一个学科,统计结果的意义不是你我凭自己的观点能够左右。对统计过程中的日治愈率,我们的理解和看法都不同,只能求同存异了。
回复 支持 反对

使用道具 举报

27

主题

6301

积分

9534 小时

在线时间

博士生

Rank: 6Rank: 6

积分
6301
发表于 2020-2-29 22:16:58 | 显示全部楼层

RE: 大数据计算新冠肺炎中医疗效的探讨 (原创)

本帖最后由 coorus 于 2020-2-29 22:18 编辑
syzr 发表于 2020-2-29 21:16
您如果看懂了统计数据的趋势曲线,明白了它背后的原因,就不会说湖北的中后期的治愈率到达97%以上这样的 ...

湖北中后期的真实治愈率,现在就能算出来,首先定一下前期和中后期的分界点(比如我在11楼的计算就是临时把回帖当日2月24日作为前期最后一天),然后把现在的治愈人数减去前期最后一天的治愈人数得到中后期的治愈人数,把现在的死亡人数减去前期最后一天的死亡人数得到中后期的死亡人数,就可以算出来了。
如果仍以2月24为前期最后一天,计算湖北中后期治愈率如下:
(28895-16738)/(28895-16738+2727-2495)=98.13%

好像您现在已经不提用官方治愈率比较各地疗效的事了,那就好,让有用无用的数据各走各道。

回复 支持 反对

使用道具 举报

31

主题

2626

积分

6332 小时

在线时间

硕士生

Rank: 5Rank: 5

积分
2626
 楼主| 发表于 2020-2-29 22:34:12 | 显示全部楼层

RE: 大数据计算新冠肺炎中医疗效的探讨 (原创)

本帖最后由 syzr 于 2020-2-29 23:49 编辑

要用统计数据来比较治疗方法的效率,就要理解统计数据背后的含义。新冠肺炎疫情期间所统计的病例发展过程可用下面几种情况来简单描述:

1  确认感染病毒 ==> 无症状 ==> 确认不传染 ==> 出院
2  确认感染病毒 ==>  轻症 ==>  确认不传染 ==> 出院
3  确认感染病毒 ==>  轻症 ==> 重症 ==> 轻症 ==>  确认不传染 ==> 出院
4  确认感染病毒 ==>  轻症 ==> 重症 ==> 死亡

确认感染病毒的人数就是确诊病例数。统计数据中有每天的新增值,还有统计期间的累计值,即确诊病例的累计值。

统计中,前三种情况都属于治愈,这三种情况的总和就是治愈病例数。统计数据中有每天的新增值,有统计期间的累计值,即治愈病例的累计值。累计的治愈病例在累计的确诊病例中所占比重就是治愈率。

第四种情况用来统计死亡病例,统计数据中有每天的增加值,有统计期间的累计值。累计的死亡病例在累计的确诊病例中所占比重就是病死率。

额外提一句,统计数据中还记录了重症病例。

从确认病毒感染到出院,是一个过程,需要一定的治疗时间。如要确定疗效,统计区间至少要包含一个治疗过程的时间。第三种情况所需时间,要比前两种情况长。因为统计期间,确定感染和出院的数字每天都在变化,时间短了说明不了问题。医学上常采用28天作为统计区间。本帖采用了两个统计区间,一个是28天;另一个大于28天,从统计起始日开始,到给定的统计日止。







回复 支持 反对

使用道具 举报

31

主题

2626

积分

6332 小时

在线时间

硕士生

Rank: 5Rank: 5

积分
2626
 楼主| 发表于 2020-2-29 23:55:43 | 显示全部楼层

RE: 大数据计算新冠肺炎中医疗效的探讨 (原创)

coorus 发表于 2020-2-29 22:16
湖北中后期的真实治愈率,现在就能算出来,首先定一下前期和中后期的分界点(比如我在11楼的计算就是临时 ...

很高兴,您也使用了统计区间概念。不过您的统计区间有点儿短。按我的观点,比一个治疗过程时间短的统计区间中的统计数据说明不了问题。用28天作为统计区间再试试。

我打算在比较各地的疗效前,先解释清楚统计数据背后的含义。


回复 支持 反对

使用道具 举报

27

主题

6301

积分

9534 小时

在线时间

博士生

Rank: 6Rank: 6

积分
6301
发表于 2020-3-1 12:19:16 | 显示全部楼层

RE: 大数据计算新冠肺炎中医疗效的探讨 (原创)

syzr 发表于 2020-2-29 22:34
要用统计数据来比较治疗方法的效率,就要理解统计数据背后的含义。新冠肺炎疫情期间所统计的病例发展过程可 ...

治愈率最好的算法是观察一批同时确诊并开始治疗的病人直到他们全部有结果(治愈或死亡),这个统计区间并不事先规定天数,只是等待结果,更不能纳入后来确诊的病例——这是最关键的一点,我在7楼提到的回形针PaperClip“关于新冠肺炎的一切”的视频中就提到过这种算法。我为何不认可钟南山的那个研究?因为它虽有统计区间,但违背了关键点,最后得出的数据也就只能呵呵了。当然,所有算法都要面对样本数量是否足够的问题,只要样本够,且排除原始数据本身的偏差(比如在湖北可能存在大量未统计到的病例),这个方法是最准确的。

而我没有采取这种算法的唯一原因是缺乏相关数据,难为无米之炊。昨天我查了一下网上别人对治愈率算法的看法,原来我的算法还有个名称,叫做卡普兰-迈耶法,不过这不重要,只要想明白自己算治愈率的目的是啥,就很容易看出官方算法纯属数据陷阱,您说要弄清楚其背后的含义,我早就发现了,就是无所指,我不知道它算出来的到底是啥~

回复 支持 反对

使用道具 举报

31

主题

2626

积分

6332 小时

在线时间

硕士生

Rank: 5Rank: 5

积分
2626
 楼主| 发表于 2020-3-2 04:01:17 | 显示全部楼层

RE: 大数据计算新冠肺炎中医疗效的探讨 (原创)

本帖最后由 syzr 于 2020-3-2 05:45 编辑
coorus 发表于 2020-3-1 12:19
治愈率最好的算法是观察一批同时确诊并开始治疗的病人直到他们全部有结果(治愈或死亡),这个统计区间并 ...

可惜流行病无法按您的设想在同一天产生病人,让您按理想的状态计算治愈率。

通过对新冠肺炎统计数据含义的描述,可以看出,这个统计学意义上的治愈率实际就是出院率。一个病人从确认感染入院,经过治疗,到确认不传染出院,一直在医院里占用医疗资源。在统计区间内,病人会不断的入院出院,所谓铁打的医院,流水的病人。如果入院的病人很多,出院的病人很少,很快就会出现医疗资源挤兑,就像武汉封城的前二十天那样,那就悲剧了。为了避免这种情况,公共卫生防疫系统第一个要做的事情就是减少感染的病人,隔离感染源就是最好的办法。而医疗系统要做的就是提高疗效,加快病人出院的速度,提高出院率,也就是官方计算的治愈率。

可以举一个例子来说明一下两种治愈率的不同。
如果在一个给定的统计区间内,例如28天,有两个医院,每个医院各收了100个病人。一个医院有五个病人出院,出院率5%。另一个医院有40个病人出院,出院率为40%。两个医院都没有死亡病人。用出院率(官方治愈率)比较,第二个医院的疗效高。

用您的治愈率计算方法(卡普兰-迈耶法),两个医院的治愈率都是100%,没有区别。

如果第一个医院无死亡病人,第二个医院有一个病人死亡。出院率没有变化。官方治愈率仍可以用来比较两个医院的疗效。统计的病死率为0.5%。这里可以看出,流行病统计中,治愈率和病死率是分开计算的。但在流行病结束时,治愈率和病死率的和为1,

用您的算法,第一个医院治愈率还是100%,第二个医院治愈率为 40/41。或者两者一同计算,治愈率为45/46。

到流行病结束时,两个算法得到的治愈率和病死率完全相同。








回复 支持 反对

使用道具 举报

27

主题

6301

积分

9534 小时

在线时间

博士生

Rank: 6Rank: 6

积分
6301
发表于 2020-3-2 11:26:40 | 显示全部楼层

RE: 大数据计算新冠肺炎中医疗效的探讨 (原创)

本帖最后由 coorus 于 2020-3-2 12:45 编辑
syzr 发表于 2020-3-2 04:01
可惜流行病无法按您的设想在同一天产生病人,让您按理想的状态计算治愈率。

通过对新冠肺炎统计数据含义 ...

流行病当然会在同一天产生大量病人,现实情况完全能满足计算要求,而且我们并不需要找出“同一天产生的病人”,只要找出“在某地同一天确诊的病人”就可以了,也就是官方公布的某地当日的新增确诊人数,现成的数据,问题是有没有去跟踪一系列这样的特定人群,把他们各自的结果及其分布状态记录下来,如果没有,也就无从算起。

在您举的例子中,每家医院的100个病人是陆续确诊和开始治疗的,选取样本这一步就已经走错了。假设一家医院前5天就收了100个病人,直到第28天都没有新病人,最后第28天出院40人;另一家医院前5天只收了10个病人,第18天到第22天每天收18个病人,最后第28天出院40人,按官方算法,“出院率”是一样的,但两家的治疗效率真的一样吗?明显是第二家的效率高很多,第一家能够打平它,靠的是运气,只要使用了正确的样本,一定能体现出第二家医院的优势,而官方的取样方法无法对这两家医院作出正确评价。

统计必须要有目的和相应的方法,不是为统计而统计,把累计治愈人数除以累计确诊人数,当然是最方便的,但这个数据不管是叫做“治愈率”也好,叫做您说的“出院率”也好,既无法反映治疗能力,也无法反映治疗效率,完全是一个不知所云的数据,可见计算者根本没有经过认真思考,太懒了,而您还要为之辩解,未免有些不值。




回复 支持 1 反对 0

使用道具 举报

31

主题

2626

积分

6332 小时

在线时间

硕士生

Rank: 5Rank: 5

积分
2626
 楼主| 发表于 2020-3-3 08:17:50 | 显示全部楼层

RE: 大数据计算新冠肺炎中医疗效的探讨 (原创)

本帖最后由 syzr 于 2020-3-3 08:49 编辑
coorus 发表于 2020-3-2 11:26
流行病当然会在同一天产生大量病人,现实情况完全能满足计算要求,而且我们并不需要找出“同一天产生的病 ...

流行病统计的第一个功能是记录数据。第二个功能是做数据处理,例如,计算各种比例,绘制各种曲线。没有这些统计数据和各种统计图表,就无法得知流行病的状况。想来您对统计的这两个功能也是认可的。

统计数据处理有各种公式,各有用途。例如我们讨论的两种治愈率,一个实际上是出院率,代表了医疗的效率,让人一眼就看出,有多少比例的患者出院了,还有多少比例的患者需要治疗。我们看到湖北外的治愈率达到了百分之八十,心里都舒了一口气。另一个考虑了死亡病例,代表了医疗的水平。正如您所说,是疾病的致死力和治疗能力的平衡点。

您对治愈率的批评,主要是对用它来比较医疗效率质疑。提出各种极端情况,指出在这种情况下比较无意义。您说的是对的,用出院率比较医疗效率不是在任何情况下都适用。如果我们将医院换成地点,例如比较江苏和山东的出院率,就不合适。因为山东头几天,刚因监狱感染新增数百确诊病例。但用湖南和河南比,就没有这个问题。


回复 支持 反对

使用道具 举报

31

主题

2626

积分

6332 小时

在线时间

硕士生

Rank: 5Rank: 5

积分
2626
 楼主| 发表于 2020-3-9 05:20:41 | 显示全部楼层
先存两个能用到的数据

2月19日下午3点,协和医院西院再传好消息,31名新冠肺炎重症患者在同一天出院。目前,协和西院累计收治患者1055名,累计出院145人。
https://mp.weixin.qq.com/s/Mc2-z6qU37hNL9JyWyz50Q

一个自己在家服西药的患者的病程,后进方舱医院,说中药过敏,未服中药
1月22日有症状,1月28日确诊轻症,2月2日退烧3天,以为好了,2月7日核酸检测,2月9日得知结果阳性,进隔离酒店,2月13日入方舱医院。2月18日还未出方舱。
https://mp.weixin.qq.com/s/y4LnGUfXXYGs9hf5p6IhOQ
回复 支持 反对

使用道具 举报

114

主题

4725

积分

2585 小时

在线时间

硕士生

腌老黑豆的脚后跟。

Rank: 5Rank: 5

积分
4725
QQ
发表于 2021-9-26 10:22:08 | 显示全部楼层
疫情办法出台后,发热的基本不看了,看也是电话上支个招,效果还是好的
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

捐助本站|小黑屋|手机版|经方医学论坛 ( 苏ICP备05020114号 )|网站地图

GMT+8, 2024-11-6 00:38 , Processed in 0.084412 second(s), 24 queries .

Powered by Discuz! X3.4

© 2004-2024 hhjfsl.com.