SEER 数据库撤回所有 PSA 数据

2015-07-17 21:54 来源:丁香园 作者:月下荷花
字体大小
- | +

NCI 撤回了 SEER 和 SEER 医疗保险数据库中所有的 PSA 数据,因为质量控制检查时发现大量 PSA 数值不准确,用它们进行研究没有意义。

SEER 始于 1973 年,由法律规定强制收集癌症发生率和生存数据,数据来自美国 17 个肿瘤注册处,登记人口约占美国总人口的 28%。SEER 医疗保险数据库是用来连接 SEER 中的癌症信息与医保报销数据的。

在近期的 The Journal of Urology 杂志编者论中,美国泌尿肿瘤科教授 Penson 表示 SEER 数据库撤回 PSA 数据对前列腺癌的研究有重要影响,这让许多研究结果变得不可信。今后期刊将不会再刊登来自 SEER 数据库的 PSA 数据相关研究文章。

但最大的问题是那些已发表的、采用了有缺陷 PSA 数据的文献所造成的影响,例如比较前列腺癌手术与放疗效果时,如果采用 SEER 和 SEER 医疗保险数据库中的 PSA 数据进行患者配对比较,那么错误的 PSA 数据会带来什么影响呢?结果可想而知。

这件事情的发生应促使所有研究者思考应该怎样使用 SERR 数据库和其它大型数据库。大数据非常吸引人,这常让人忘记大数据也可能存在问题。如果研究者只是想知道 PSA 检查的数量,则仍可使用 SEER 或 SEER 医疗保险数据库,因为涉及到保险报销补偿,所以数据库中关于 PSA 检查数量的数据是准确的。

如果使用得当,大数据库可以揭示许多有价值的信息,但有时使用并不得当。从数据库中很容易获得大量的数据,比收集原始数据容易的多,也不需要花费太多,但应该知道各种大型数据库都有其自身目的,如果试图从中获取更多的资源,那么一定会遭受挫折,这才是要吸取的教训。

如果研究者们不是忙于从 SEER 这样的大型数据库中寻找问题答案,不是妄想获取发表文章的捷径,也许就不会走到今天这一步。研究者们非常依赖注册处收集的 PSA 信息,但很遗憾收集信息工作做的并不完善。

例如前列腺癌治疗后评价性功能障碍和尿失禁时,如果研究者也采用 SEER 医疗保险数据库中的数据,那么还会发生和 PSA 数据一样的事情 - 数据不准确,因为不是所有患者都愿意告诉医师他们存在性无能。

有一点需牢记,SEER 数据库并不是为了研究而设计的,而是主要用于政府监控癌症发生率和癌症结果,以决定资源如何分配,而 SEER 医疗保险数据库则是用于确保提供检查的机构能够得到相应的报销费用。

当然仍要保留这些大型数据库研究解决问题的功能,但必需是数据库能够回答的问题,不能让数据库解决其能力范围外的事情。如果研究者不能从数据库获取数据,就要努力收集原始数据。现在是研究者停止对大数据依赖的时候了。

哈弗医学院的 Garnick 博士称 NCI 此次的行为是值得鼓励的,表明了 NCI 确保数据库数据精准的决心。发现有缺陷的数据后立即撤回,虽然已经造成损害,但万幸损害并不大。因为许多研究中的 PSA 数据并非来自 SEER 数据库,而且医师会采用一致的 PSA 值来定义生化失败、治疗反应、检查标准以及其它。所以非 SEER 数据得来的结果很可能不会受影响。

将 PSA 数据撤回的决定是值得表扬的,同时其它大型数据库也应对信息录入情况进行自检并修正存在的缺陷。

查看信源地址

编辑: 王春红

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。