03版:第一届博鳌国际药械真实世界研究大会专刊
PDF版下载   
2022年12月14日

【第一届博鳌国际药械真实世界研究大会专刊】分论坛3 真实世界数据研究与信息技术

信息技术建设为数据研究筑牢根基

中国医药报 03版第一届博鳌国际药械真实世界研究大会专刊
2022年12月14日

□ 闫若瑜

“信息技术是真实世界数据研究的基础。离开了信息技术,真实世界研究将难以开展。” 北京大学第一医院医学统计室主任、海南省真实世界数据研究院副院长姚晨如是说。

12月8日,在第一届博鳌国际药械真实世界研究大会期间,作为平行论坛中唯一涉及医疗大数据信息处理的论坛,“真实世界研究与信息技术”论坛汇聚了众多国内外知名专家学者,共同探讨真实世界数据在信息技术领域的前沿发展和突破性成果。

大数据赋能智能诊疗

随着国内电子病历系统的广泛普及,数据记录从纸质转变为电子化,为利用信息手段获取临床研究数据奠定了基础。但由于疾病种类和治疗方案数量庞大,精准计算难以实现,健康医疗大数据深度分析和临床应用面临瓶颈。

中国科学院自动化研究所副总工程师张文生将目光瞄准了认知计算。认知计算是当今人工智能、机器学习应用于行业大数据分析的核心。在健康医疗大数据认知计算领域,张文生团队进行了大量实践,承接了科技创新2030—“新一代人工智能”重大专项“跨模态医疗分析推理技术与系统”和广东省重点领域研发计划2019年度“新一代人工智能”重大科技专项“面向数据智能标注的弱监督与自学习方法及系统验证”,并开发了“智能问医生”APP和“心音数据监测心血管疾病系统”。这些成果解决了医生因诊疗水平参差不齐而导致分级诊疗实现困难的问题,也在更大程度上让广大患者享受到优质的医疗服务。

论坛上,张文生结合 “智能问医生”APP剖析了健康医疗大数据服务于医学科学研究和辅助于临床医生诊疗时遇到的分析推理难题,深度分析了医疗认知计算理论、典型应用案例,讨论了认知计算解决“智能问医生”APP的关键技术。他指出,智能诊疗系统可以提高诊断效率和精度,但严重依赖标注数据量;连续观测的标注数据在临床应用中则更加重要。

建立一体化解决方案

安斯泰来真实世界数据战略与联盟高级总监Sandeep Sanga则聚焦患者数据来源进行分享。他表示,在当前市场环境中,难以从单一数据来源获得所需的全部患者数据,因此需要整合多种来源的真实世界患者数据并建立信息连接,为后续治疗开发和疾病管理提供更多信息,从而帮助实现患者个性化医疗的愿景。

在传统随机对照临床试验中,为了获得符合药物临床试验质量管理规范要求的临床试验数据,通常需要耗费大量的人工和时间成本对相关信息进行整理和提取。北京大学第一医院医学统计室主任、海南省真实世界数据研究院副院长姚晨认为,在当前医疗卫生相关数据的电子化已达到较高水平的情况下,如何针对真实世界数据的产生和应用场景,来提高真实世界数据采集、治理和管理的效率,同时满足监管部门的法规要求,是行业亟待解决的问题。

为此,姚晨团队首次提出了真实世界数据采集、治理和管理的一体化解决方案,并指导国内医疗信息技术公司研发了电子源数据记录工具(以下简称ESR工具)。

ESR工具可以将从医院医疗信息系统获取的数据,以及研究者根据研究方案额外采集和随访患者获取的数据集成电子源数据核证副本,应用当前先进的信息技术进行多源异构数据治理,并通过自然语言处理(NLP)技术自动捕获研究数据到电子病例报告表(eCRF)中。由此,不仅能为研究者在临床试验数据采集方法上提出建设性建议,也能为提高临床试验数据真实性和准确性提供高效可行的解决方案。

目前该临床研究源数据管理系统正在乐城多个医疗机构、北京大学第一医院、北京儿童医院和清华大学玉泉医院的相关临床研究项目进行临床试验数据的采集,为开展真实世界研究提供高质量真实世界数据。

注重患者隐私保护

在真实世界数据研究中,一方面要满足数据共享的需求,另一方面还要注重患者隐私保护。如何解决二者之间的矛盾是业界共同关注的话题。

波士顿科学亚太区首席医务官、副总裁张明东直言,真实世界研究如何实现患者隐私数据的合法合规利用是一个挑战。对此,他建议将源数据的整合与分析进行切割,也就是将数据收集和数据研究分别交由不同的工作人员,从而实现对患者隐私的保护。

2021年11月1日起实行的《中华人民共和国个人信息保护法》对个人信息的隐私保护做出明确规定,但同时也指出“个人信息不包括匿名化处理后的信息”,并要求“收集个人信息应当限于实现处理目的的最小范围”。姚晨认为,真实世界数据采集过程中应明确研究目的、信息收集范围、采集方法、数据治理计划。因此,医院建立一个独立的临床研究源数据管理平台用来电子化同步和存储所有试验涉及的所有源数据是当前一种合法合规的选择。当临床研究数据依照特定的数据标准进行重构或格式调整时,同时将涉及患者隐私的信息移除或者隐藏脱敏,这样既使治理后的研究数据具备共享的条件,也可与现有的临床试验电子数据采集系统(EDC)或其他平台对接,实现数据的自动传输。

围绕这一话题,美国德州大学教授徐华介绍了隐私保护分布式学习技术,为真实世界数据隐私保护提供了更为先进的信息处理手段。

分享按钮