news 2025/12/17 18:25:12

医疗数据定制方案行业,呆了6-7年,便成了老人【好文分享】

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
医疗数据定制方案行业,呆了6-7年,便成了老人【好文分享】

近几年,随着国家及各地大数据局的陆续成立,数据运营赛道的发令枪已响。其实,早在2016年,自国办发47号文开始,健康医疗大数据的相关应用便由数支“国家队”在全国范围推动起来。过程中有幸从零到一参与了其中的部分工作,也深知其中的不易与艰难,趁着坐地铁闲暇时间,略回忆和记录,供大家消遣。

1. 蓝海概念

健康医疗大数据运营的数据大多指代非临床实验数据。从美国FDA发布指南承认“真实世界”数据的价值,以及类似Flatiron等美国公司的探索,国内以外资研发型药企为首的部分研究者开始关注真实世界研究在国内的可能应用。而一直受困于信息不对等的互联网保险行业与此同时也对发生在医院中的数据垂涎欲滴,只苦于没有合适的方式进行对接。一个药、一个险,构成了健康医疗数据应用的首批用户和付费方。而这两大金主的存在,自然吸引了不少数据资源的收集者、系统的供应者、服务的提供者前来摸索。而这批人,就是健康医疗大数据的首批淘金者。

考虑到国内健康医疗大数据的量级以及医药保险的支付能力,谁掌握数据,谁就掌握了未来的现金奶牛,这一点毋庸置疑。“卖数据”的概念其实早已有之,但大多是不合规的“统方”类、“找病人”类商业模式。因此,当国家政府开始开了健康医疗大数据运营的政策口子,这就变成了一件大事。有说法相关文件是某些大领导的退休兴趣点,也是某些国家队玩家的推动使然,这些无法考证。但纵观行业,国内却也到了数据发挥价值的档口。数据运营,势在必行!

那时候,大概是16年,百子未落,万物未名。我带领十几个人的团队前往北京参与数据运营官方化后全国的第一个试点项目。在给团队开会时我说,“我们是在创造历史”。

2. “国家队”下场

我一直以为,真正大规模的数据运营,其主体一定是“国家队”。毕竟作为战略资源的数据,且在敏感万分的医疗领域,这不是我们这些无门无路的民企碰得了的。事实上,三支国家队也迅速地“筹”办起来。时至今日,也有部分当时规划的“筹”字也没能脱去。三支国家队在规划时各有侧重,从产业到投资到学术。然而在实操过程中并没有很明确地区分,反而形成了相互竞争之势。

国家队的组成大多是央企国企,只有很少数的民企可以小规模地参与其中。随着大央企而来的,是势能。数月之内,国家队就把这个消息带到了数十个省市,那段时间跟着去各省市参加签约仪式成为了日常。各个国家队也各自根据自身资源优势形成了各自的势力范围,全国上下东南西北中多个试点城市应运而生,颇有三国鼎立之势。

而我们有幸参与到了其中两只国家队的合作,(另一只国家队希望的股权合作因各种原因未能达成),成为了三国纷争下的一员前锋。

3. 试点先行“国家健康医疗大数据XX试点”

在早期国家的布局中,东南西北中五个健康医疗大数据先行试点的方案很早便已确定。各地政府,那些希望做出政绩的,以及那些与国家队关系紧密的,很早便进入了申请流程。成为这几个具有代表意义的试点颇为不易,需要地方一系列硬件软件配套,国家给予政策支持,而国家队的参与则是申报成功的默认选项。于是,在隐秘的竞争过后,济南成为了北方中心,合肥为中部中心,贵阳为西部中心,福州为东南中心…除此外还有部分语焉不详的城市如天津(云脑中心?)、成都(入围?)等等。

其中起步最早的,也是在健康医疗数据探索过程初期走得最快的,是以福建省福州市为试点的“中国健康医疗大数据(东南)试点”。东南试点的现状,由于各种原因,并不是所有试点中最好的。但其真正历史价值,不应被遗忘。

福州城市人口不足千万,由于其地域(如与上海的区卫关系)和政策因素(如三明模式等),导致其健康医疗数据本身有着不可忽视的偏倚。但在那时,区域内的三十七家医院(大部分是三级及县级医院,不含省级医院)的历史数据依旧对行业有着极大的研究和商业价值。

还记得当时的时任分管副市长,为实现数据共享传输向所有医院负责人、各委办局发布了多次函件,并进行了极其严肃的会议施压。虽然市级的推动依旧无法撼动省属医院的决策层,但至少对于其他医院,还是有着十足的推动效果。大家同意,配合传输数据至当时刚刚成立不久的大数据办。当然,对于数据收集所需的工作,他们两首一摊,请您自便。

于是,国家队的第一部分任务便出现了:收集医院数据。由于缺乏经验,这个本应简单的工作却出了不少问题。比如技术人员对医院的系统不熟悉,搬库过程很容易遗漏重要的独立系统数据,比如针对数据字典(元数据)沟通的不充分导致数据归一化程度极其有限,比如由于缺乏长远考虑,初期的数据汇集工作根本没考虑到增量数据的近实时传输…

让我印象深刻的一个细节,当时部分医院数据搬至中心端后被发现其被加密了。了解了一圈后发现是某些信息化厂家的默认操作(避免数据泄露?争取接口费?),没有厂家的配合无法实现数据解码。未解决这个问题,国家队技术破解无果后联系该厂商负责人,但对方反应冷漠。层层上报至政府领导,即便大数据处出面依旧无效。内行人点播,这些厂家只听命于他们的客户“医院”,于是尝试通过医院去施压。然而医院也非常无奈,在当时情况下医院没有任何拨款支持该工作,医院表示可以帮忙联络但没法保证实现,毕竟是厂家的核心技术且需要人力操作。于是就这一件“小事”,至少来来去去掰扯了半年时间,最后还是以无果告终,损失了数十万人的部分重要信息。

此类问题,不计其数。

数据损耗,十之八九。

但即便如此,收集上来的部分数据依旧有这极大的价值。下一个问题是,应该向谁、如何做数据变现?

在一次对时任省委书记的展厅汇报过程中,我按台本说了5分钟,短暂的停顿后,省委书记说(大意)“你说的我不一定听得懂,但你们做的事情是对的,福建支持你们、为你们托底,你们只管往前跑…”

于是,我们拼命往前跑。

健康医疗数据数据变现的买单方众多,但经过充分论证,我们选择了从最保险的数据变现买单方和最保险的数据运营模式开始:药企医学部的真实世界研究项目服务。

专业名词不做解释,大家自行学习。但药企医学部的学术(而非直接商业化)诉求、真实世界研究的报告(而非数据本身)交付形式让我们觉得可以做最早起的尝试。毕竟美国FDA的真实世界数据应用也缘起于此。

说做就做,我们联系到了大部分市场上有医学部的药厂。不出意外的,当时大部分国内药企没有这个需求(或者意识),而世界排名靠前的国际药厂MNC却对此事十分感兴趣,在我们沟通前,他们认为只有像摩熵医药(原药融云)、IQVIA类的市场化公司平台可以提供此类医药数据定制方案、研究咨询数据服务。

很快,我们收集到了不同厂家的上百个数据分析需求,覆盖领域涉及各种疾病、各类人群、各种药械。

然而,只有不足十分之一的需求最终立项,不足二十分之一的项目最终结题。

数据分析不是问题,一个专业的流行病研究人员、一个数据库人员、一个统计师、一个医学顾问,这四人组可以解决大部分分析需求。三个月一篇报告、六个月一篇文章,如果一切顺利,这个时间轴是可行的。一篇报告五十万,一篇支持文章发表的项目一百万,这也是当时行业认可的价格。

不顺利的,还是数据本身。

由于数据收集环节的问题,加之未能补货福州病人在省属医院和上海等外地医院的就医行为,整个数据库经专家评估后只能覆盖当地常住人口的20%…

由于数据本身的标准化程度问题,任何一个查询都会涉及到海量的概念归一(如要发现数据库中所有的固醇类药物,把上万种书写方式归一到ATC编码的过程将耗费巨量人力和时间)…

由于入选出现标准需要涵盖一个病人疾病发生发展的过程,多次随访就诊的记录变得极其重要。数据库中50%以上只有一两次就诊数据的病人,一霎那间变成了“无用的资产”。一个涉及最宽泛的糖尿病研究,从被诊断的几十万人中,最终可供使用的也仅仅千余人…

(要是有时间,类似上述的问题数据例子还能举出数十个…)

即便如此,数据的存在还是让运营的第一年有声有色起来,十余个项目的落地、数篇SCI文章的发表、数个国际会议的发声还是让团队非常兴奋。不少其他地区、境内境外的研究者通过我们发表的文章寻找而来,惊讶地表示从未知晓还有此类数据可供使用,咨询是否可以一起做研究。这个数据集,是当时国内流行病学研究的罕见资源,弥补了不少空白。

而问题在于,数据并不是唯一出问题的地方…

任正非说,华为已驶入未知的海域。要我说,驶入未知海域的,还有我们这艘小船。

首先,是数据库的收集合规性问题(采集、保藏)。仅遇到过医院提交相关材料的国家审批机构从未遇到过由“国家队”加我们的技术团队这样的“试点项目”,一时间完全无法答复。经过层层汇报协调解决才开了特批的口子。

其次是数据跨境问题,和我们合作的外资药企可能需要把报告数据提供给境外总部,这在国际关系已逐步复杂化的当时,已经引起了不少的讨论。他们能看到数据么?能传输报告么?如何监管?如何审批?

再后是伦理问题。当时当地没有成熟的区域伦理委员会,那涉及如此之多历史回顾数据的项目立项,谁来进行伦理审批?谁为主进行研究?

然后是文章成果发表问题。本地医院的数据资产,真就可以公开给北京的行业主委用来做发表么?凭什么一个企业可以将医院收集多年的数据进行发表?难道不用为数据贡献者正名么?(数据确权是永远的难题)

而当验血指标等健康医疗数据被明确纳入人类遗传资源管理,问题才真正难以调和。部分项目因为要去国家科技部备案,已经卡了三年,直至今天我们已停止这个业务多年,还有不少药企客户在望着我们已经完成多年的报告而不可得。

数年后,当我亲手关停这条业务线,把团队从东南试点、北方试点、天津等地撤出时,无力感已主宰一切。“领先一步是生,领先三步是死,领先两步不死不活。”

在无星的夜里,在墨色的浪中,谁会在意一艘小船的沉浮与呼救,毕竟海底已满是沉船。

4. 新篇章

而当无助的小船原地打转时,试点的“跑马圈地”还在如火如荼地继续。一些央企国企快速投入数十亿注册资金建立数据运营主体公司,力图掌握行业先机。更多城市申请加入“试点”,做数据运营业务的同时,产业园也大兴土木起来。部分城市的数据运营权一再易主,坊间传闻让人咋舌,一两次派出所都找到我配合收集证据。

华袍之下,更要正骨…

随着大数据局、数据交易所在各地的落地,不少新的概念应运而生。少数几个地方还会邀请我这个“老人”去旁听、参与生态企业的签字。数据交易法庭、隐私计算、保险、健康险、城投等等新玩法让我应接不暇。不得不感慨,一个新行业,呆了6-7年,便成了老人。

但转念一想,一个人的希望,在于他的不断向前,一个行业的希望,在于它的不断淘汰。

预祝这个行业欣欣向荣,希望依稀的足迹可帮助避免前路的险滩。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/16 17:43:32

基于Android的高校教室预约管理平台系统(源码+lw+部署文档+讲解等)

课题介绍 本课题聚焦高校教室预约流程繁琐、资源调度混乱、信息同步不及时的痛点,设计实现基于 Android 的高校教室预约管理平台。系统以 Java 为核心开发语言,基于 Android 原生框架搭建移动端应用,搭配轻量后端服务架构,处理教室…

作者头像 李华
网站建设 2025/12/16 17:42:45

开源不输商用!LobeChat媲美ChatGPT的用户体验实测

开源不输商用!LobeChat媲美ChatGPT的用户体验实测 在大模型浪潮席卷全球的今天,越来越多用户开始体验像 ChatGPT 这样“聪明”的对话助手。流畅的交互、自然的语言生成、近乎即时的响应——这些原本只属于顶级商业产品的体验,正被一个开源项目…

作者头像 李华
网站建设 2025/12/16 17:41:24

十三、Kafka基础环境实战

此次实验有些许复杂,需要细心操作 首先,拍快照 1.切换到opt目录 cd /opt 2.上传kafka包并解压 3.解压文件 tar -zxf kafka_2.11-2.0.0.tgz 4.改名字 mv kafka_2.11-2.0.0 kafka211 5.创建日志文件 mkdir /opt/kafka211/log 6.切换到config目录 cd /opt/kafka211/co…

作者头像 李华
网站建设 2025/12/16 17:41:23

EmotiVoice 安装与环境配置指南

EmotiVoice 安装与环境配置指南 在 AI 语音技术快速演进的今天,传统 TTS 引擎逐渐暴露出“情感单一”“音色固化”的短板。而 EmotiVoice 的出现,为开发者提供了一个真正意义上的高表现力语音合成方案 —— 它不仅支持多情绪表达(如喜悦、愤…

作者头像 李华
网站建设 2025/12/16 17:40:36

LobeChat能否实现AI专利检索?技术创新辅助工具开发

LobeChat能否实现AI专利检索?技术创新辅助工具开发 在当今技术竞争日益激烈的环境下,企业对知识产权的重视程度达到了前所未有的高度。一个研发团队想要快速判断某个技术方向是否已被他人布局,往往需要花费数小时甚至数天时间,在多…

作者头像 李华
网站建设 2025/12/16 17:40:31

vue基于spring boot的乡村民宿预订周边旅游管理系统

目录已开发项目效果实现截图开发技术系统开发工具:核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式&…

作者头像 李华