二十几个电脑专家,一大笔来自谷歌的投资,一个由来已久却又让人最为头疼的难题……这个故事的剧情发展你也许已经可以猜到:几个天才少年在精英大学相遇,因为对电脑的热爱迅速成为朋友。在经过几次深夜会议的谋划之后,他们建立起了一个网站或者一个应用程序。不知不觉,他们这个小小的“副业”项目就变成了一家初创公司,而这几个稚气未脱的年轻人也从投资人手里拿到了大把的风投,一夜暴富。
第一眼看上去,奈特·特纳(Nat Turner)和扎克·温伯格(Zach Weinberg)很符合上面那个故事情节中主人公的气质。作为宾夕法尼亚大学的新生,他们两个在入学的第一天一见如故,成为了最好的朋友。如今,这两位28岁的年轻人在纽约经营着一家创业公司。不过与众不同的是,他们公司的梦想比其他人都要宏大。这个处于发育期的科技公司没有从事传统的社交网络行业,也不开发照片分享类应用和约会网站,更不涉足夜宵外卖业务。那他们的业务领域究竟是什么?
Flatiron Health创立于两年前,有着一个富有冒险精神的企业目标:震撼医疗健康世界。他们不是什么医疗健康问题都关注:特纳和温伯格希望能收集分析巨量的临床数据从而为解决癌症治疗提供帮助。众所周知,癌症问题一直是医学界最为复杂、困难,也最为依靠科研的一个领域。生物学院的学生花了大把时间研究癌症却一直没有成果,这对来自沃顿商学院(主要学习经济学和企业管理)的创始人能否有所建树?
在你质疑和嘲笑之前,先看看他们的履历。Flatiron Health并不是他们的第一家公司,而是第三家。他们曾经尝试过为大学生提供在线订餐业务,但是没有成功。之后他们又在大三的时候创建了Invite Media,试图利用大数据技术提高数字营销的销效率。这一次他们大获成功,谷歌在2010年决定以超过8000万美元的价格将其收购。
现在谷歌又一次掏出了支票本,以旗下风险投资公司谷歌创投的名义向Flatiron Health注资1亿美元(该公司总计获得投资1.38亿美元)。除了谷歌之外,这两个年轻人还打动了艾米·阿伯内西。艾米是杜克大学的医学教授,也是著名的肿瘤专家。她了解了Flatiron Health极其与众不同的企业目标,并被两位创始人周密系统的临床数据收集和组织办法所打动。去年七月,艾米正式决定加入公司,担任首席医学官。在此之前艾米一直负责杜克癌症治疗研究项目,她表示:“加入Flatiron Health可是堵上了我的名誉。”
除去谷歌的大笔投资和业内人士的推荐,光是Flatiron Health稍显狂妄的目标也的确令人瞩目。要知道,此前有大批科学家和受过良好训练的医生从事癌症研究工作,仅凭两个稚气未脱的工程师能取得超越他们的成果吗?Flatiron Health的CEO特纳是一个谦逊却又勇敢的人,他表示:“我们的公司只是恰好建立在癌症领域之中而已。”
Flatiron Health的想法很简单。现在,只有一小部分癌症病人的治疗数据被系统地收集起来。而这些经过收集的数据一般来自随机的临床治疗案例,仅仅占到了成年癌症病人总数的4%左右。Flatiron Health认为,系统化、标准化地收集剩下96%病人的治疗情况数据并将数据反馈给医生,这样就能够帮助医生提出更好的治疗方案。
理论上来说,医生能从数据中看出相同情况下哪种治疗方法在大部分病人身上效果最好。比如,医生可以将自己的治疗方案同全国范围内其他医生的方案进行对比,然后修正自己的不足之处。数据同样能帮助我们提高治疗方案的性价比,减少浪费医疗健康支出的情况。另外,数据能帮助更多病人匹配找到适合自己的临床试验,这也许能加快新药品的研发和审批进度。特纳和温伯格并不是叫卖着“通过数据终结癌症”这种乌托邦式的白日梦,他们希望能够取得更有意义的成果。特纳说:“我们所做的一切都是想像其他行业学习,充分利用数据中蕴含的价值。至于这个价值有多大,我们还不清楚。”不过即便他们仅仅取得了一点收获,也能影响上百万人的生活。 2014年,美国新增癌症患者接近1700万。如果大数据能帮助我们提升5%的生存率,那意味着能在2014年一年就拯救成千上万条性命。
特纳的父亲是一位地球物理学家,从事石油勘探工作。特纳从小先后在德克萨斯州、路易斯安那州、荷兰和苏格兰生活过,同事称这位年轻人轻快舒适的微笑之下隐藏着一个“成熟的灵魂”。现在,特纳浅棕色的头发开始慢慢变得稀少,这使得他宽大的前额暴露出来。即便如此,对于一个刚毕业的学生来说他的长相还是很显年轻。特纳不像成功的创业人士那样趾高气昂,也不像那些相信自己可以改变世界的发明家一样专横,他认为Flatiron Health的发展计划是脚踏实地的。他和成长于曼哈顿上西区的温伯格一样,坚定地认为技术能改变癌症患者的生活。温伯格说:“如果你了解医疗健康和肿瘤领域,你会发现这里面有大量的问题亟待解决。一个谦虚的团队找到正确的方向,他们就能为解决困难提供帮助。”
特纳从2009年起开始对癌症感兴趣。在全家前往北加州度假期间,他7岁的堂弟西姆金斯突发疾病。经过一系列检查之后,医生确诊他患上了白血病。在接下来的几年中,这个孩子经历了一系列折磨:骨髓移植,疾病复发,再次骨髓移植,癌症又一次复发。总之,西姆金斯前前后后经历了4次骨髓移植和很多误诊。自从2011年起,这个小家伙状况稳定,现在已经12岁了。
西姆金斯的惨痛经历使得特纳和温伯格开始思考,他们试图寻找一种能帮助境况相似的其他人的解决方案。当考虑建立新公司时,他们首先想到的是一个通过互联网提供第二意见(second-opinion)服务的公司。特纳介绍说,他们在半年之后才决定全力专注于癌症领域。之后,这两位创始人同克里希那·叶斯万特(医生、谷歌创投合伙人之一)一起参观了60多个癌症中心,同大量专家、医生进行交流,并多次讨论可行的商业理念。
在大量的会议和讨论之后,特纳和温伯格形成了一个新的想法:系统化收集现在散落于全国肿瘤治疗中心文件系统中的临床数据。他们建议收集所有数据(电子版和其他版本都要),然后对其整理、汇聚之后再反馈给医生,以此达到帮助医生形成更好的医疗方案的目标。
对于向特纳和温伯格这样的数据极客而言,他们面临的问题是显而易见且并不陌生的:虽然医疗机构一直劝说医生和医院使用电子病历,但是想要获取和使用肿瘤数据依旧非常困难。特纳说:“电子病历数据糟透了。”一个病人的数据可能来自很多个来源:内科医生、肿瘤专家、放射科医生、外科医生、实验室报告和病理学报告等等。即便医院完成了病历的数字化,他们也常常以技术人员称之为“非结构化格式”储存数据。而且,各个数据来源数据非但没有整齐地将数据整理在数据库中,反而各行其道。这就导致不同的实验室报告和记录对数据有着不同的记录方式。更糟糕的是,特纳和温伯格还要应对很多手写和扫描的病例报告、无人聆听的录音和传真机传真来的低分辨率PDF文件,而所有这些文件中都隐藏了大量的数据信息。最后,大量不兼容的系统和政府对私人健康信息的严格监管也是一大障碍,使得分享成千上万肿瘤治疗数据难上加难。
坦率地说,Flatiron Health要面对的挑战是巨大的。
理论上说,电子病历的存在会简化数据汇集和整合的工作,但事实却不尽如人意:对于癌症患者,我们通常要检测他们体内某种蛋白质(比如白蛋白)的水平。不同癌症诊所会以不同的方式在电子病历中记录检测数据,格式可以多达30余种。要知道,对于癌症病人的蛋白和基因检测、组织切片和其他病例监测总计多达100余种,而全美又有无数个不同的电子病历系统和癌症中心。这样一来,数据的差异性简直让人眼花缭乱,而这也大大增加了数据收集、汇聚和整合的难度。
图片说明:
一个癌症中心采用的电子病历系统会以超过30种方式记录白蛋白的实验室检测数据。
为了将所有数据整合成一种格式,Flatiron Health采取了四个办法:
a. 发明了一种适用于所有癌症中心和实验室的通用数据模型;
b. 通过匹配算法处理所有数据,从而识别出90%的数据术语;
c. 使用数据处理引擎实时对数据术语进行转码;
d. 标记无法匹配的术语以便医生或者护士进行人工复审。
对于癌症病人通常接受的超过100种血液、基因、切片组织检查,Flatiron Health适用了同样的办法分析数据。同时,他们还不断更新自己的系统以便能够处理最新研发出来的新型检测带来的数据。
为了开始处理数据,特纳和温伯格花了两年多构建他们称之为数据模型的东西。通过数据模式,他们能将杂乱的临床数据进行分类整理。之后,他们很快认识到如果要对所有类型的癌症都进行这样的数据整理分类工作,那他们将要面临极为复杂的工作。因此,在同一个医生顾问团队开展合作之后,特纳和温伯格开始专攻结肠癌。通过分析已经公开的临床试验,他们整理出了超过350种数据类型。这些数据包罗万象,包括了癌症阶段的人口统计和分布、疾病的生物学标记、患者对疗法的反应等。有了经验之后,他们又对其他几种癌症进行了数据分析整理。
从电子病历中提取数据是一件极其消耗人工的事情。为了能够将这一过程自动化,Flatiron Health采用了多种电脑技术,包括使用旨在精确定位实验室报告中有价值数据的匹配算法。同时,他们还对自然语言处理技术进行了调整,从而使电脑能“阅读”文件并从中提取数据。众所周知,这些电脑技术有可能出现误差,因此Flatiron Health研发了混合型人机学习系统,从而发现并纠正错误。另外,该公司还雇佣了50个护士,安排他们手动输入500名病人的数据。这一批数据就构成了特纳所谓的“训练集”,可以帮助系统发现自动化数据收集过程中的错误。发现问题之后,算法会将这些差异反馈给系统,从而优化完善自动化收集过程。随着收集过程不断发展,这个动态系统理论上能够不断提高自己的准确度。
Flatiron Health不是第一个着手从事癌症数据处理的公司。去年美国临床肿瘤协会(非营利性专业组织)宣布,将开发CancerLinQ系统以完善临床数据库,从而改善护理质量并提升药物研发速度。Cancer Commons是经验丰富的计算机科学家马蒂·泰拉贝尔运营的一个非营利组织,他们希望能够帮助相关人士对肿瘤临床数据进一步进行标准化处理,从而使其以一种格式出现并能被所有人自由使用。IBM则通过自己的沃特森(Watson)人工智能系统同Memorial Sloan Kettering这样的肿瘤中心开展了合作,从大量期刊论文和临床试验报告的临床数据和文本,然后将结果和推荐治疗方案自动提供给医生,以便他们更好地治疗病人。
这些之前的努力(包括美国国家癌症研究所一个名为caBIG的耗资5亿美元的生物信息项目)要么以惨痛的失败结束,要么尚未取得令人满意的结果。杜克大学的阿伯内西教授曾经在CancerLinQ项目的咨询委员会担任负责人,此前也曾涉足过其他类型对临床肿瘤数据进行数字化编译的项目。她表示自己被Flatiron Health对于数据复杂度的专注打动。“特纳和温伯格清楚地知道,仅仅以技术手段解决这个问题不可能成功。看到了这点,我才决定加入团队。”
谷歌创投的投资不仅仅提高了Flatiron Health的可信度,也使得该公司有了收购Altos Solutions(该公司为肿瘤临床实践提供电子病历服务)的可能。此次收购使得Flatiron Health有了更大的客户群,也让他们同医生的联系更加紧密。目前,有大约210家癌症中心使用了Flatiron Health的系统,这些中心每年总计新增病人大约30万。虽然大部分客户是社区肿瘤诊所,但是类似耶鲁大学的Smilow癌症医院和宾夕法尼亚大学的Abramson癌症中心也加入了进来。谷歌表示,自己的投资一定程度上加速了这个前途似锦领域产出成果。谷歌创投负责人比尔·玛丽斯说:“原本只有当下一代人普遍使用电子病历时,数据才能发挥作用。但我们不想这样。我们希望能够拯救那些现在就处于痛苦和煎熬中的患者。”
杰弗里·范瑟尔卡医生支持Flatiron Health的理念,也非常看好他们的前景。他表示自己已经使用Altos电子病历系统多年,而这个系统帮助他提升了护理的质量。不过,该系统的大部分潜力仍然有待开发。他说:“外面有大量的数据,但是没人能对其进行分类整理,也没人知道这些数据表达的意思。这就是我觉得Flatiron Health很重要的原因。在收集百万病人的分子数据和治疗结果后,他们会评估、分类,然后分析出哪种治疗方案真正有效果。”杰弗里医生认为Flatiron Health的系统是“癌症治疗护理所需要的基础设施”。通过该系统,他能够知道自己治疗特定种类癌症的医疗方案已经落后,并随即做出调整改进。同样,他还能知道是不是有更多病人符合临床试验的条件。“如果你能以五倍的速度更快的积累病人,那么想想你能从监管过程中获得多少新的药品。”他补充道。
癌症治疗是一个长期的过程,因此有些医学专业知名人士对大数据的效果有所怀疑。开创型研究人员罗伯特·温伯格(与扎克·温伯格没有亲戚关系)在近期于《Cell》杂志上发表的论文中强调,大数据与癌症之间有着复杂多变的关系。作为麻省理工学院怀特海德生物医学研究所创始人之一,罗伯特指出数据爆炸对所有问题都有影响,从蛋白质之间的互动到肿瘤中的基因突变都会受到波及。因此,数据的爆炸程度已经超过了研究人员能够解释说明的能力。“有些人被生物信息学所吸引。可是对我而言,整合后的数据能帮助人们以之前不能有的能力洞察癌症性质这样的理念并不具有太多吸引力。”
罗伯特补充称,即便数据能帮我们精确地改善某种治疗方案的效果,其带来的结果也不会显着到足以让医生改变治疗实践的地步。“人们进行了很多勇敢的尝试,也提出了很多乐观的主张。相较于我们投入的努力,大数据给我们的产出的确太少了。”
约翰·约安尼季斯是斯坦福大学医学和健康研究及政策学教授,他对于大数据的看法稍微乐观一点。他认为,通过集中式系统将病人资料同临床治疗匹配能帮助我们降低医院和诊所中癌症治疗的可变性。不过,约安尼季斯教授对于来自高度临床对照试验数据之外的数据能给我们带来大的进步和发展这一观点存在质疑。“大量汇集临床实验设计之外的数据,这样做能给我们带来多少有用的成果还是一个有待观察的问题。”他说。
特纳和温伯格并没有期望能很快打消人们的怀疑。不过他们和公司不断增加的客户相信,“智能数据”这种方式能为癌症病人提供更好的治疗方案。阿伯内西教授说,除了其他方面优点之外,大数据首先就能消除社区诊所和顶级研究型医院之间护理可获得性之间的差距。而这往往能带来更好的结果。温伯格也说,Flatiron Health和癌症的斗争是一个长久性的过程。“我们是一个拥有雄心和伟大计划的仅仅两岁的创业公司。我们的第一步走得很好,不过我们面临的根本上而言还是一个要持续数十年的问题。”
加载更多