大数据如何拯救你的生命

美国陆军军医处处长(U.S. Army Surgeon General)卫生创新主管罗伯特·沃克(Robert Walker)博士近年来更多的是一名沮丧的数据录入员,而不是一名医生,他的数千名同事都有这种沮丧情绪。

相反,他腾出更多的面对面的时间与病人,他所使用的电子健康记录(EHR)系统已经成为第三人在检查室,病人画他的注意力。这个问题是不是EHR沃克用途,但是,这是技术的缺点一般。

[ALSO:大数据成功的7个步骤]

沃克在最近的一次采访中解释说:“电子病历已经成为一种障碍,而不是让你的一天过得更有效率的东西。”“它把注意力从病人身上转移到了电脑上。人们点击方框,转身背对着病人。就是把数据塞进这个东西里。”

电子病历使每一个医疗机构都可以电子化地记录病人的家族史、疾病、治疗和目前的生活方式。EHRs的承诺是,通过简化工作流程和创建大量的临床数据仓库,每年将为美国医疗系统节省高达810亿美元。这些数据仓库可以挖掘出可以改善预防保健和疾病治疗的信息。

这还没有发生,和医生少用电子病历,结果迷恋。上个月,医生和AmericanEHR合作伙伴的美国大学发布的4279名医生是给他们的完全39%,他们的EHR不会推荐给同事的调查。从谁觉得这种方式在2010年34%的人说他们是“非常不满意”的电子健康档案,以减少工作量的能力,24%的最高。

在卫生信息技术促进经济和临床健康法案(HITECH法案)的主持下,美国政府要求医疗保健机构 - 医院,诊所和私人诊所都一样 - 来实现电子健康档案。供应商还必须通过正在发生,在未来四年三级政府过程证明自己有意义的使用这些系统。

Despite what has so far been an uneven rollout of EHRs in the U.S., Walker and others are already, in effect, building what a treasure trove of patient information that can be tapped to improve patient care, a repository that will revolutionize medicine for decades to come. That is, if everyone can figure out how to categorize it, sort it and access it easily.

承诺

大数据分析引擎,如Hadoop的有能力通过矿井创建电子病历临床数据仓库,充满了宝贵的非结构化数据仓库,可以用来帮助医生做出有关病人治疗的决定。

今天,医生和制药公司仍然很大程度上依赖于教科书和极其微小的临床研究,这些研究通常使用只有一种疾病的健康病人。这些研究对象很难模拟现实世界中的大多数病人,他们中的许多人都有不止一个健康问题。

医院的大约25%使用某种形式的数据分析的矿井传统的数据库,详细了解过去的治疗和对未来的治疗方法如何得到改善。但是,什么是包含在列的数据库行代表的有关患者一个已经收集到的信息几乎是微不足道的一部分;最重要的信息在于非结构化数据 - 医师的注意事项,放射图像和生活方式的信息,从使用移动设备收集的患者。

“这是那将会在医疗保健发生真正的复兴,”沃克说。“随着大数据,在医生的办公室发生的事情将是今天我们所看到的大不相同。前五名或10的事情,人们从美国死是生活方式引起的,这是荒谬的。的也许不是生命体征,我只是去看看,你在一家杂货店买什么。”

如今,在大多数医院数据分析是用来管理成本,提高护理质量。大数据更有前途的用途,但是,是探索利用基因图谱推动医生和护士说明和数据治疗和预后相关性的能力。

通过结合大数据和遗传学分析,今天的科学家能够确定如何病人会做出反应的药物,并可能有一天甚至能够预测谁可能生病和 - 如果他们这样做 - 什么定制药物能够最好地治疗疾病。

“当我看到历史的增长速度,[大数据]绝对是市场上火热报名中,”詹姆斯·加斯顿,在医疗卫生信息与管理系统协会(HIMSS)的临床和商业智能高级总监说。

个性化医疗

目前,大数据分析的更有前途的领域之一涉及通过基因组学的研究,也被称为个性化药物设计的药物治疗。

遗传疾病是类似于在软件缺陷代码;的关键是找到一种疾病的原因是发现该错误代码,按照亚历克西斯Borisy,基金会医学,癌症诊断公司的联合创始人。

“癌症,例如,在这里出了一些错误的编程代码基因组的疾病和发生了突变。有在代码中的错误实际,这是一个核心的原因,癌症的发展,” Borisy说。

虽然第一个人类基因组测序花了8年时间,花费了大约10亿美元,但基因测序成本在过去10年大幅下降。现在每个人类基因组的成本从5000美元到10000美元不等,公司正在努力在未来几年将成本降低到1000美元。斯坦福大学医学院(Stanford University’s School of Medicine)的医学助理教授尼甘·沙阿(Nigam Shah)表示,DNA链测序的成本变得如此之低,以至于医院很快就能在大多数患者身上进行测序,并将数据添加到电子病历系统中。

沙阿工作在生物医学信息,这意味着他对工作做出的临床数据仓库中的信息意识。

沙阿说,人类基因组测序产生大量数据,存储一个人的遗传密码可能需要高达1TB的数据存储容量。

人类基因组包含3.2十亿行代码,这意味着发现在代码中的缺陷,需要复杂的计算机算法和大规模,集群服务器农场。增加了复杂的是,病情往往多个突变的结果,根据沙阿。

虽然疾病如亨廷顿病或阿耳茨海默氏病是由共同的基因突变引起的,并且更容易被察觉,大多数的疾病是由稀有突变引起的。糖尿病,例如,被认为是由许多基因突变,从而对自己赋予少量的风险,但在组合可以是更严重的引起的。

“如果你的基因组类型的人,出了50与糖尿病相关的基因突变]你有他们的10,这是很难说什么会发生在你身上,”沙阿说。“问题的部分原因是,我们只需要做更多的研究,并收集更多的数据,它的一些,我们只是需要更好的方法。”

但巨大的进步已经取得进展。迄今为止,科学家现在知道的约5000罕见疾病的遗传原因。

基因研究最有希望的领域之一是药物基因组学,它利用一个人的基因组成来确定他们对药物的反应,根据特定的突变——甚至是在癌症肿瘤中发现的突变——定制治疗。

例如,药物Zelboraf由纽约大学癌症研究所在几年前通过基因测试来表达称为BRAF V600E基因突变的目标黑色素瘤皮肤癌肿瘤的发展。研究人员发现,患者服用Zelboraf分别为64%不太可能从皮肤癌的高级形式,以死谁比只接受标准化疗的患者。

“看你的基因组确实在说帮助,‘对你来说,我们应该给这种药物的一半剂量,但对于这个其他人,我们还会给你药物的剂量加倍’,”沙阿说。

链接与基因组的电子健康档案

目前,有几个项目正在进行中,以电子健康档案的链接和人类基因组数据。其中最看好的是电子医疗记录和基因组学(出现)网络。

在美国国家人类基因组研究所(National Human Genome Research Institute)的资助下,eMERGE network加入了来自9个医疗研究机构和医院的研究人员,他们在基因组学、统计学、伦理学、信息学和临床医学等领域拥有广泛的专业知识。多达1万名患者将根据83个特定基因对其进行测序,另有5万至8万名患者将获得更普遍的基因型。

由此产生的数据将提高遗传风险评估,疾病预防,诊断和治疗,可用于开发基于基因组学的药物,根据盖尔加维科博士,华盛顿大学医学遗传学部门的负责人。

在出现网络包括华盛顿大学,梅奥诊所,波士顿儿童医院和格伊辛格卫生系统。网络开始了寻找基因比较常见的疾病,使用计算机算法与电子病历找到与特定基因型相关的疾病。

贾维克说:“今年,该网络进入了药物基因学领域,它对与治疗反应或药物不良反应相关的基因排序非常感兴趣。”

加维科,网络的主要研究者之一,他说,网络已经成功地找到致病基因,免疫基因,眼睛和心脏疾病。

eMERGE项目开发了一种计算机算法,可以从不同机构的许多不同的电子病历中提取疾病类型。然后,研究人员输入数据,寻找导致疾病的基因突变的遗传标记。

“当你转向药物基因学时,你可能会遇到药物的问题,”Jarvik说。“一种药物可能是无效的,或者你可能有一种有效的药物,但你可能需要不同于其他人的剂量。或者你可能会有不好的反应。我们希望解决所有这些问题。”

沙阿和其他研究人员警告说,许多变量会影响一个人的健康,基因组学不能包治百病。但是大分析的使用可以帮助改善病人的结果。

注意,图片和生物识别技术

Shah说,基因组学只是无数改善医疗保健努力的“一小部分”。“对于患有高血压、糖尿病和高胆固醇的普通人来说,基因组学毫无用处。”

一个在诊断和跟踪还是患者最有价值的工具包括医疗记录,以及新的自然语言处理软件允许这些医生的笔记被编入数据库字段,大部分医疗卫生专业人员没有时间填写自己。

“纹理笔记医生如何与这是怎么回事就与病人的其他医疗服务提供者沟通,有什么治疗计划,什么是关注,”艾萨克博士小号小羽,哈佛医学院小儿科和健康科学技术教授说,与儿童医院。

小羽是沮丧,它更容易找到更多关于购物者的经验用数码相机购买比来确定哪些不良事件患者与特定的药物。因此,与几个同事一起,小羽开发了一个名为i2b2信息学可以从病人的床边同时收集医师笔记和其他非结构化数据以及编纂医疗数据免费的开源软件。

信息学平台被全世界100多个学术卫生中心使用。它已被用于精确定位类风湿关节炎等疾病的遗传预测因子和识别有害药物。

例如,信息学引擎显示,文迪雅的心脏病发作风险高于同类药物中的其他药物。

Kohane说,当i2b2软件被部署在医院急诊室时,它能够通过检测身体特征,平均提前两年预测出病人是否遭受家庭暴力。

“同时,这几乎就像一个后门,这些数据被卸载和分析[事后]。什么跨医疗保健系统的实时照顾病人?”他说。

在长期护理,最重要的是,一个医生能够访问包含上千种类似患者临床信息数据仓库。

“重要的是说你有这四种疾病和你正在做这四种药物的能力,为医生,这里是治疗这些其他类似患者的结果,”沙阿说。“目前还没有临床试验已经每望着这四种疾病和这四个药物的效果。”

当从电子病历数据可以无缝交换,医生将能够查询什么成千上万的其他医生在相同的情况一样。

“然后我想问自己,‘这个人让我担心什么:我担心血凝块或心脏病发作吗?’”Shah said. "Then I can query what happened to the 1,000 other people who suffered a blood clot and determine ... that outcome in those people very similar to you."

“这有点像在做硅临床试验,”国王继续。“我指的是整个过程的基于实践的药。”

从历史上看,医药一直依靠治疗或药物处方的临床试验结果公布的指导方针,始终专注于一种疾病,最经常使用的只有年轻,更健康的患者为研究对象进行测试。

数据鸽子洞

12 第1页
页面1的2
IT薪资调查:结果在