大数据挖掘 与 虚拟医药科研
一些数据挖掘的实践应用。我们说数据挖掘的应用很广泛,在某些领域也已很成熟,实用价值很高。其中数据挖掘在医药学领域就有一些比较成熟可靠的应用了。但有时,我们也听说有些人将数据挖掘在某些领域的应用说成是“讲故事”。这实际上是反映了这些案例的开发和应用很不成熟,可信度很低。成熟的数据挖掘应用绝不是“讲故事”。本人在北美工作了多年,从来没有听说过数据挖掘是“讲故事”(也许是我见不多、识不广吧)。
今天,我们就谈一谈数据挖掘与虚拟医药科研的话题。
1. 基于大数据挖掘的虚拟医药科研案例
数据挖掘发展到今天,按照时下的概念应该到了“大”数据挖掘的时代了。我们还是先从几个相关案例开始吧。
1.1 虚拟临床试验-大数据采集
我们首先来看这样一个案例。2011年06月,辉瑞制药有限公司宣布开展一项“虚拟”临床研究,该项研究是一个得到美国食品和药物管理局批准的试点项目,首字母缩写为“REMOTE”。“REMOTE”项目是在美国开展的第一项病人只需使用手机和互联网、而不用重复跑医院的临床研究,该项目的目标是要确定此类“虚拟”临床研究能否产生和传统临床研究一样的结果。而传统的临床研究要求病人住在医院附近,并且定期前往医院或诊所进行初次检查和多次后续检查。如果这一项目有效,那它可能意味着全美国的病人都能参加今后的许多医学研究。这样一来,原先的科研项目中未得到充分代表的群体将得以参加,数据收集速度将大大加快,而且成本也很可能会大幅下降,参与者退出的几率也很可能会降低不少。
从上例中,我们可以看到,利用互联网可以收集远远大于传统临床科研样本数目的超大量病人的临床数据,而且其中有些临床数据可能来自于更加便捷的可穿戴健康监测设备。如果这样的研究,在科研设计严谨、质量标准得到有效执行、各种误差得到有效控制的情况下,科研的效率和成果的可信度可以显著提高。正如辉瑞公司首席医疗官弗蕾达·刘易斯-霍尔所说的:“让更多样化的人群得以参与研究有可能会推动医学进步,并为更多的病人带来更好的疗效。”
1.2 虚拟药物临床试验-大数据挖掘
我们再来看另外一个案例。1992年,抗抑郁药物帕罗西汀(Paxil)获准上市;1996年,降胆固醇药物普拉固(Pravachol)正式开售。两种药品生产企业的研究证明:每种药物在单独服用时是有效且安全的。可是,患者要是同时服用两种药是否安全,没有人知道,甚至很少有人想过。美国斯坦福大学的研究人员应用数据挖掘技术分析了数万例患者的电子病历后,很快发现了一个出人意料的答案:同时服用两种药物的患者血糖含量较高。这对于糖尿病患者来说影响很大,过多的血糖对他们来说是一种严重的健康威胁!科学家还通过分析血糖检测结果和药物处方,来寻找隐藏的规律。
对于单个医生来说,他所经历的同时服用这两种药物的病人是很有限的,虽然其中可能有少数的糖尿病患者莫名其妙地血糖升高了,但医生很难意识到这是由于病人同时服用了Paxil和Pravachol造成的。因为这是一种掩藏在大数据中的隐含规律,如果不是有人有目的地专门研究Paxil和Pravachol联合用药的安全性的话,个体医生是很难揭示这个规律的。但是,临床药品成千上万,我们怎么可能对任意组合的两、三种药联合应用的安全性和有效性进行逐一研究呢?数据挖掘很可能是一种有效的、快速的、主动式的探索多种药联合应用问题的方法!
研究者不必再召集患者去做临床试验,那样做的话花费太大了。电子病历及其计算机应用的普及为医疗数据挖掘提供了新的机遇。科学家不再局限于通过召集志愿者来开展传统的课题研究,而是更多地从现实生活中的实验中,如日常的大量的临床案例中筛选数据并开展虚拟科研,这些并非来自计划的课题立项的实验数据保存在许多医院的医疗记录中。
类似本案例,应用数据技术使得研究人员可以找出在药物批准上市时无法预见的问题,例如一种药物可能对特定人群产生怎样的影响。另外,对医疗记录的数据挖掘不仅将为研究带来好处,还会提高医疗服务系统的效率。
1.3 虚拟药物靶标发现-知识发现
我们再看看这样的一类研究。通常新药研发的过程都比较漫长,投入巨大,风险也很高。有数据表明,新药研发的平均时间长达15年,平均耗费超过8亿美元。但是,由于药物疗效的不佳和毒副作用太高,使得许多药物的研发经常在临床阶段就失败了,造成了巨大的经济损失。作为药物研发的源头,药物靶标的发现和识别对药物的研发成功率具有举足轻重性的作用。随着生物信息技术的不断发展,以及蛋白质组学数据、化学基因组学数据的日益增长,应用数据挖掘技术结合传统生物实验技术,可为药物新靶标的发现提供新的技术手段,为靶标识别预测提供新的方法。构建药物靶标数据库,利用智能计算技术和数据挖掘技术对现有的药物靶标数据开展深入探索,以期发现新的药物靶标正是这样一类研究,我们也称之为药物靶标的知识发现。
传统的药物靶标的发现,通常大都是通过大量的、反复的生物化学实验来实现的,不仅成本高、效率低,成功率也很低,犹如瞎子摸象一样,不好掌握方向。而应用数据挖掘这一自动的、主动的、高效的探索技术,可以开展虚拟药物靶标发现,不仅大大加快了药物靶标发现的进程,而且大幅减少了生物化学实验的次数和成本,同时也提高了传统生化实验的成功率。
2. 数据挖掘在虚拟医药科研上的应用
大数据时代,医药研发面临更多的挑战和机遇,为了更好的节约研发成本,提高新药研发成功率,研发出更有竞争力的新药,可以应用数据挖掘技术开展虚拟医学科研和药物研究。数据挖掘在虚拟医药科研上的应用,可以总结为如下几个方面。
2.1 通过预测建模帮助制药公司降低研发成本提高研发效率。
模型基于药物临床试验阶段之前的数据集及早期临床阶段的数据集,尽可能及时地预测临床结果。评价因素包括产品的安全性、有效性、潜在的副作用和整体的试验结果。通过预测建模可以降低医药产品公司的研发成本,在通过数据建模和分析预测药物临床结果后,可以暂缓研究次优的药物,或者停止在次优药物上的昂贵的临床试验。
2.2 通过挖掘病人数据,评估招募患者是否符合试验条件,从而加快临床试验进程,提出更有效的临床试验设计建议。例如: 通过聚类方法对患者群体进行聚类,寻找年龄、性别、病情、化验指标等方面的特征,判定是否满足试验条件,也可以根据这些特征更好的设立对照组。
2.3 分析临床试验数据和病人记录可以确定药品更多的适应症和发现副作用。在对临床试验数据和病人记录进行分析后,可以对药物进行重新定位,或者实现针对其他适应症的营销。通过关联分析等方法对试验数据进行挖掘可能会发现事先想不到一些成果,大大提高数据的利用程度。
2.4 实时或者近乎实时地收集不良反应报告可以促进药物警戒。药物警戒是上市药品的安全保障体系,对药物不良反应进行监测、评价和预防。通过聚类、关联等大数据挖掘手段分析药品不良反应的情况,用药、疾病、不良反应的表现,是否跟某种化学成分有关等。例如不良反应症状的聚类分析,化学成分与不良反应症状的关联分析等。另外在一些情况下,临床实验暗示出了一些情况但没有足够的统计数据去证明,现在基于临床试验大数据的分析可以给出证据。
2.5 针对性药物研发:通过对大型数据集(例如基因组数据)的分析发展个性化药物。这一应用考察遗传变异、对特定疾病的易感性和对特殊药物的反应的关系,然后在药物研发和用药过程中考虑个人的遗传变异因素。很多情况下,病人用同样的用药方案但是疗效却不一样,部分原因是遗传变异。针对同病种的不同的患者研发不同的用药,或者给出不同的用法。
2.6 对药物化学成分的组合和药理进行挖掘,激发研发人员的灵感。例如针对于中医药物研发,用数据挖掘手段对于中药方剂和症候进行分析研究,探讨方剂和针对症状之间的联系,从功效、归经、药性和药味等方面进行分类特征分析
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Excel是数据分析的重要工具,强大的内置功能使其成为许多分析师的首选。在日常工作中,启用Excel的数据分析工具库能够显著提升数 ...
2024-12-23在当今信息爆炸的时代,数据分析师如同一位现代社会的侦探,肩负着从海量数据中提炼出有价值信息的重任。在这个过程中,掌握一系 ...
2024-12-23在现代的职场中,制作吸引人的PPT已经成为展示信息的重要手段,而其中数据对比的有效呈现尤为关键。为了让数据在幻灯片上不仅准 ...
2024-12-23在信息泛滥的现代社会,数据分析师已成为企业决策过程中不可或缺的角色。他们的任务是从海量数据中提取有价值的洞察,帮助组织制 ...
2024-12-23在数据驱动时代,数据分析已成为各行各业的必需技能。无论是提升个人能力还是推动职业发展,选择一条适合自己的学习路线至关重要 ...
2024-12-23在准备数据分析师面试时,掌握高频考题及其解答是应对面试的关键。为了帮助大家轻松上岸,以下是10个高频考题及其详细解析,外加 ...
2024-12-20互联网数据分析师是一个热门且综合性的职业,他们通过数据挖掘和分析,为企业的业务决策和运营优化提供强有力的支持。尤其在如今 ...
2024-12-20在现代商业环境中,数据分析师是不可或缺的角色。他们的工作不仅仅是对数据进行深入分析,更是协助企业从复杂的数据信息中提炼出 ...
2024-12-20随着大数据时代的到来,数据驱动的决策方式开始受到越来越多企业的青睐。近年来,数据分析在人力资源管理中正在扮演着至关重要的 ...
2024-12-20在数据分析的世界里,表面上的技术操作只是“入门票”,而真正的高手则需要打破一些“看不见的墙”。这些“隐形天花板”限制了数 ...
2024-12-19在数据分析领域,尽管行业前景广阔、岗位需求旺盛,但实际的工作难度却远超很多人的想象。很多新手初入数据分析岗位时,常常被各 ...
2024-12-19入门数据分析,许多人都会感到“难”,但这“难”究竟难在哪儿?对于新手而言,往往不是技术不行,而是思维方式、业务理解和实践 ...
2024-12-19在如今的行业动荡背景下,数据分析师的职业前景虽然面临一些挑战,但也充满了许多新的机会。随着技术的不断发展和多领域需求的提 ...
2024-12-19在信息爆炸的时代,数据分析师如同探险家,在浩瀚的数据海洋中寻觅有价值的宝藏。这不仅需要技术上的过硬实力,还需要一种艺术家 ...
2024-12-19在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2024-12-19阿里P8、P9失业都找不到工作?是我们孤陋寡闻还是世界真的已经“癫”成这样了? 案例一:本硕都是 985,所学的专业也是当红专业 ...
2024-12-19CDA持证人Louis CDA持证人基本情况 我大学是在一个二线城市的一所普通二本院校读的,专业是旅游管理,非计算机非统计学。毕业之 ...
2024-12-18最近,知乎上有个很火的话题:“一个人为何会陷入社会底层”? 有人说,这个世界上只有一个分水岭,就是“羊水”;还有人说,一 ...
2024-12-18在这个数据驱动的时代,数据分析师的技能需求快速增长。掌握适当的编程语言不仅能增强分析能力,还能帮助分析师从海量数据中提取 ...
2024-12-17在当今信息爆炸的时代,数据分析已经成为许多行业中不可或缺的一部分。想要在这个领域脱颖而出,除了热情和毅力外,你还需要掌握 ...
2024-12-17