精准医学之贝瑞和康基因组“大数据之路”
自基因测序技术被发明以来,建设人类基因组数据库一直是各国基因组研究中心的核心内容之一,人类基因组数据库的宗旨是为从事人类基因组研究的科学家和医护人员提供人类基因组信息。目前国际上人类基因组数据大多来源于西方白种人,然而不同人种的进化差异会导致明显的易感基因差异、特异性位点突变频率不同、基因突变表观差异等,因此在我国分子诊断与精准医学飞速发展的背景下,建立高质量的中国人群基因组数据库已经成为当下制约分子医学发展的重要壁垒。今年两会上,委员也建议应尽快建立精准医学资源库,整合共享医疗大数据,促进精准医学更好的发展。
贝瑞和康作为致力于将高通量测序技术实现临床转化的行业领导者,早在2015年8月14日宣布与云计算服务平台提供商阿里云达成合作,共同打造以海量的中国人群基因组数据为核心的数据云,实现对个人基因组数据的精准解读。该项目由美国贝勒医学院、现任职贝瑞和康CIO的于福利教授牵头,参与“神州基因组数据云”项目的研究人员达到了100多人,由医学、分子生物学、遗传学、计算机编程等研究领域的博士组成。项目组分成三个团队,一个是贝瑞和康的研究团队,一个是于福利在贝勒实验室的团队,另外一个则是专门做高性能运算的阿里云团队。
神州基因组数据云,是一个知识密集型项目。
阿里云拥有批量计算服务的强大能力,贝瑞和康则深耕基因检测多年已积累超过百万人群基因组数据,此次选取其中四十万人份数据作为“神州基因组数据云”项目的第一阶段数据,旨在借助云计算对该数据资源进行深入挖掘,进一步揭示中国人群遗传突变分布,提升中国人遗传疾病诊断的效率和精准程度。
当基因测序成本迅速下降以后,拥有数据量的多少不再是行业里唯一的竞争优势,而是否能够将海量的大数据进行解读,转换成具体能够应用的有效信息,才是测序企业发展的核心竞争力。光有云计算能力和基因组数据还不够,分析和注释技术是能否达成项目目标的内在核心驱动力。该项目发布一年后,也即2016年8月24日贝瑞和康公布了为基因数据分析开发的两大核心专利技术:Verita Trekker®变异位点检测系统和Enliven®变异位点注释系统。
Verita Trekker®经过严格的基因型质量控制,SNP 检测的灵敏度达99.00%,特异性达99.99%,真阳性率达99.90%;Indel 检测的真阳性率达88.00%;家系样本基因型真阳性率大于99.90%;各项指标均属国际业界一流水平。而Enliven®则通过统计学计算和文本挖掘方法整合国际权威的超过50个数据库和预测算法,其中也包括“神州基因组数据云”项目所产生的中国人特有基因信息数据库。同时,支持千万篇文献的即时查找,全面覆盖基因、变异、表型、疾病信息,参考权威文献、美国医学遗传学学会(ACMG)标准与实际基因型-表型对应,在这样完善的体系和先进的算法的保障下,能够出具可靠的变异致病性结果,为科研工作者和临床医生更好的研究和制定精准医疗方案提供帮助。
在Verita Trekker®和Enliven®两大核心技术共同驱动下的“神州基因组数据云”项目取得了阶段性的重要成果。2016年9月8日,贝瑞和康已完成世界首个中国人群基因组数据库建设,填补了国际基因数据库中缺少中国人群特有基因组数据信息的空白。
同年9月23日,在第十九届全国临床肿瘤学大会暨CSCO学术年会上,贝瑞和康进一步展示了该项目的重要成果应用。这其中包括与北京大学肿瘤医院解云涛教授合作的“中国人遗传性乳腺癌基因突变图谱项目”,以及中国40万人基因组大数据项目在临床应用层面上所取得的阶段性成果,结果显示中国人乳腺癌基因突变和其他人种相比具有显著性差异。
项目由解云涛教授和于福利教授共同展示,可以看到采用Enliven®变异位点注释系统对美国国家卫生研究院的相关项目中的BRCA1、BRCA2基因的2152个位点进行注释,将注释结果与以往报告结果对比,PPV(阳性预测值)达到99.3%,充分验证了Enliven®注释和解读能力的准确性。在此基础上,贝瑞和康将自建的中国人基因组数据库与万例妇科肿瘤患者的基因数据进行整合,建设成为全球最大的妇科肿瘤基因组数据库。
现在,神州基因组数据云项目仍在进行中,中国人群的基因组大数据正在成倍累积增长。受益于测序成本下降,降低获得大量数据的难度,因此只要在数据解读能力上快速突破,中国非常有可能在生物基因信息解读这一领域实现弯道超车。
“神州基因组数据云”项目的另一层意义则与我国医疗政策中正在力推的分级诊疗政策息息相关。通过与专家合作,大数据体系为90%以上的医院提供解读能力,这将对基层临床产生重要的指导意义。可以想象,在三四线城市,医生利用该数据云平台分析基因测序数据,在当地可以获得同样质量的检测分析,获得和在大城市大医院同等质量的报告,就能够进一步促进实现分级诊疗。于福利教授展望道。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“用户旅程分析”概念 用户旅程图又叫做用户体验地图,它是用于描述用户在与产品或服务互动的过程中所经历的各个阶段、触点和情 ...
2025-01-22在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-22在数据分析领域,Excel作为一种普及率极高且功能强大的工具,无疑为无数专业人士提供了便捷的解决方案。尽管Excel自带了丰富的功 ...
2025-01-17在这个瞬息万变的时代,许多人都在寻找能让他们脱颖而出的职业。而数据分析师,作为大数据和人工智能时代的热门职业,自然吸引了 ...
2025-01-14Python作为一门功能强大的编程语言,已经成为数据分析和可视化领域的重要工具。无论你是数据分析的新手,还是经验丰富的专业人士 ...
2025-01-10完全靠数据决策,真的靠谱吗? 最近几年,“数据驱动”成了商界最火的关键词之一,但靠数据就能走天下?其实不然!那些真正成功 ...
2025-01-09SparkSQL 结构化数据处理流程及原理是什么?Spark SQL 可以使用现有的Hive元存储、SerDes 和 UDF。它可以使用 JDBC/ODB ...
2025-01-09在如今这个信息爆炸的时代,数据已然成为企业的生命线。无论是科技公司还是传统行业,数据分析正在深刻地影响着商业决策以及未来 ...
2025-01-08“数据为王”相信大家都听说过。当前,数据信息不再仅仅是传递的媒介,它成为了驱动经济发展的新燃料。对于企业而言,数据指标体 ...
2025-01-07在职场中,当你遇到问题的时候,如果感到无从下手,或者抓不到重点,可能是因为你掌握的思维模型不够多。 一个好用的思维模型, ...
2025-01-06在现代企业中,数据分析师扮演着至关重要的角色。每天都有大量数据涌入,从社交媒体到交易平台,数据以空前的速度和规模生成。面 ...
2025-01-06在职场中,许多言辞并非表面意思那么简单,有时需要听懂背后的“潜台词”。尤其在数据分析的领域里,掌握常用术语就像掌握一门新 ...
2025-01-04在当今信息化社会,数据分析已成为各行各业的核心驱动力。它不仅仅是对数字进行整理与计算,而是在数据的海洋中探寻规律,从而指 ...
2025-01-03又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-03在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-03在数据分析的江湖里,有两个阵营总是争论不休。一派信奉“大即是美”,认为数据越多越好;另一派坚守“小而精”,力挺质量胜于规 ...
2025-01-02数据分析是一个复杂且多维度的过程,从数据收集到分析结果应用,每一步都是对信息的提炼与升华。可视化分析结果,以图表的形式展 ...
2025-01-02在当今的数字化时代,数据分析师扮演着一个至关重要的角色。他们如同现代企业的“解密专家”,通过解析数据为企业提供决策支持。 ...
2025-01-02数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪 ...
2024-12-31数据分析,听起来好像是技术大咖的专属技能,但其实是一项人人都能学会的职场硬核能力!今天,我们来聊聊数据分析的核心流程,拆 ...
2024-12-31