大数据急需攻克的五大世界性难题
世界人民的健康记录:医学领域最急需的资源,人脑图谱:了解身体的各个部分如何运作,统筹世界范围内的铀原料供应:追踪武器化活动与能源供给等这些人们最关注的世界性难题,IBM、谷歌等巨头级企业已经开始对这类高难度挑战发起冲击,这很令人期待。
尽管计算性能、存储容量以及分析技术一直在不断进步,某些现实挑战对于大数据而言仍然过于庞大以至于无法应对。在今天的文章中,我们将探讨五个此类难题 ——看看如何才能将其解决。
如果大数据能够在传统领域之外进一步解决世界性难题,结果会怎么样?到目前为止,IBM、谷歌以及惠普等巨头级企业已经开始对这类高难度挑战发起冲击,其中包括分析繁忙的高速公路上到底会有多少车辆通过某条桥梁,或者计算会有多少用户查看网络浏览器中的一条小广告。谷歌公司甚至公布了一项雄心勃勃的计划,称将解决人类衰老这一历史性难题。
但仍有几大世界性难题等待着我们攻克。在某些情况下,分析所需要的数据根本无迹可寻。在其它情况下,足以应对如此庞大数据量的计算机还没有被发明出来。目前有五大课题值得我们关注。会有大数据技术企业站出来排忧解难吗?我们等待时间带来答案。
世界人民的健康记录:医学领域最急需的资源
大多数人都拥有一份电子健康记录(简称HER),不过其中的内容颇为有限——甚至只包含最近一次健康检查的基本结果。目前足以支撑全世界健康记录资料库的工具与技术已经到位。这样的全球性数据库一旦出现,制药企业就能对其进行分析以开发人民群众最急需的疫苗及药物——也就是说,根据供应链的实际需要进行优先选择。
既然前景一片光明,为什么我们还没有感受到由此带来的益处呢?这是由于目前还缺乏一套访问全球数据的可行机制。“健康记录被保存在一大堆彼此隔离的系统当中,而资料持有者没有足够的动力来分享这些信息,”分布式数据库供应商Cloudant公司联合创始人兼首席科学家 MikeMiller表示。“即使我们真的把所有数据都归拢在一起,也仍然需要通过机器学习算法及实时分析对其进行全面优化。这也正是我们目前正在努力钻研的课题。”
人脑图谱:了解身体的各个部分如何运作
人类大脑模型能够为科学研究带来巨大帮助。医生可以查看肿瘤的生长情况或者了解大脑如何通过一系列功能控制身体的其它器官。目前已经有包括欧洲人类大脑项目在内的多个科学项目尝试在未来十年之内创建出大脑模拟系统。
障碍何在?要完成这项工作,我们需要一台运算速度千倍于当前水平的超级计算机。大脑当中存在数以百万计的神经递质,而且它们彼此之间互相连通、共同数据我们所接触到的“数据”。
“这样的计算规模要求我们从传统的硅芯片领域脱离出来,迈向生物芯片时代——这是分子计算的前提条件,”曾任克林顿政府前副助理国务卿(负责运输体系技术政策)、现任霍华德大学教授的OliverG.McGee解释道。“从直观角度看,分子计算在数据管理方面的运算速度比传统硅芯片高750倍,只有这样的机制才能处理颅腹脑体系当中的关系认知奥秘。”
统筹世界范围内的铀原料供应:追踪武器化活动与能源供给
毫无疑问,在全球范围内收集任何数据都将是一项极为艰巨的任务,但追踪全球铀原料供应至少拥有其积极意义——当然,前提是所有信息碎片都能严丝合缝地被拼接在一起。
数据收集企业Connotate公司CEOKeithCooper指出,我们目前只能解决其中一部分难题,因为某些国家并没有公开其铀原料供应记录。“目前,很多铀储量丰富的国家虽然已经拥有便捷的互联网体系,但却仍然拒绝以标准化方式公布其资源流向。”幸运的是,计算宏观形势倒不太困难——毕竟将铀原料投入武器化领域的国家数量有限。
我们真正需要追踪并掌握的是全球可用铀原料当中最为宝贵的、仅占15%的浓缩铀,他解释道。“我们需要识别并追踪所有与浓缩铀相关的销售活动(通过黑市或者合法渠道)以及矿藏分布,并通过论坛、博客、监管机构及其它周边体系进行数据统计,包括各政府及非政府组织对于铀原料生产数据及开采活动的报道等。为了处理收集到的这些结果,我们还需要设计出一套智能化人机交流方案。”
全球实时犯罪数据:更加主动的警务处理能力
很多地方性执法机构已经掌握着非常丰富的犯罪数据,警务人员则可以在自己的警车内轻松访问犯罪记录数据库,从而根据犯罪嫌疑人的具体情况做出反应。
障碍何在?这些数据只包含过往的罪行,Cloudant公司的Miller表示,其中无法体现刚刚发生或者正在进行中的犯罪活动。由于无法在犯罪活动进行的过程中进行阻止,警方只能被迫采取更为被动的应对措施。
不过情况已经有所转变,Miller指出。举例来说,加利福尼亚州奥克兰市警方已经配备声学监控器用于识别枪声。技术人士将其称为 “ShotSpotter”,配合大数据分析机制即可用于追踪潜在的犯罪发生地点,警员则根据分析结论立即前往对应位置。实时犯罪数据所带来的易处并不局限于执法领域:TruliaLocal热点地图能够提供犯罪活动报告,从而帮助住房买家选择更友善、更安全的生活环境。
追踪儿童行踪:更好、更及时的AmberAlert
时至今日,我们已经拥有很多种通报失踪儿童的方式,例如美国所采用的AmberAlert系统。不过这些通告机制的最大问题在于,只能在事后发起提醒。追踪儿童位置所必要的技术已经存在,当下大部分智能手机都能通过谷歌位置报告功能将儿童的当前所在地发送给父母。与此同时,大众汽车的Car-Net以及福特汽车的MyKey应用也能在青少年驾车到达特殊地理位置时发送报告。
障碍何在?分析。数字营销企业RoundarchIsobar公司副总裁JaisonManian指出,预测技术能够助我们一臂之力。大数据厂商能够分析儿童的行为模式,当然前提是家长愿意分享相关数据。
“预测分析能够追踪儿童的日常行动模式,并在出现严重偏差时立即向父母发出警示,”他表示。只要满足警示条件,信息会被实时发出 ——这能有效阻止重大事故的发生。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31