大数据将助企业更好实现商业价值
大数据将帮助企业更好地实现商业价值,以及通过改善商业智能来帮助企业改变组织流程和客户体验。
2016年,各行各业的大数据应用开始从空洞的理论变为具体实践。因此,很多专家认为2016年才是真正意义上的大数据元年。那么,2017年大数据发展趋势主要集中在哪些方面?为此,本报记者近日采访了中兴飞流信息科技公司CTO郑龙。
大数据时代数据处理有三个特点
记者:大数据时代,如何从海量数据中分析得到需要的数据,是很多公司的努力方向。在您看来,大数据时代数据处理的特点是什么?
郑龙:总体来说大数据时代数据处理的特点包括三个方面:一是海量实时流数据需要高吞吐、低延时处理能力。实时事件、交易、交互数量每秒以百万计,由此产生的数据兼具海量与实时的特性,自然会给大数据处理系统造成巨大的压力,需要具备强大的并行计算能力,需要同时满足高吞吐、低延时的特点。可见实时处理是大数据发展的重大趋势。
二是基于Lambda架构的动态流批混合处理能力。目前市场上流行的流式处理系统有Spark Streaming和Storm。但还是存在计算延时仍然无法保障以及资源调度低效等缺点。Lambda架构整合离线计算和实时计算,融合不可变性(Immunability),是一个能满足实时大数据系统关键特性(如高容错、低延时和可扩展等)的架构。基于Lambda架构的统一流批混合处理平台,可以动态感知批处理或流处理的优先级,使得资源高效调度成为可能。
三是面向高度数据智能需求的大数据处理能力。当下业务场景除了对实时性要求越来越严格,业务场景的复杂程度也越来越高,数据分析、决策支持将成为大数据的重要应用。如今结合智能计算的大数据分析逐渐成为热点,包括大数据与神经计算、深度学习、语义计算以及人工智能其他相关技术结合,成为大数据分析领域的热点。
未来大数据将从三个方面快速发展
记者:未来大数据的发展方向是什么?
郑龙:大数据将帮助企业更好地实现商业价值,以及通过智能化手段来帮助企业改变组织流程和客户体验。未来大数据的发展方向包括以下几个方面——
一是机器学习将在图像识别、预测分析等领域实现商业化。Gartner研究报告称,机器学习是2017年十大战略技术趋势之一。当今最先进的机器学习和人工智能系统正在超越传统的基于规则的算法,创建出能够理解、学习、预测、适应,甚至可以自主操作的系统。随着大数据分析能力的不断提高,很多企业开始投资机器学习。
二是高吞吐、低延时的实时数据处理技术广泛运用。典型的实时数据将产生于临床实验与医疗设备、疫情预警、保险欺诈检测、电信运营商DPI分析及位置定位业务、智能电网的生产及勘探设备、交通行业路线拥堵及车辆追踪等领域。鉴于这样的流数据的分布广,影响大,所以,对于全行业大数据应用都是非常重要的组成。
业务需求驱动高吞吐、低延时的流数据处理技术应运而生,离线计算和实时计算需要在统一框架中予以动态调配完美融合,而幸运的是,这样的技术已经浮出水面,商业模式也已呼之欲出。
三是物联网与大数据的结合愈加紧密。数十亿与互联网连接的“物件”将生产大量数据。企业日益期望从这些数据中获得价值,通过发展大数据技术以便与物联网数据衔接起来。Forrester报告预计,可提供物联网洞察能力分析的第三方供应商在2017年将翻一番。
Yita是基于数据流的大数据计算引擎
记者:在您看来,什么是数据流?
郑龙:为了提高计算机的并行处理能力,人们一直致力于研发高度并行的计算模型,在这样的计算模型中,不仅要考虑数据控制类型,更要考虑驱动方式。
数据流跟控制流的区别可以简单理解为市场经济和计划经济的区别,控制流处理过程中会预先设定好每一步该干什么,然而在数据处理的实际过程中,如果有动态的变化,就没有办法处理和调整,有点类似于计划经济。相反,数据流更加像市场经济,它只规定了市场经济的准则,只要有资金、有技术、有人就开始执行。在实际处理过程中,只要有数据、计算资源、CPU就可以让任务启动起来。这样就减少了计算中的控制同步等待,从而实时性更强。
记者:正是看到了数据流模型在大数据处理方面的优势,中兴飞流推出了基于数据流模型的Yita大数据计算引擎。您能谈谈Yita大数据计算引擎的具体情况吗?
郑龙:目前数据流思想在中国的落地正是Yita计算引擎。这个从运算机理上进行创新的计算框架,不仅面对海量高压数据场景处理更加游刃有余,而且使用Lambda架构动态感知处理方式的优先级,可以进行流批混合计算,同时有机结合了机器学习能力、图计算能力和深度学习能力,最终实现了以Yita计算引擎为核心的大数据平台的智能化。
中国大数据企业需在核心技术上下功夫
记者:目前在大数据领域,我国企业需要在哪些方面下功夫?
郑龙:目前我们可以很明显看到,在系统软件领域没有一款产品是纯自主研发的。从技术角度来说这是一个很严重的问题。
中国企业要拿出核心竞争力,在大数据技术发展中占据一席之地,就如通讯业从3G向4G、5G的发展进程中,中国企业不再被牵着鼻子走,而是开始发出自己的声音,引领技术的发展,这是我国企业在技术层面需要重视的事情。
记者:作为大数据技术公司,中兴飞流着眼点在什么领域?
郑龙:作为专业从事创新大数据核心技术研发和服务的高科技软件企业,中兴飞流提供具有核心自主知识产权的大数据技术及解决方案。核心产品是以数据流思想为理论基础的Yita计算引擎,基于该计算引擎的JDH大数据平台,辅以丰富的算法库,构建了融合hadoop生态的、面向海量实时和流批混合计算的行业大数据整体解决方案。主要面向电信运营商领域、金融领域和交通、公安等政府领域,持续创造和提供具有竞争力的产品和应用,实现“数据智慧,极速共享”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13