大数据分析项目的重大议程
"大数据"已经成为商业智能(BI)、分析和数据管理市场领域中讨论度最高的话题之一,当然也是最热门的流行语之一。越来越多的企业开始关注BI和分析供应商,希望可以解决大数据环境中的业务问题。不幸的是,要在大数据中获得可见性是说起来容易做起来难。而且,随着供应商不断攻破大数据分析项目的各种难题,投放到市场的产品种类越来越繁多,企业要想选择最能满足他们需求的一款产品也相当不易。
那么,到底什么才是真正的大数据呢?最近,IT电子杂志eWeek的一篇报道对大数据做了如下定义(其中部分参考了Gartner公司对这一提法的定义):"大数据指结构化与非结构化数据跨网络传输到处理器和存储设备的数量、种类和速度,以及这些数据转化为企业业务建议的过程。"
这样说来大数据就等于数据管理和数据分析,漏掉了关于大数据所面临的业务挑战中很重要的一个方面--复杂度。例如,大数据部署经常涉及到各方面信息,包括来自社交媒体网络、电子邮件、传感器、Web活动日志以及其它数据源的信息等,这些数据很可能与传统的数据仓库系统不兼容。
在许多情况下,所有分离的数据都需要整合,以便在更广泛的层面上产生影响。这可能对业务规则、表连接和大数据分析系统的其它组件关系重大。在考虑存储和查询管理的时候,大数据由于其复杂度,与传统数据完全不同;正因为如此,分析数据库和数据分析软件供应商不得不加快脚步帮助公司处理大数据问题。
理解大数据是评估技术需求和实施大数据分析规划的第一步,然后根据日益庞大和多样化的数据集,理解市场、理解企业在实现商业价值与发挥竞争优势中所遇到的阻碍因素。
大数据分析项目的重大议程
当然,许多企业一直拥有大数据集。但是现在,越来越多的企业存储的信息量就算不是PB级,起码也有TB量级。此外,他们希望每天能分析几次关键数据,甚至是实时分析;而传统BI流程对历史数据进行分析的频率是以周或月为单位的。越来越多复杂查询的处理带来了各种不同的数据集,其中有可能包含来自企业资源计划(ERP)系统和客户关系管理(CRM)系统交易数据、社交媒介和地理空间数据,还有内部文档和其它格式信息等等。越来越多的公司也会想给企业客户提供自助服务的BI功能,让对分析结果的理解变得容易一些。
所有这一切都涉及到大数据分析战略,而且技术供应商处理这些需求的方式是多种多样的。许多数据库和数据仓库供应商都在关注及时处理大量复杂数据的能力。有的用列式数据存储来实现更快速的查询,有的提供内建的查询优化器,有的增加对Hadoop和MapReduce这类开源技术的支持功能。
内存分析工具可能对分析处理速度的提升有所帮助,因为它能减少磁盘数据转换的需求;而数据虚拟化软件和其它实时数据集成技术可对运行中不同数据源的信息进行收集。对于垂直市场而言,现成的分析应用程序都是专门为其定制的,因为诸如电信、金融服务和网络游戏这些行业都必须处理大数据。当公司管理人员和业务经理需要查看大数据分析查询结果时,数据可视化工具可以简化其流程。
在数据和分析需求方面符合以上分类描述的企业,在制定实施方案、对大数据基础设施进行选型之前,需要考虑以下问题:
数据及时性(并不是所有数据库都支持实时数据可用性)
各种数据源需要与数据关联性和业务规则复杂度进行链接,以获得一个包含企业绩效、销售机会、客户行为、风险因素和其它业务指标的全面视图。
由于分析的需要,历史数据的数量也需考虑在内。如果我们需要五年的数据,而一个数据源只包含两年的信息,那么该怎么办呢?
哪些技术供应商在业内具有大数据分析方面的经验?有没有他们的业绩记录?
在企业内部,不同数据入口的负责人是谁?他们在大数据分析策略中分别扮演什么角色?
这些因素并不能从根本上影响需求的规划,但是它们可以帮助企业部署大数据分析系统、选择最为合适的技术。
数据分析咨询请扫描二维码
在现代信息技术的广阔世界中,大数据架构师扮演着至关重要的角色。他们不仅引领着企业的数据战略,还通过技术创新推动业务的不断 ...
2024-11-04在当今数字化时代,数据分析师已成为企业关键角色,帮助决策者通过数据驱动的洞察实现业务目标。成为一名成功的数据分析师,需要 ...
2024-11-03在当今数字化的世界中,数据分析已经成为推动商业决策的关键因素。随着公司和组织越来越依赖数据来驱动业务战略,对数据分析专 ...
2024-11-03《Python数据分析极简入门》 第2节 2 Pandas数据类型 Pandas 有两种自己独有的基本数据结构。需要注意的是,它固然有着两种数据 ...
2024-11-01《Python数据分析极简入门》 第2节 1 Pandas简介 说好开始学Python,怎么到了Pandas? 前面说过,既然定义为极简入门,我们只抓 ...
2024-10-31在当今数据驱动的世界中,数据科学与工程专业的重要性愈发凸显。无论是推动技术进步,还是在商业决策中提供精准分析,这一专业都 ...
2024-10-30在当今信息爆炸的时代,数据已成为企业决策和战略制定的核心资源。爬虫工程师因此成为数据获取和挖掘的关键角色。本文将详细介绍 ...
2024-10-30在当今数据驱动的世界中,数据分析是揭示商业洞察和推动决策的核心力量。选择合适的数据分析工具对于数据专业人士而言至关重要。 ...
2024-10-30能源企业在全球经济和环境保护双重压力下,正面临前所未有的挑战与机遇。数字化转型作为应对这些挑战的关键手段,正在深刻变革传 ...
2024-10-30近年来,随着数据科学的逐步发展,Python语言的使用率也越来越高,不仅可以做数据处理,网页开发,更是数据科学、机器学习、深度 ...
2024-10-30大数据分析师证书 针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应按照不同知识要求进行学习。 ...
2024-10-30《Python数据分析极简入门》 附:Anaconda安装教程 注:分Windows系统下安装和MacOS系统安装 1. Windows系统下安装 第一步清华大 ...
2024-10-29拥抱数据分析的世界 - 成为一名数据分析工程师是一个充满挑战和机遇的职业选择。要成功地进入这个领域,你需要掌握一系列关键技 ...
2024-10-28降本增效:管理战略的关键 企业管理中的降本增效不仅是一项重要的战略举措,更是激发竞争力、提高盈利能力的关键。这一理念在当 ...
2024-10-28企业数字化是指利用数字技术和信息化手段,对企业的各个方面进行改造和优化,以提升生产效率、服务质量和市场竞争力的过程。实现 ...
2024-10-28数据科学专业毕业后,毕业生可以选择从事多种不同的岗位和领域。数据科学是一个快速发展且广泛应用的领域,毕业生在企业、学术界 ...
2024-10-28学习数据科学与大数据技术是当今职业发展中至关重要的一环。从基础到高级,以下是一些建议的课程路径: 基础课程: Python编程 ...
2024-10-28在信息技术和数据科学领域,数据架构师扮演着至关重要的角色。他们负责设计和管理企业中复杂的数据基础设施,以支持数据驱动的决 ...
2024-10-28进入21世纪以来,随着信息技术的迅猛发展,大数据已经成为全球最具影响力的技术之一,并成为企业数字化转型的核心驱动力。大数据 ...
2024-10-28随着科技的迅猛发展,数字化转型已成为现代企业保持竞争力和推动增长的关键战略之一。数字化不仅仅是技术的应用,它代表着一种全 ...
2024-10-28