日前,Hadoop与大数据技术大会(Hadoop&BigData Technology Conference 2012,简称“HBTC 2012”)在北京隆重开幕。英特尔亚太研发有限公司总经理、英特尔软件与服务事业部中国区总经理 何京翔博士表示,随着云计算和物联网的发展,产生大数据是必然的。英特尔对大数据感兴趣,是因为一直坚信“计算改变人类的生活”。
据何京翔博士介绍,过去几年英特尔非常重视Hadoop的研究。今年7月份,正式发布了Hadoop发行版,这是由中国团队研发,最先在中国市场投入使用,已经和中国的很多客户开展了合作。
当记者问到Hadoop目前在哪些行业有相关的应用时,英特尔亚太研发有限公司数据中心软件部、英特尔Hadoop发行版研发团经经理 孙元浩说到,主要应用在电信、金融、交通,此外在医疗、零售、制造业也有一些项目。目前在中国市场看到的数据量比较大的电信企业,象中国联通采用发行版Hadoop解决用户上网记录查询的难题。
对于其他的行业,一种是本身的数据量已经形成规模,需要对非结构化的数据进行处理,但传统数据库对于文本挖掘的能力非常有限;另外一种是短期数据量不是很大,但通常是需要存储好几年的数据,并对过往几年中的历史数据进行分析,传统数据库无法满足这样的处理需求。对于这种高级分析功能和并行处理的需求可以通过使用Hadoop技术为企业带来处理能力的提升以及应用的拓展。
Hadoop发行版有哪些不同
我们都知道Apache社区有开源的Hadoop版本,英特尔的Hadoop发行版有哪些不同呢?孙元浩表示,企业在用开源Hadoop软件的时候,存在稳定性和安全管理的问题,包括网络监控、加密、解密和高可靠性, 英特尔的发行版都很好的解决了这些问题,此外还提供本地服务支持,对关键业务有7x24小时的响应服务。
第二,针对应用的优化。Hadoop主要是为互联网用户设计的,社区的开发者仍然是互联网公司的开发者。Hadoop在行业的应用上,功能上存在很多不足。例如其中一个功能叫跨数据中心的大表,是为政府交通部门提出的解决方案。在金融行业、制造行业,有分支机构的企业,也都有这种需求。我们会开发出越来越多的跟行业有关的功能,不光局限于互联网公司,还要满足企业用户的需求。
第三,在数据的实时处理和及时处理上,也是发行版Hadoop的定位。从行业和应用来看,数据的实时采集和分析是用户需要的,我们对HBase的改动很大,这部分全部免费公布到Apache社区。
第四,对最新硬件技术进行优化,在CPU、存储、内存等技术上不断创新,使得Hadoop的处理能力达到“接近于实时”的处理效果。
百闻一见Hadoop发行版推出免费版
Hadoop发行版是如何来进行收费?何京翔博士告诉记者,目前的收费模式有两种,一种方式是软件授权加15%的标准服务费。另外一种是标准服务模式,是订阅模式,这是在美国和中国地区采取的主要模式。
鉴于目前大家对Hadoop和大数据还处于徘徨期,何京翔博士表示,将为更多用户跨过大数据应用的门槛铺就通途,专门做了Hadoop发行版的免费版本,免费版本在主要的安装和配置、服务管理、服务和资源监控功能上均与收费的商业版本保持一致,但仅支持50个节点的部署规模,数据存储量承载也限定为8TB。在企业进行小规模实验的时候,就可以下载使用,这样做的目的的是让更多的人可以看到它、用到它,能为企业解决哪些问题。
数据分析咨询请扫描二维码
统计学基础 - 理解统计学的基本概念和方法是数据分析师必备的技能之一。统计学为他们提供了处理数据、进行推断和建模的基础。 数 ...
2024-11-25数据分析师在如今信息爆炸的时代扮演着至关重要的角色。他们不仅需要具备扎实的数据分析技能,还需要不断学习和适应不断发展的技 ...
2024-11-25数据分析师的工作职责涉及多个关键方面,从数据的获取到处理、分析再到可视化,旨在为企业的决策提供有力支持。让我们深入了解数 ...
2024-11-25数据分析师:洞察力量的引擎 数据分析师的兴起 数据分析师行业目前正处于快速发展阶段,市场需求持续增长,薪资水平也有所提升。 ...
2024-11-25数据收集与整理 - 从各种来源收集数据,清洗和整理以确保数据质量和可用性。 数据分析与建模 - 运用统计学方法和机器学习模型对 ...
2024-11-25数据分析是当今社会中不可或缺的一项技能,涵盖了广泛的工具和技术。其中,掌握各种数据处理函数对于数据分析师至关重要。本文将 ...
2024-11-25“大数据治理”是一个涵盖广泛的复杂概念,其核心在于确保大规模、多样化的数据资源能够被有效管理和利用。不仅涉及数据的采集、 ...
2024-11-25一、引言 背景介绍 随着信息技术的快速发展和互联网的普及,大数据已经成为现代社会的重要资产。大数据的兴起不仅推动了各行各业 ...
2024-11-25《Python数据分析极简入门》 第2节 7 Pandas分组聚合 分组聚合(group by)顾名思义就是分2步: 先分组:根据某列数据的值进行 ...
2024-11-25数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22