cda

数字化人才认证

首页 > 行业图谱 >

123456 5/6

 Spark 文本情感分析

Spark 文本情感分析
2016-06-08
本文描述了一个基于 Spark 构建的认知系统:文本情感分析系统,分析和理解社交论坛的非结构化文本数据。 基于 Spark 的文本情感分析 文本情感分析是指对具有人为主观情感色彩文本材料进行处理、分 ...

如何建立SAS报表

如何建立SAS报表
2016-04-25
如何建立SAS报表 一.使用PRINT过程步 1.PRINT过程步的基本使用 前面我们已经提到过利用PRINT过程步检查我们建立的SAS数据集的内容,实际上就是用PRINT过程步显示SAS数据集的内容。PRINT过程步由 ...
大数据工作职位所需的数据场技能包
2016-03-29
摘要:数据分析师除了报表统计外,还需要对数据的有很强的解读能力。电商中的个性推荐技术,商业与银行中的欺骗检测,智能手机中语音识别等等技术,让我们浑身便散发出大数据与机器学习的各种场信息,给人以满满的 ...

如何基于Spark进行用户画像?

如何基于Spark进行用户画像?
2016-03-18
如何基于Spark进行用户画像? 近期,comSysto公司分享了该公司研发团队利用Spark平台解决Kaggle竞赛问题的经历,为Spark等平台应用于数据科学领域提供了借鉴。 主办方提供了一个包含5万个匿名驾驶员线路 ...

 数据科学家和大数据技术人员工具包

数据科学家和大数据技术人员工具包
2016-03-17
数据科学家和大数据技术人员工具包 数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分 ...

系统实例 从系统角度审视大数据计算的特征及难点

系统实例 从系统角度审视大数据计算的特征及难点
2016-03-17
系统实例 从系统角度审视大数据计算的特征及难点 大数据计算是实现大数据“巨大价值”的必要手段,而计算系统是大数据计算的有效载体。试着从系统角度审视大数据计算,透过大数据的体量巨大、速度极快 ...

别再比较Hadoop和Spark了,那不是设计人员的初衷

别再比较Hadoop和Spark了,那不是设计人员的初衷
2016-03-11
对Hadoop与Spark孰优孰劣这个问题,最准确的观点就是,设计人员旨在让Hadoop和Spark在同一个团队里面协同运行。 直接比较Hadoop和Spark有难度,因为它们处理的许多任务都一样,但是在一些方面又并不相互重叠。 比 ...

Spark 2015年回顾:四个大版本更迭、数以百计的改进

Spark 2015年回顾:四个大版本更迭、数以百计的改进
2016-02-01
原文 | Spark 2015 Year In Review 翻译 | 牛亚真 来自 | CSDN   Apache Spark在2015年得到迅猛发展,开发节奏比以前任何时候都快,在 ...

大数据盘点之Spark篇

大数据盘点之Spark篇
2016-01-13
文 | 谭政 来源 | 炼数成金 作者简介 谭政,Hulu 网大数据基础平台研发。曾在新浪微博平台工作过。专注于大数据存储和处理,对 Hadoop、HBase 以及 Spark 等 ...

开源大数据查询分析引擎现状

开源大数据查询分析引擎现状
2015-06-04
开源大数据查询分析引擎现状 大数据查询分析是云计算中核心问题之一,自从Google在2006年之前的几篇论文奠定云计算领域基础,尤其是GFS、Map-Reduce、 Bigtable被称为云计算底层技术三大基石。GFS、Map- ...

浅谈开源大数据平台的演变_数据分析师

浅谈开源大数据平台的演变_数据分析师
2015-05-08
浅谈开源大数据平台的演变_数据分析师 一说到开源大数据处理平台,就不得不说此领域的开山鼻祖Hadoop,它是GFS和MapReduce的开源实现。虽然在此之前有很多类似的分布式存储和计算平台,但真正能实现工业 ...

用Apache Spark进行大数据处理—入门篇

用Apache Spark进行大数据处理—入门篇
2015-04-07
用Apache Spark进行大数据处理—入门篇 Apache Spark 是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。 ...
Spark点燃近实时大数据之火_数据分析师
2015-04-02
Spark点燃近实时大数据之火_数据分析师 在用户体验达不到所宣传效果之后,IT领域中必然会随之出现“新的热门事件”。目前的新热门事件涉及大数据和对海量分布式数据的快速精准分析。 在目前的大数据领域中 ...
大索引技术,大数据的未来_数据分析师培训
2015-03-22
大索引技术,大数据的未来_数据分析师培训 不管你信也好,不信也好,大数据时代真的来临了,随着Hadoop技术的普及,其生态圈发展的越来越壮大,Hive、Hbase、Spark、Storm等的一系列新名词不断的涌现在 ...

Apache Spark源码走读_数据分析师

Apache Spark源码走读_数据分析师
2014-12-14
Apache Spark源码走读_数据分析师 Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,它立足于内存计算,性能超过Hadoop百倍,即使使用磁盘,迭代类型的计算也会有10倍速度的提升。Spark从多 ...

为什么Spark发展不如Hadoop_数据分析师

为什么Spark发展不如Hadoop_数据分析师
2014-12-05
为什么Spark发展不如Hadoop_数据分析师   一说大数据,人们往往想到Hadoop。这固然不错,但随着大数据技术的深入应用,多种类型的数据应用不断被要求提出,一些Hadoop被关注的范畴开始被人们注 ...

Spark vs. MapReduce 时间节约66%,计算节约40%

Spark vs. MapReduce 时间节约66%,计算节约40%
2014-12-01
Spark vs. MapReduce 时间节约66%,计算节约40% MapReduce为大数据挖掘提供了有力的支持,但是复杂的挖掘算法往往需要多个MapReduce作业才能完成,多个作业之间存在着冗余的磁盘读写开销和多次资 ...

企业发展离不开大数据分析方案​

企业发展离不开大数据分析方案​
2014-11-08
企业发展离不开大数据分析方案 企业都在努力获取和解读不同分析系统的数据,而每个系统又负责不同的数据和处理类型。企业都在试图提升数据分析的广度和深度,以便满足业务运营的需求。但是,他们的挑战 ...
123456 5/6

OK