cda

数字化人才认证

首页 > 行业图谱 >

Hadoop Hive sql语法详解
2017-05-28
Hadoop Hive sql语法详解 Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表, ...

盘点大数据商业智能的十大戒律

盘点大数据商业智能的十大戒律
2017-05-26
盘点大数据商业智能的十大戒律 如今,各路企业和组织都不再使用上一代架构来存储大数据。既然如此,为什么还要使用上一代商业智能(BI)工具来进行大数据分析呢?在为企业选择BI工具时,应该遵守以下“十 ...
对于大数据,这些认识上的bug你必须要知道
2017-05-19
对于大数据,这些认识上的bug你必须要知道 虽然大数据的发展(包括新型的非结构化数据和数据分析工具)正影响着各行各业,但关于大数据也有一些误解。 误解一:算法能解决一切问题请输入标题 我把这个误解 ...
大数据文化的7大支柱
2017-05-16
大数据文化的7大支柱 大数据分析和数据科学的世界非常迷人,但同样程度上,也可能被过度夸张。今天我们将用7个关键的大数据“文化元素”来提示企业应该如何包容和应对大数据所提供的潜在的业务优势。 模糊又 ...
R语言时间数据处理之lubridate包
2017-05-08
R语言时间数据处理之lubridate包 在我们处理一些时间序列数据时,经常会碰到各种时间数据,比如“2016-03-03”。很多时候我们需要提取出其中的年、月、日甚至是小时、分、秒,从而可以方便的进行比较、筛选等操 ...

数据挖掘:手把手教你做文本挖掘

数据挖掘:手把手教你做文本挖掘
2017-05-03
数据挖掘:手把手教你做文本挖掘 1文本挖掘定义 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算 ...
一文汇总大数据四大方面十五大关键技术
2017-05-01
一文汇总大数据四大方面十五大关键技术 近年来,大数据来势汹汹,渗透到各行各业,带来了一场翻天覆地的变革。让人们越发认识到,比掌握庞大的数据信息更重要的是掌握对含有意义的数据进行专业化处理的技术。 ...
【广东省城乡规划设计研究院】招聘数据分析师
2017-04-27
【广东省城乡规划设计研究院】招聘数据分析师 广东省城乡规划设计研究院是广东省住房和城乡建设厅直属事业单位,具有城市规划、建筑工程设计、工程咨询、工程监理、招标代理等多个甲级资质和市政行业、风景园林工程 ...

SPSS实例教程:无序多分类Logistic回归

SPSS实例教程:无序多分类Logistic回归
2020-12-08
1、问题与数据 为了探讨基因X突变与恶性肿瘤Y不同组织类型发生风险的关系,某医生设计了一项病例对照研究。该医生纳入所在科室一年收治的145名该恶性肿瘤患者,并从医院体检数据库中随机选择了100名未患该肿瘤 ...

中国智能交通产业大数据应用分析

中国智能交通产业大数据应用分析
2017-04-10
中国智能交通产业大数据应用分析 中国大数据产业起步晚,发展速度快。物联网、移动互联网的迅速发展,使数据产生速度加快、规模加大,迫切需要运用大数据手段进行分析处理,提炼其中的有效信息。 2014年,中 ...

R语言构建追涨杀跌量化交易模型

R语言构建追涨杀跌量化交易模型
2017-04-07
R语言构建追涨杀跌量化交易模型 久经股市的老股民,通常都会使用一种常见的交易策略,追涨杀跌交易法。追涨杀跌法,是股市操作的一个重要技巧,就是在股市上涨时买入股票,股市下跌时卖出股票。如果操作得当是 ...

R语言构建配对交易量化模型

R语言构建配对交易量化模型
2017-04-07
R语言构建配对交易量化模型 散户每天都在经历中国股市的上蹿下跳,赚到钱是运气,赔钱是常态。那么是否有方法可以让赚钱变成常态呢? 我们可以通过“统计套利”的方法,发现市场的无效性。配对交易,就统计 ...
数据“沉睡”制约大数据产业发展
2017-04-03
数据“沉睡”制约大数据产业发展 小到敲击键盘、迈开步子,大到征信系统、政务记录,数据已成这个时代最具活跃的要素和最有价值的“信息矿产”。无论“互联网+”、物联网还是智能制造,数据触角无所不在,影响 ...
数据“沉睡” 制约大数据产业发展
2017-03-23
数据“沉睡” 制约大数据产业发展 小到敲击键盘、迈开步子,大到征信系统、政务记录,数据已成这个时代最活跃的要素和最有价值的“信息矿产”。无论“互联网+”、物联网还是智能制造,数据的触角几乎无远弗届, ...

5个开源Python库,点亮你的机器学习之路

5个开源Python库,点亮你的机器学习之路
2017-03-14
5个开源Python库,点亮你的机器学习之路 机器学习令人兴奋,但实际操作却很困难也很复杂。它涉及到很多手动提升,如集合工作流,设置数据源,以及在内部部署与云部署的资源之间切换等。 Python 是一款强大的 ...

SPSS中两种重复测量资料分析过程的比较

SPSS中两种重复测量资料分析过程的比较
2017-03-13
SPSS中两种重复测量资料分析过程的比较 在SPSS中,有两个过程可以对重复测量资料进行分析:一种是一般线性模型的重复度量;一种是混合线性模型,对于同样的数据资料,使用两种过程分析出的内容不大一样,注意 ...
从5大行业领域看大数据场景应用
2017-03-11
从5大行业领域看大数据场景应用 大数据定义 对于“大数据”(Bigdata)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率 ...

非常值得收藏的 IBM SPSS Modeler 算法简介

非常值得收藏的 IBM SPSS Modeler 算法简介
2017-03-08
非常值得收藏的 IBM SPSS Modeler 算法简介 IBM SPSS Modeler 以图形化的界面、简单的拖拽方式来快速构建数据挖掘分析模型著称,它提供了完整的统计挖掘功能,包括来自于统计学、机器学习、人工智能等方面 ...
大数据项目产品选型的五个建议
2017-03-04
大数据项目产品选型的五个建议 数据如今对企业来说可谓是头等大事。使用欺诈检测来降低财务风险或是建设推荐系统来改善用户体验,都需要数据来为企业解决这些日益复杂的问题提供支撑。   既然数据已成为企业 ...

OK