cda

数字化人才认证

首页 > 行业图谱 >

scikit-learn的线性回归模型

scikit-learn的线性回归模型
2016-05-05
scikit-learn的线性回归模型 特征选择的方法 作为有监督学习,分类问题是预测类别结果,而回归问题是预测一个连续的结果。 1. 使用pandas来读取数据 Panda ...
大数据 | 十问大数据安全分析
2016-04-25
导语 人类的生产生活每天都在产生大量的数据,并且产生的速度越来越快。新的攻击手段层出不穷,需要检测的数据越来越多,现有的分析技术不堪重负。 安全数据的数量、速度、种类的迅速膨胀,导致的不仅仅是海量异 ...

数据分析的6个操作步骤

数据分析的6个操作步骤
2016-04-22
数据分析的6个操作步骤 一、什么是数据分析? 数据也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出。 二、数据分析过程的6个阶段 1、明确分析目的与框架 基于商业的理解,整理分析框架和分 ...

以“上大学分析”为例体验什么是数据挖掘

以“上大学分析”为例体验什么是数据挖掘
2016-04-19
谈到BI,就会谈到数据挖掘(Data mining)。数据挖掘是指用某些方法和工具,对数据进行分析,发现隐藏规律并利的一种方法。下面我们将通过具体的例子来学习什么是数据挖掘。 案例“上大学分析”-体验什么是数据 ...

数据分析六部曲及数据分析的四大误区

数据分析六部曲及数据分析的四大误区
2016-04-12
数据分析六部曲及数据分析的四大误区 什么是数据分析?数据分析是用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析的目的?把 ...

数据产品经理的必修课:数据图表应用

数据产品经理的必修课:数据图表应用
2016-04-11
数据产品经理的必修课:数据图表应用 图表是件花衣裳,你得懂得怎么穿! 初阶的饼图、环形图、折线图、柱形图、条形图等就不多说了,因为他们直观到无需解释。但需要提一下做这些图的时候的细节: (可跳 ...

深入对比数据科学工具箱:Python和R之争

深入对比数据科学工具箱:Python和R之争
2016-04-10
概述 在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Data Analysis),也就是A型数据科学。偏向工程的数据科学被称为数据构建(Data Building),也就是B型 ...

当R用户用ggplot2 package时,经常问的10个问题

当R用户用ggplot2 package时,经常问的10个问题
2016-04-08
有时候数字确实需要分享一个美丽的故事分享! 当今社会,数据可视化是至关重要的。没有强大的可视化,几乎不可能在堆积如山的数据中创造或者叙述它的故事。这些故事有助于我们构建策略,并做出明智的商业决策。 ...

SAS数据挖掘实战篇【二】

SAS数据挖掘实战篇【二】
2016-04-08
SAS数据挖掘实战篇【二】 从SAS数据挖掘实战篇【一】介绍完目前的数据挖掘基本概念之外,对整个数据挖掘的概念和应用有初步的认识和宏观的把握之后,我们来了解一下SAS数据挖掘实战篇【二】SAS工具的应用。 ...

数据科学人才: 如何顺藤摸瓜提高你的竞争力

数据科学人才: 如何顺藤摸瓜提高你的竞争力
2016-04-07
摘要:基于一项针对620多位数据专家的调查研究,我们发现数据科学技能分为三个分支:行业知识背景(本文特指商业),技术/编程和数学/统计。这项研究将影响目前数据科学家,即将成长为数据科学家和招聘者。 数据科 ...

信息熵与方差-联系与区别

信息熵与方差-联系与区别
2016-04-05
    熵的概念很早就在物理学中出现,热力学中的熵用于衡量物质状态的混乱程度。霍金在《时间简历》中也对熵有着有趣的表述:一个常有人打扫清洁的屋子,熵值低,一个不打扫的屋子,熵值就高,自然界 ...

数据分析与统计推断:线性回归

数据分析与统计推断:线性回归
2016-03-31
数据分析与统计推断:线性回归 相关性(correlation) 相关性描述了两个变量之间线性关联的强度,表示符号为R。 属性: 相关系数的幅度(绝对值)测量两个数字变量之间线性关联的强度 相关系数 ...

如何选择一个合适的数据图表?

如何选择一个合适的数据图表?
2016-03-27
如何选择一个合适的数据图表? 在传递信息时,有数据比没数据更有说服力,而一旦有了数据,那就牵涉到如何呈现。PowerPoint为我们提供了诸多图表,它们在一定程度上已经可以满足我们平时需求。当然,若能够有更 ...

详细解读如何构建专家诊病模型

详细解读如何构建专家诊病模型
2016-03-24
专家系统是典型的大数据和人工智能结合的计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。也就是说,专家系统是一个具有大量 ...

Excel中双座标排列图的制作实例

Excel中双座标排列图的制作实例
2016-03-23
Excel中双座标排列图的制作实例  有人喜欢用Excel绘制带双座标轴的图表。下面我来说一下这种图表的制作方法: 和单座标轴相比,多一数值轴,省去图例,但不能制成模板,每次都要作一次图。   1. 制表: ...

用SPSS做判别分析的流程介绍

用SPSS做判别分析的流程介绍
2016-03-22
用SPSS做判别分析的流程介绍 如何用SPSS做判别分析呢?下面我们就说说用SPSS的整个操作流程。 1.Discriminant Analysis判别分析主对话框     如图 1-1 所示   ...

R语言的三种聚类方法

R语言的三种聚类方法
2016-03-21
R语言的三种聚类方法 对于R语言,相信做数据分析的来说,一定不陌生,那么对于R语言的三种聚类方法你是否应用的全面,下面就说一下? 一、层次聚类 1)距离和相似系数 r语言中使用dist(x, method = ...

大数据安全分析常见问题汇总

大数据安全分析常见问题汇总
2016-03-20
大数据安全分析常见问题汇总 大数据是时下最火热的IT行业的词汇,随之数据仓库、数据安全、数据分析、数据挖掘等等围绕大数量的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。 本人在与用户沟通大数据 ...

 数据科学家和大数据技术人员工具包

数据科学家和大数据技术人员工具包
2016-03-17
数据科学家和大数据技术人员工具包 数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分 ...

如何利用 Excel 进行高级数据分析?

如何利用 Excel 进行高级数据分析?
2016-03-16
高级的数据分析会涉及回归分析、方差分析和T检验等方法,不要看这些内容貌似跟日常工作毫无关系,其实往高处走,MBA的课程也是包含这些内容的,所以早学晚学都得学,干脆就提前了解吧,请查看以下内容。 ...

OK