cda

数字化人才认证

首页 > 行业图谱 >

数据挖掘的常用方法、功能和一个聚类分析应用案例

数据挖掘的常用方法、功能和一个聚类分析应用案例
2018-04-20
数据挖掘的常用方法、功能和一个聚类分析应用案例 一、数据挖掘的常用方法 利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同 ...

spark机器学习-聚类

spark机器学习-聚类
2018-04-05
spark机器学习-聚类 聚类算法是一种无监督学习任务,用于将对象分到具有高度相似性的聚类中,聚类算法的思想简单的说就是物以类聚的思想,相同性质的点在空间中表现的较为紧密和接近,主要用于数据探索与异常 ...

教你用Python实现简单监督学习算法

教你用Python实现简单监督学习算法
2018-04-05
教你用Python实现简单监督学习算法 监督学习作为运用最广泛的机器学习方法,一直以来都是从数据挖掘信息的重要手段。即便是在无监督学习兴起的近日,监督学习也依旧是入门机器学习的钥匙。 这篇监督学习教程 ...

小姐姐带你一起学:如何用Python实现7种机器学习算法(附代码)

小姐姐带你一起学:如何用Python实现7种机器学习算法(附代码)
2018-04-04
小姐姐带你一起学:如何用Python实现7种机器学习算法(附代码) Python 被称为是最接近 AI 的语言。最近一位名叫Anna-Lena Popkes的小姐姐在GitHub上分享了自己如何使用Python(3.6及以上版本)实现7种机器学 ...

异常检测算法–Isolation Forest

异常检测算法–Isolation Forest
2018-03-21
异常检测算法–Isolation Forest 南大周志华老师在2010年提出一个异常检测算法Isolation Forest,在工业界很实用,算法效果好,时间效率高,能有效处理高维数据和海量数据,这里对这个算法进行简要总结。 iT ...

超详细的大数据分析师职业规划

超详细的大数据分析师职业规划
2018-03-20
超详细的大数据分析师职业规划 最近有不少同学咨询有关数据分析职业发展的问题,由此可见,随着大数据的飞速发展,数据分析职业也成为很多同学关注的目标。不要急,这就给大家介绍数据分 ...

机器学习几个重要概念

机器学习几个重要概念
2018-03-20
机器学习几个重要概念 统计学习的算法可以分为以下几个类别:监督学习、非监督学习、半监督学习以及强化学习。 监督学习的输入数据都有对应的类标签或是一个输出值,其任务是学习一个模型,使模型能够对任意 ...

关于 AI 丨不知道这些概念你就落伍了

关于 AI 丨不知道这些概念你就落伍了
2018-03-16
关于 AI 丨不知道这些概念你就落伍了 对所有事情都有一定了比拥有一项专业技能更实用。对于进入新兴市场领域的人来说尤其如此,特别是科技领域。 许多人认为他们对 AI 有一些了解。但是这个领域很新,而且在 ...

Python做数据分析-简洁、易读、强大

Python做数据分析-简洁、易读、强大
2018-04-09
使用过Python的用户都会被其简洁、易读、强大的库所折服,其pythonic语言特性,对人极其友好,可以说, 生产效率更高 月29-5月1日北京基于Python的数据分析现场班 三天的课程力图结合不同案例讲授数 ...

AI 经典书单 | 人工智能学习该读哪些书

AI 经典书单 | 人工智能学习该读哪些书
2018-03-01
AI 经典书单 | 人工智能学习该读哪些书 人工智能相关岗位中,涉及到的内容包含: 算法、深度学习、机器学习、自然语言处理、数据结构、Tensorflow、Python 、数据挖掘、搜索开发、神经网络、视觉度量、图像 ...

数据挖掘概念综述

数据挖掘概念综述
2018-01-29
数据挖掘概念综述 数据挖掘又称从数据库中发现知识(KDD)、数据分析、数据融合(Data Fusion)以及决策支持。KDD一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议上。随后在1991年、1993年和199 ...

一文读懂聚类算法

一文读懂聚类算法
2018-01-11
一文读懂聚类算法 1. 聚类的基本概念 1.1 定义 聚类是数据挖掘中的概念,就是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中 ...

数据科学家需要掌握的10个基本统计技术

数据科学家需要掌握的10个基本统计技术
2018-01-08
数据科学家需要掌握的10个基本统计技术 无论您在数据的科学性问题上持哪种看法,都无法忽视数据的持续重要性,也不能轻视分析、组织和情境化数据的能力。 根据大量的就业数据和员工反馈信息统计,在“25个最 ...

数据分析师&数据科学家&数据工程师——哪个角色最适合你

数据分析师&数据科学家&数据工程师——哪个角色最适合你
2018-01-02
What\'s the difference between a data analyst, scientist and engineer? 数据越来越多的影响并塑造着那些我们每天都要交互的系统。不管是你使用Siri,google搜索,还是浏览facebook的好友动态,你 ...

站在巨人的肩膀上做数据挖掘与机器学习—R帮你实现

站在巨人的肩膀上做数据挖掘与机器学习—R帮你实现
2018-01-03
R语言是自由软件,可以放心大胆地使用,且具有非常强大的统计分析和作图功能,而且更重要的是R软件具有非常丰富的网上资源,目R软件最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站 ...

深入浅出,一篇超棒的机器学习入门文章

深入浅出,一篇超棒的机器学习入门文章
2017-12-19
深入浅出,一篇超棒的机器学习入门文章 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇 ...

数据挖掘中,分类与聚类的区别

数据挖掘中,分类与聚类的区别
2017-12-11
数据挖掘中,分类与聚类的区别 本文对数据挖掘中,极为常见的两类算法:分类与聚类,做个梳理。 首先,来看看分类和聚类各自的一些定义描述。 分类(classification ): 分类算法需要学习,它通过学习找出描述 ...

数据聚类的简单应用

数据聚类的简单应用
2017-12-09
数据聚类的简单应用 数据聚类data clustering:用来寻找紧密相关的事物,并将其可视化的方法。 1. 聚类时常被用于数据量很大(data-intensive)的应用中。 2. 聚类是无监督学习(unsupervised learning) ...
R语言中样本平衡的几种方法
2017-12-06
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...

10个令人相见恨晚的R语言包

10个令人相见恨晚的R语言包
2017-09-15
10个令人相见恨晚的R语言包 大约3年前我开始使用R,起初进展很慢,与我习惯的语言相比,语法更加直观也比较简单,而且需要一段时间才能习惯于细微的差别。我还不清楚语言的力量与社区和各种包的密切关系。 ...

OK