cda

数字化人才认证

首页 > 行业图谱 >

机器学习需要哪些数学基础

机器学习需要哪些数学基础
2017-05-20
机器学习需要哪些数学基础 过去的几个月中,有几人联系我,诉说他们对尝试进入数据科学的世界,以及用机器学习的技术去探索统计规律并构建无可挑剔的数据驱动型产品的热忱。然而,我发现一些人实际上缺乏必要的 ...

简单易学的机器学习算法—线性回归(1)

简单易学的机器学习算法—线性回归(1)
2017-03-24
简单易学的机器学习算法—线性回归(1) 一、线性回归的概念     对连续型数据做出预测属于回归问题。举个简单的例子:例如我们在知道房屋面积(HouseArea)和卧室的数量(Bedrooms)的情况下要求房屋 ...

用十张图解释机器学习的基本概念

用十张图解释机器学习的基本概念
2017-03-20
用十张图解释机器学习的基本概念 在解释机器学习的基本概念的时候,我发现自己总是回到有限的几幅图中。以下是我认为最有启发性的条目列表。 1. Test and training error: 为什么低训练误差并不总 ...

机器学习中的kNN算法及Matlab实例

机器学习中的kNN算法及Matlab实例
2017-03-18
机器学习中的kNN算法及Matlab实例 K最近邻(k-Nearest  Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即 ...
机器学习-Cross Validation交叉验证Python实现
2017-03-16
机器学习-Cross Validation交叉验证Python实现 1.原理 1.1 概念 交叉验证(cross-validation)主要用于模型训练或建模应用中,如分类预测、pcr、pls回归建模等。在给定的样本空间中,拿出大部分样本作为训练集来 ...

机器学习:决策树(Decision Tree)

机器学习:决策树(Decision Tree)
2017-03-11
机器学习:决策树(Decision Tree) 决策树(decision tree)是一种基本的分类与回归方法。在分类问题中,它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。在学习时,利 ...

非常值得收藏的 IBM SPSS Modeler 算法简介

非常值得收藏的 IBM SPSS Modeler 算法简介
2017-03-08
非常值得收藏的 IBM SPSS Modeler 算法简介 IBM SPSS Modeler 以图形化的界面、简单的拖拽方式来快速构建数据挖掘分析模型著称,它提供了完整的统计挖掘功能,包括来自于统计学、机器学习、人工智能等方面 ...

用Python进行机器学习小案例

用Python进行机器学习小案例
2016-11-24
用Python进行机器学习小案例 本文是用Python编程语言来进行机器学习小实验的第一篇。主要内容如下: 读入数据并清洗数据 探索理解输入数据的特点 分析如何为学习算法呈现数据 选择正确的模型和学 ...
如何使用线性回归分析来预测发电厂的发电量
2016-10-17
如何使用线性回归分析来预测发电厂的发电量 在这篇文章中,我将会教大家如何通过拟合一个线性回归模型来预测联合循环发电厂(CCPP)的发电量。这个数据集则来自于UCI Machine Learning Repository。这个数据集 ...

机器学习、大数据等岗位面试时遇到的各种问题总结

机器学习、大数据等岗位面试时遇到的各种问题总结
2016-10-12
机器学习、大数据等岗位面试时遇到的各种问题总结 自己的专业方向是机器学习、数据挖掘,就业意向是互联网行业与本专业相关的工作岗位。各个企业对这类岗位的命名可能有所不同,比如数据挖掘/自然语言处理/机器 ...

2017校招数据分析岗位笔试/面试知识点

2017校招数据分析岗位笔试/面试知识点
2016-09-30
2017校招数据分析岗位笔试/面试知识点 2017校招正在火热的进行,后面会不断更新涉及到的相关知识点。尽管听说今年几个大互联网公司招的人超少,但好像哪一年都说是就业困难,能够进去当然最好,不能进去是不是 ...

【案例】R语言与机器学习学习笔记(分类算法)

【案例】R语言与机器学习学习笔记(分类算法)
2016-09-22
【案例】R语言与机器学习学习笔记(分类算法) 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经 ...

干货 :这7种回归分析技术 学了不后悔

干货 :这7种回归分析技术 学了不后悔
2016-09-15
干货 :这7种回归分析技术 学了不后悔 本文解释了回归分析及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回归等七种最常用的回归技术及其关键要素, ...

对业务和用户的理解,是数据挖掘“皇冠上的明珠”

对业务和用户的理解,是数据挖掘“皇冠上的明珠”
2016-09-06
对业务和用户的理解,是数据挖掘“皇冠上的明珠” 这篇文章不是数据挖掘教程,而是让用研、产品、运营及其它相关岗位的同学了解: 数据挖掘的特点; 数据挖掘可以做哪些事情、有什么应用价值; 要发挥 ...

数据挖掘是对业务和用户的理解

数据挖掘是对业务和用户的理解
2016-09-02
数据挖掘是对业务和用户的理解 数据挖掘有很高的专业门槛;然而用研、产品、运营们也不一定就会被数据科学家们“碾压”了。这篇文章不是数据挖掘教程,而是让用研、产品、运营及其它相关岗位的同学了解: 数 ...

数据挖掘系列决策树分类算法

数据挖掘系列决策树分类算法
2016-08-15
数据挖掘系列决策树分类算法 从这篇开始,我将介绍分类问题,主要介绍决策树算法、朴素贝叶斯、支持向量机、BP神经网络、懒惰学习算法、随机森林与自适应增强算法、分类模型选择和结果评价。 这篇先介绍 ...

基于树的建模-完整教程(R & Python)

基于树的建模-完整教程(R & Python)
2016-05-06
基于树的建模-完整教程(R & Python) 基于树的学习算法被认为是最好的方法之一,主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型,它们映射非线性关 ...

机器学习算法需要注意的一些问题

机器学习算法需要注意的一些问题
2016-05-05
机器学习算法需要注意的一些问题 对于机器学习的实际运用,光停留在知道了解的层面还不够,我们需要对实际中容易遇到的一些问题进行深入的挖掘理解。我打算将一些琐碎的知识点做一个整理。 1 数据不平衡问 ...

随机森林(RF, RandomForest)介绍

随机森林(RF, RandomForest)介绍
2016-05-04
随机森林(RF, RandomForest)介绍 随机森林(RF, RandomForest)包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。通过自助法(boot-strap)重采样技术,不断生成训练样本和测试样本 ...
机器学习中的随机森林模型
2016-04-21
机器学习中的随机森林模型 01 树与森林 在构建决策树的时候,可以让树进行完全生长,也可以通过参数控制树的深度或者叶子节点的数量,通常完全生长的树会带来过拟合问题。过拟合一般由数据中的噪声和离群点 ...

OK