cda

数字化人才认证

首页 > 行业图谱 >

数据挖掘工程师的面试问题与答题思路

数据挖掘工程师的面试问题与答题思路
2016-10-16
数据挖掘工程师的面试问题与答题思路 机器学习、大数据相关岗位根据业务的不同,岗位职责大概分为: 1、平台搭建类 数据计算平台搭建,基础算法实现,当然,要求支持大样本量、高维度数据,所以可能 ...

你应该知道的7种类型的回归技术!

你应该知道的7种类型的回归技术!
2016-10-11
你应该知道的7种类型的回归技术! 回归分析是建模和分析数据的重要工具。本文解释了回归分析的内涵及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回 ...

多元线性回归实战笔记

多元线性回归实战笔记
2016-10-01
多元线性回归实战笔记 R语言中的线性回归函数比较简单,就是lm(),比较复杂的是对线性模型的诊断和调整。这里结合Statistical Learning和杜克大学的Data Analysis and Statistical Inference的章节以及《R语言 ...

数据分析不得不知的七种回归分析技术

数据分析不得不知的七种回归分析技术
2016-09-30
数据分析不得不知的七种回归分析技术 回归分析技术是一种非常重要的数据分析方法,有着广泛的应用,能够解决目标变量为连续的预测分析问题。 什么是回归分析? 回归分析是一种预测性的建模技术,它研究的 ...

2017校招数据分析岗笔试/面试知识点

2017校招数据分析岗笔试/面试知识点
2016-09-26
2017校招正在火热的进行,后面会不断更新涉及到的相关知识点。 尽管听说今年几个大互联网公司招的人超少,但好像哪一年都说是就业困难,能够进去当然最好,不能进去是不是应该也抱着好的期望去找自己满意的呢? 最 ...

用R语言实现对不平衡数据的四种处理方法

用R语言实现对不平衡数据的四种处理方法
2016-09-07
用R语言实现对不平衡数据的四种处理方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。那么,这种结果是为何发生的呢?到底是什 ...

如果会用数据挖掘,对业务和用户的理解会更上层楼

如果会用数据挖掘,对业务和用户的理解会更上层楼
2016-08-07
如果会用数据挖掘,对业务和用户的理解会更上层楼 数据挖掘的特点;数据挖掘可以做哪些事情、有什么应用价值;要发挥数据的价值,你们应该怎么与数据挖掘岗协作,你们不可替代的价值在哪里。文章有点长,良心 ...

常见机器学习算法比较

常见机器学习算法比较
2016-07-11
常见机器学习算法比较 机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择 ...

数据挖掘工程师笔试及答案整理

数据挖掘工程师笔试及答案整理
2021-02-03
数据挖掘工程师笔试及答案整理 2013百度校园招聘数据挖掘工程师 《数据分析专项练习题库》 《CDA数据分析认证考试模拟题库》 《企业数据分析面试题库》 一、简答题(30分) 1、简述数据 ...

R实现多元线性回归分析!

R实现多元线性回归分析!
2016-06-20
R中的线性回归函数比较简单,就是lm(),比较复杂的是对线性模型的诊断和调整。这里结合Statistical Learning和杜克大学的Data Analysis and Statistical Inference的章节以及《R语言实战》的OLS(Ordinary Least Squa ...

机器学习实践中应避免的7种常见错误

机器学习实践中应避免的7种常见错误
2016-06-02
机器学习实践中应避免的7种常见错误 在机器学习领域,每个给定的建模问题都存在几十种解法,本文作者认为,模型算法的假设并不一定适用于手头的数据;在追求模型最佳性能时,重要的是选择适合数据集(尤其是“ ...

决策树算法真的越复杂越好吗?

决策树算法真的越复杂越好吗?
2016-05-25
决策树算法真的越复杂越好吗? 凡是在统计分析或机器学习领域从业的朋友们,对决策树这个名词肯定都不陌生吧。 决策树是一种解决分类问题的绝好方法,顾名思义,它正像一棵大树一样,由根部不断生长出很多 ...

你应该掌握的七种回归技术

你应该掌握的七种回归技术
2016-05-05
你应该掌握的七种回归技术 回归分析是建模和分析数据的重要工具。本文解释了回归分析的内涵及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回归等七种 ...

算法 | K-Means聚类算法的原理及实现

算法 | K-Means聚类算法的原理及实现
2016-04-27
K-Means是聚类算法中的一种,其中K表示类别数,Means表示均值。顾名思义K-Means是一种通过均值对数据点进行聚类的算法。K-Means算法通过预先设定的K值及每个类别的初始质心对相似的数据点进行划分。并通过划分后的均 ...

基于树的建模-完整教程(R & Python)

基于树的建模-完整教程(R & Python)
2016-04-21
基于树的建模-完整教程(R & Python) 基于树的学习算法被认为是最好的方法之一,主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型,它们映射非线性关 ...

WePay机器学习反欺诈实践:Python+scikit-learn+随机森林

WePay机器学习反欺诈实践:Python+scikit-learn+随机森林
2016-04-20
WePay机器学习反欺诈实践:Python+scikit-learn+随机森林 什么是shell selling? 虽然欺诈几乎涉及各种领域,但相对于传统的买方或卖方仅仅担心对方是否是骗子,支付平台需要担心的是交易双方。如果其中任何 ...

如何利用机器学习进行海量数据挖掘

如何利用机器学习进行海量数据挖掘
2016-04-20
互联网的海量数据不可能靠人工一个个处理,只能依靠计算机批量处理。最初的做法是人为设定好一些规则,由机器来执行。但特征一多规则就很难制定,即使定下了规则也没法根据实际情况灵活变化。机器学习可以很好的解决 ...

美团实例详解机器学习如何解决问题

美团实例详解机器学习如何解决问题
2016-04-06
前言:随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的 ...
解密 : 从互联网巨头数据挖掘类招聘笔试题目看我们还差多少知识
2016-04-02
1 从阿里数据分析师笔试看职业要求 以下试题是来自阿里巴巴招募实习生的一次笔试题,从笔试题的几个要求我们一起来看看数据分析的职业要求。 一、异常值是指什么?请列举1种识别连续型变量异常值的方法? 异常值( ...

详细解读如何构建专家诊病模型

详细解读如何构建专家诊病模型
2016-03-24
专家系统是典型的大数据和人工智能结合的计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。也就是说,专家系统是一个具有大量 ...

OK