首页 > 行业图谱 >
- 谷歌微软等科技巨头数据科学岗位面试题(108道)
2017-04-05
-
来自 Glassdoor 的最新数据可以告诉我们各大科技公司最近在招聘面试时最喜欢向候选人提什么问题。首先有一个令人惋惜的结论:根据统计,几乎所有的公司都有着自己的不同风格。由于 Glassdoor 允许匿名提交内容,很 ...

- 从模型选择到超参调整,六步教你如何为机器学习项目选择算法
2017-04-01
-
从模型选择到超参调整,六步教你如何为机器学习项目选择算法
随着机器学习的进一步火热,越来越多的算法已经可以用在许多任务的执行上,并且表现出色。
但是动手之前到底哪个算法可以解决我们特定的实际问 ...

- 论文中的机器学习算法——基于密度峰值的聚类算法
2017-03-21
-
论文中的机器学习算法——基于密度峰值的聚类算法
下面还是主要来谈谈论文的主要思想。
算法的主要思想思想
在聚类算法中主要有这样几种:
划分的方法,如K-Means
...

- SPSS数据分析—多维偏好分析(MPA)
2017-03-13
-
SPSS数据分析—多维偏好分析(MPA)
之前的主成分分析和因子分析中,收集的变量数据都是连续型数值,但有时会碰到分类数据的情况,我们知道最优尺度变换可以对分类变量进行量化处理,如果将这一方法和主 ...

- 机器学习中特征选择概述
2017-03-11
-
机器学习中特征选择概述
1. 背景
1.1 问题
在机器学习的实际应用中,特征数量可能较多,其中可能存在不相关的特征,特征之间也可能存在相关性,容易导致如下的后果:
(1) 特征个数越多,分析特征 ...

- 数据科学家的66个工作面试问题
2017-03-06
-
数据科学家的66个工作面试问题
我们现在有91个问题。我们还添加了50个新的人 在这里,并开始提供这些问题的答案 在这里。这些都是开放式问题,以评估一个高级职位的高级候选人的技术水平知识,例如 ...

- 聚类分析基础知识总结及实战解析
2016-11-28
-
聚类分析基础知识总结及实战解析
聚类分析是没有给定划分类别的情况下,根据样本相似度进行样本分组的一种方法,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度划分 ...
- SPSS Syntax中的常用函数
2016-10-30
-
SPSS Syntax中的常用函数
SPSS函数是一个常用程序(rountine),并且利用一个或多个自变量(参数)来执行。每个SPSS函数均有一个关键名称(keywordname),且绝不能写错。通常,函数的格式为:函数名称(自变量 ...

- 想了解机器学习?你需要知道的十个基础算法
2016-08-18
-
想了解机器学习?你需要知道的十个基础算法
毫无疑问,作为人工智能的子领域—机器学习在过去的几年中越来越受欢迎。由于大数据是目前科技行业最热门的趋势,基于大量的数据机器学习在提前预测和做出建议方面有 ...

- 使用sklearn优雅地进行数据挖掘
2016-08-17
-
使用sklearn优雅地进行数据挖掘
1 使用sklearn进行数据挖掘
1.1 数据挖掘的步骤
数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模 ...

- 用降维方法解读数据分析
2016-07-26
-
用降维方法解读数据分析
随着互联网技术的不断发展,数据呈现出规模大、维度高、结构复杂等特性,人们收集和获得数据的能力也逐渐增强。如何充分利用海量数据、挖掘其中有价值的知识和内容以指导实际生产是科 ...

- 说说你心目中的建模分析师!
2022-01-20
-
说到建模分析师,你可能会臆想到的形象是怎样的?数据民工?金融精英?公司牛人?
他的发型可能是:
秃头
无刘海蓬松长发
他的装束大概是:
双肩背包(你的背包,背到现在还没烂)
...

- 大数据探究经济衰退的到来
2016-05-06
-
大数据探究经济衰退的到来
当今全球经济风起云涌,全球市场普遍不景气,资本缩水,油价下跌严重,诸多大企业纷纷裁员,一时间经济唱衰的声音越来越多。《大数据文摘--商业与金融专栏》今天刊登一篇全球顶级资本 ...

- 机器学习在电商文本挖掘中的应用浅析
2016-04-27
-
机器学习在电商文本挖掘中的应用浅析
电商平台中有海量的非结构化文本数据,如商品描述、用户评论、用户搜索词、用户咨询等。这些文本数据不仅反映了产品特性,也蕴含了用户的需求以及使用反馈。通过深度 ...

- Sas常用函数
2016-04-25
-
Sas常用函数
一、数学函数
ABS(x) 求x的绝对值。
MAX(x1,x2,…,xn) 求所有自变量中的最大一个。
MIN(x1,x2,…,xn) 求所有自变量中的最小一个。
MOD(x,y) 求x除以y的余数。
SQRT ...

- 线性判别分析(Linear Discriminant Analysis, LDA)算法分析
2016-04-24
-
线性判别分析(Linear Discriminant Analysis, LDA)算法分析
一. LDA算法概述:
线性判别式分析(Linear Discriminant Analysis, LDA),也叫做Fisher线性判别(Fisher Linear&nbs ...
- 因子分析和主成分分析的10大不同
2016-04-18
-
每每谈起主成分和因子有啥区别,楼主总是有种心里大概明白,但就是说不清的感觉,终于看到一篇帖子,从十个方面阐述了两者的区别,留作纪念,同时也发给大家做个参考:
1.原理不同
主成 ...

- 一文读懂机器学习!
2016-03-21
-
在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介 ...

- LEVEL II数据挖掘全流程_四大专题,皆为大牛!
2022-01-20
-
CDA Level Ⅱ:建模分析师。两年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证半年以上。在政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。在Leve ...

- 以性别预测为例,谈谈数据挖掘中的分类问题
2016-03-02
-
以性别预测为例,谈谈数据挖掘中的分类问题
互联网的迅猛发展,催生了数据的爆炸式增长。面对海量的数据,如何挖掘数据的价值,成为一个越来越重要的问题。本文首先介绍数据挖掘的基本内容,然后按照数据挖掘 ...