cda

数字化人才认证

首页 > 行业图谱 >

CDA LEVEL I 数据分析认证考试模拟题库(五)

CDA LEVEL I 数据分析认证考试模拟题库(五)
2024-10-05
不过,在出题前,要公布下上一期16-20题的答案,大家一起来看! 17、D 19、C 你答对了吗? A.这个常数应该包含在常数项 C.应该去除残差 22.分析师小A在对他的模型进行评估时,更倾向选用调整R²作为指标 ...

与线性回归相比,你怎么看生存函数和生存曲线?

与线性回归相比,你怎么看生存函数和生存曲线?
2020-09-30
作者:丁点helper 来源:丁点帮你 前文我们详解过线性回归,也初步介绍了生存分析所涉及的生存数据,明白了:做生存分析最特殊的一点是分析时要纳入研究对象的“生存时间”,更一般的是指:出现某种特 ...

深入浅出|深度学习算法之BP神经网络 详细公式推导

深入浅出|深度学习算法之BP神经网络 详细公式推导
2018-08-29
深入浅出|深度学习算法之BP神经网络 详细公式推导 所谓神经网络,目前用得最广泛的一个定义是“的神经网络是由具有适应性简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所做出 ...

深度学习损失函数

深度学习损失函数
2018-08-24
深度学习损失函数 在利用深度学习模型解决有监督问题时,比如分类、回归、去噪等,我们一般的思路如下: 1、信息流forward propagation,直到输出端; 2、定义损失函数L(x, y | theta); ...
人工智能与机器学习有哪些不同
2018-08-11
人工智能与机器学习有哪些不同 人工智能早已不是一个新名词,它的发展历史已经有几十年。从80年代早期开始,当时计算机科学家设计出可以学习和模仿人类行为的算法。在学习方面,最重要的算法是神经网络,但由于 ...

如何让你的数据直觉更敏锐

如何让你的数据直觉更敏锐
2018-07-30
如何让你的数据直觉更敏锐 每当人工智能和机器学习取得一些进展时,这些进展一定占据着各大媒体的头版头条。 媒体对其有如此高的关注度,这意味着,现在科技界主流的兴趣领域是数据科学。 对于有大局意识 ...
基于R语言的分类算法之决策树
2018-06-14
基于R语言的分类算法之决策树 ID3 《= 最大信息熵增益,只能处理离散型数据 C4.5 《= 信息增益率,可处理连续性和离散型数据,相比ID3,减少了因变量过多导致的过拟合 C5.0 《= 信息增益率,运算性能比C4 ...

从线性回归到无监督学习,数据科学家需要掌握的十大统

从线性回归到无监督学习,数据科学家需要掌握的十大统
2018-06-02
从线性回归到无监督学习,数据科学家需要掌握的十大统 不管你对数据科学持什么态度,都不可能忽略分析、组织和梳理数据的重要性。Glassdoor 网站根据大量雇主和员工的反馈数据制作了「美国最好的 25 个职位」 ...
机器学习中的非均衡分类问题
2018-04-09
机器学习中的非均衡分类问题 非均衡分类问题是指在分类器训练时,正例数目和反例数目不相等(相差很大),或者错分正反例导致的代价不同(可从代价矩阵观测)时存在的问题。 而大多数情况下,不同类别的分类 ...
机器学习中训练集、验证集和测试集的作用
2018-03-27
机器学习中训练集、验证集和测试集的作用 通常,在训练有监督的机器学习模型的时候,会将数据划分为训练集、验证集合测试集,划分比例一般为0.6:0.2:0.2。对原始数据进行三个集合的划分,是为了能够选出效果( ...

机器学习解决问题的步骤

机器学习解决问题的步骤
2018-03-20
机器学习解决问题的步骤 针对任何一个打算由机器学习算法来解决的问题,都有一种『套路』存在,只要按照这个模板『按部就班』就能够得到一个结果。就跟一个产品的生产流水线是一个道理。但是得到结果的好坏跟你 ...
机器学习入门报告之 解决问题一般工作流程
2018-03-20
机器学习入门报告之 解决问题一般工作流程 对于给定的数据集和问题,用机器学习的方法解决问题的工作一般分为4个步骤: 一.     数据预处理 首先,必须确保数据的格式符合要求 ...

如何实现降维处理(R语言)

如何实现降维处理(R语言)
2017-12-07
如何实现降维处理(R语言) 现实世界中数据一般都是复杂和高维的,比如描述一个人,有姓名、年龄、性别、受教育程度、收入、地址、电话等等几十种属性,如此多的属性对于数据分析是一个严重的挑战,除了极大增加 ...

深度学习已成功应用于这三大领域

深度学习已成功应用于这三大领域
2017-11-20
深度学习已成功应用于这三大领域 在本章中,我们将介绍如何使用深度学习来解决计算机视觉、语音识别、自然语言处理以及其他商业领域中的应用。首先我们将讨论在许多最重要的AI 应用中所需的大规模神经网络的实 ...

学会数据分析背后的挖掘思维,分析就完成了一半

学会数据分析背后的挖掘思维,分析就完成了一半
2017-08-09
学会数据分析背后的挖掘思维,分析就完成了一半 在数据分析中,模型是非常有用和有效的工具和数据分析应用的场景,在建立模型的过程中,数据挖掘很多时候能够起到非常显著的作用。伴随着计算机科学的发展,模型也越 ...

R语言与函数估计学习笔记(样条方法)

R语言与函数估计学习笔记(样条方法)
2017-07-20
R语言与函数估计学习笔记(样条方法) 样条估计 如果函数在不同地方有不同的非线性度,或者有多个极值点,那么用多项式特别是低阶多项式来完成拟合是非常不合适的。一种解决办法是我们之前提到的近邻多项式 ...

如何解决机器学习中数据不平衡问题

如何解决机器学习中数据不平衡问题
2017-07-09
如何解决机器学习中数据不平衡问题 这几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽 ...
R语言中样本平衡的几种方法
2017-06-07
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...

R语言-选择“最佳”的回归模型

R语言-选择“最佳”的回归模型
2017-06-03
R语言-选择“最佳”的回归模型 尝试获取一个回归方程时,实际上你就面对着从众多可能的模型中做选择的问题。是不是所有的变量都要包括?抑或去掉那个对预测贡献不显著的变量?还是需要添加多项式项和/或交互项 ...
sas信用评分之不用检查异常值的最优分组
2017-05-29
sas信用评分之不用检查异常值的最优分组 今天的更新比以往晚了一天,假期综合症第一天,我到现在已经喝了第三杯咖啡,实现上周的预告,这种更新一个不用检查异常值的数值变量最优分组。其实这代码我本来不想拿 ...

OK