cda

数字化人才认证

首页 > 行业图谱 >

1234567 2/7

CDA Level Ⅲ 数据分析认证考试模拟题库(第一期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第一期)
2021-07-23
不过,在出题前,要公布上一期Level 中146-150题的答案,大家一起来看! 147、A 149、B A.预测准确度 C.模型描述的简洁度 2、下面有关分类算法的准确率,查全率,F1值的描述,错误的是? B.查 ...

数据挖掘中常用的基本降维思路及方法总结

数据挖掘中常用的基本降维思路及方法总结
2021-06-29
来源:数据STUDIO 作者:云朵君 01、降维的意义 降低无效、错误数据对建模的影响,提高建模的准确性。 少量切具有代表性的数据将大幅 ...

CDA LEVEL 1 考试,知识点《机器学习基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2024-10-04
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 二、模型构建流程 既然我们机器学习是借助数学模型理解数学,那么最重要的原材料就是数据了。获取数据 ...
人工智能和大数据的开发过程中需要注意这12点
2018-07-21
人工智能和大数据的开发过程中需要注意这12点 人工智能是近年来科技发展的重要方向,在大数据时代,对数据采集、挖掘、应用的技术越来越受到瞩目。在人工智能和大数据的开发过程中,有哪些特别需要注意的要点? ...

一种面向高维数据的集成聚类算法

一种面向高维数据的集成聚类算法
2018-06-10
一种面向高维数据的集成聚类算法 聚类集成已经成为机器学习的研究热点,它对原始数据集的多个聚类结果进行学习和集成,得到一个能较好地反映数据集内在结构的数据划分。很多学者的研究证明聚类集成能有效 ...
机器学习入门报告之 解决问题一般工作流程
2018-03-20
机器学习入门报告之 解决问题一般工作流程 对于给定的数据集和问题,用机器学习的方法解决问题的工作一般分为4个步骤: 一.     数据预处理 首先,必须确保数据的格式符合要求 ...

数据挖掘十大经典算法之K最近邻算法

数据挖掘十大经典算法之K最近邻算法
2018-01-02
数据挖掘十大经典算法之K最近邻算法 k-最近邻算法是基于实例的学习方法中最基本的,先介绍基于实例学习的相关概念。     基于实例的学习     1.已知一系列的训练样例,很多学习 ...
数据挖掘笔记-聚类-Canopy-原理与简单实现
2017-12-10
数据挖掘笔记-聚类-Canopy-原理与简单实现 Canopy聚类算法是一个将对象分组到类的简单、快速、精确地方法。每个对象用多维特征空间里的一个点来表示。这个算法使用一个快速近似距离度量和两个距离阈值 T1>T2来 ...

在人工智能和大数据产品的开发中,有哪些需要特别注意

在人工智能和大数据产品的开发中,有哪些需要特别注意
2017-11-24
在人工智能和大数据产品的开发中,有哪些需要特别注意 人工智能是近年来科技发展的重要方向,大数据的采集、挖掘、应用的技术越来越受到瞩目。在人工智能和大数据产品的开发过程中,有哪些特别需要注意的要点? ...
SPSS分类分析:最近邻元素分析
2017-11-15
SPSS分类分析:最近邻元素分析 一、最近邻元素分析(分析-分类-最近邻元素) 1、概念:根据个案间的相似性来对个案进行分类。类似个案相互靠近,而不同个案相互远离。因此,通过两个个案之间的距离 ...

如何解决机器学习中数据不平衡问题

如何解决机器学习中数据不平衡问题
2017-07-09
如何解决机器学习中数据不平衡问题 这几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽 ...
R语言中样本平衡的几种方法
2017-06-07
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...

简单易学的机器学习算法—非线性支持向量机

简单易学的机器学习算法—非线性支持向量机
2017-03-21
简单易学的机器学习算法—非线性支持向量机 一、回顾 介绍了支持向量机的基本概念,线性可分支持向量机的原理以及线性支持向量机的原理,线性可分支持向量机是线性支持向量机的基础。对于线性支持向量机,选择 ...

简单易学的机器学习算法—线性支持向量机

简单易学的机器学习算法—线性支持向量机
2017-03-21
简单易学的机器学习算法—线性支持向量机 一、线性支持向量机的概念     线性支持向量机是针对线性不可分的数据集的,这样的数据集可以通过近似可分的方法实现分类。对于这样的数据集,类似 ...

机器学习中的kNN算法及Matlab实例

机器学习中的kNN算法及Matlab实例
2017-03-18
机器学习中的kNN算法及Matlab实例 K最近邻(k-Nearest  Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即 ...

机器学习:决策树(Decision Tree)

机器学习:决策树(Decision Tree)
2017-03-11
机器学习:决策树(Decision Tree) 决策树(decision tree)是一种基本的分类与回归方法。在分类问题中,它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。在学习时,利 ...
数据挖掘分类方法小结
2016-07-31
数据挖掘分类方法小结 数据仓库,数据库或者其它信息库中隐藏着许多可以为商业、科研等活动的决策提供所需要的知识。分类与预测是两种数据分析形式,它们可以用来抽取能够描述重要数据集合或预测未来数据趋势的 ...

基于机器学习的高价值用户自动发现

基于机器学习的高价值用户自动发现
2016-06-05
基于机器学习的高价值用户自动发现 自2014年起,猎聘建立全球职业发展中心(Global Career Develop Center, 简称GCDC),同时服务企业和求职者,作为两者互动的桥梁发挥着重要的作用。不同于其他互联网招聘企业, ...

机器学习算法需要注意的一些问题

机器学习算法需要注意的一些问题
2016-05-05
机器学习算法需要注意的一些问题 对于机器学习的实际运用,光停留在知道了解的层面还不够,我们需要对实际中容易遇到的一些问题进行深入的挖掘理解。我打算将一些琐碎的知识点做一个整理。 1 数据不平衡问 ...

机器学习—海量数据挖掘解决方案

机器学习—海量数据挖掘解决方案
2016-04-12
机器学习—海量数据挖掘解决方案 大数据时代里,互联网用户每天都会直接或间接使用到大数据技术的成果,直接面向用户的比如搜索引擎的排序结果,间接影响用户的比如网络游戏的流失用户预测、支付平台的欺 ...
1234567 2/7

OK