cda

数字化人才认证

首页 > 行业图谱 >

机器学习案例实战-信用卡欺诈检测

机器学习案例实战-信用卡欺诈检测
2018-03-29
机器学习案例实战-信用卡欺诈检测 故事背景:原始数据为个人交易记录,但是考虑数据本身的隐私性,已经对原始数据进行了类似PCA的处理,现在已经把特征数据提取好了,接下来的目的就是如何建立模型使得检测的效 ...

人脸识别中常用的几种分类器

人脸识别中常用的几种分类器
2018-03-28
人脸识别中常用的几种分类器 在人脸识别中有几种常用的分类器,一是最邻近分类器;二是线性分类器 (1)最邻近分类器 最近邻分类器是模式识别领域中最常用的分类方法之一,其直观简单,在通常的应用环境 ...

学会数据分析技能让工作更顺心,Python助你步步高升

学会数据分析技能让工作更顺心,Python助你步步高升
2018-03-24
学会数据分析技能让工作更顺心,Python助你步步高升 Python工具中数据分析常用的包和模块 numpy: 数组、 向量、 矩阵、 数值运算等 scipy: 统计推断、 统计检验等 pandas: 数据读取、 数据整合、 ...

矩阵分解在协同过滤推荐算法中的应用

矩阵分解在协同过滤推荐算法中的应用
2018-03-24
矩阵分解在协同过滤推荐算法中的应用 推荐系统是当下越来越热的一个研究问题,无论在学术界还是在工业界都有很多优秀的人才参与其中。近几年举办的推荐系统比赛更是一次又一次地把推荐系统的研究推向了高潮,比 ...

线性代数在机器学习上的基本应用

线性代数在机器学习上的基本应用
2018-03-22
线性代数在机器学习上的基本应用 本人硕渣一枚,之前研究方向为GPU并行计算。现在开始学习机器学习和深度学习。俗话说好记性不如烂笔头。仅以此记录我的学习过程。 线性代数在机器学习方面有着重要的应用, ...

常用的机器学习&数据挖掘知识点

常用的机器学习&数据挖掘知识点
2018-03-07
常用的机器学习&数据挖掘知识点 Basis(基础): MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最 ...

数据预处理--数据降维

数据预处理--数据降维
2018-03-01
数据预处理--数据降维 数据规约产生更小但保持数据完整性的新数据集。在规约后的数据集上进行数据分析和挖掘将更有效率。 机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映 ...

【机器学习】确定最佳聚类数目的10种方法

【机器学习】确定最佳聚类数目的10种方法
2018-02-27
【机器学习】确定最佳聚类数目的10种方法 在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就要你提供聚类数目这个参数,总不能两眼一抹黑乱填一个吧。之前也被这个问题困扰过,看了很多 ...

一些常见的特征选择方法

一些常见的特征选择方法
2018-02-25
一些常见的特征选择方法 现实中产生的特征维度可能很多,特征质量参差不齐,不仅会增加训练过程的时间,也可能会降低模型质量。因此,提取出最具代表性的一部分特征来参与训练就很重要了。 通常有特征 ...

数据预处理的一些知识

数据预处理的一些知识
2018-02-24
数据预处理的一些知识 做研究时只要与数据分析相关就避免不了数据预处理。我们常见的预处理包括:标准化(规范化),归一化,零均值(化),白化,正则化……这些预处理的目的是什么呢?网上查的总是零零散 ...

主成分分析和因子分析及其在R中的…

主成分分析和因子分析及其在R中的…
2018-01-13
主成分分析和因子分析及其在R中的… 主成分分析和探索性因子分析是两种用来探索和简化多变量复杂关系的常用方法,它们之间有联系也有区别。 主成分分析(PCA)是一种数据降维方法,它能将大量相关变量转化为 ...

数据科学的基本内容

数据科学的基本内容
2018-01-08
数据科学的基本内容 什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都 ...

奇异值分解(SVD)原理详解及推导

奇异值分解(SVD)原理详解及推导
2017-12-22
奇异值分解(SVD)原理详解及推导 在网上看到有很多文章介绍SVD的,讲的也都不错,但是感觉还是有需要补充的,特别是关于矩阵和映射之间的对应关系。前段时间看了国外的一篇文章,叫A Singularly Valuable Deco ...

奇异值分解SVD应用——LSI

奇异值分解SVD应用——LSI
2017-12-22
奇异值分解SVD应用——LSI 在自然语言处理中,最常见的两类的分类问题分别是,将文本按主题归类(比如将所有介绍亚运会的新闻归到体育类)和将词汇表中的字词按意思归类(比如将各种体育运动的名称个归成一类) ...

深入浅出,一篇超棒的机器学习入门文章

深入浅出,一篇超棒的机器学习入门文章
2017-12-19
深入浅出,一篇超棒的机器学习入门文章 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇 ...

Python变成编程语言中的黑马,再不学习真晚了

Python变成编程语言中的黑马,再不学习真晚了
2022-01-20
Python变成编程语言中的黑马,再不学习真晚了 GitHub 每年都会在年度盛会中推出数据报告,其中列出了一些年度的数据,包括其网站中最受欢迎的编程语言、开源项目等。今年的数据更是让人眼前一亮,Python 这匹 ...
大话机器学习之数据预处理与数据筛选
2017-12-12
大话机器学习之数据预处理与数据筛选 数据挖掘和机器学习这事,其实大部分时间不是在做算法,而是在弄数据,毕竟算法往往是现成的,改变的余地很小。 数据预处理的目的就是把数据组织成一个标准的形式。 ...

数据工作的科普总结

数据工作的科普总结
2017-11-28
数据工作的科普总结 首先说,这是一篇关于数据工作的科普文字,是我从事数据工作三年的一个小总结,因为不时会有人咨询我一些小问题,于是我大致整理了一下,主要是说了数据工作到底都包含了什么,其中关于数据 ...

数据预处理和挖掘究竟该怎么做

数据预处理和挖掘究竟该怎么做
2017-11-24
数据预处理和挖掘究竟该怎么做 在这个充斥着怀疑和谎言的网络世界中,数据即真相。海量的原始数据正以惊人的速度增长,其中大部分都是非结构化的,但是通过运用分析我们可以发现其中重要的规律和线索以及隐藏在 ...

SPSS最优尺度:分类主成分分析

SPSS最优尺度:分类主成分分析
2017-11-05
SPSS最优尺度:分类主成分分析 一、分类主成分分析(分析-降维-最优尺度) 1、概念:此过程在减少数据维数的同时量化分类变量。分类主成份分析也表示为缩写词CATPCA(代表categorical principal com ...

OK