cda

数字化人才认证

首页 > 行业图谱 >

python中常用的九种预处理方法分享

python中常用的九种预处理方法分享
2018-07-20
python中常用的九种预处理方法分享 本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍; 1. 标准化(Standardization or Mean Removal and Variance Scaling) 变 ...

机器学习和数据挖掘的联系与区别

机器学习和数据挖掘的联系与区别
2018-07-07
机器学习和数据挖掘的联系与区别 从数据分析的角度来看,数据挖掘与机器学习有很多相似之处,但不同之处也十分明显,例如,数据挖掘并没有机器学习探索人的学习机制这一科学发现任务,数据挖掘中的数据分析是针 ...
R语言之决策树和随机森林
2018-06-16
R语言之决策树和随机森林 总结决策树之前先总结一下特征的生成和选择,因为决策树就是一种内嵌型的特征选择过程,它的特征选择和算法是融合在一起的,不需要额外的特征选择。 一、特征生成: 特征生成是 ...
【北京联科博远教育科技有限公司】招聘数据分析师
2018-05-28
【北京联科博远教育科技有限公司】招聘数据分析师 联科技-让猎头服务触手可及。从一开始就与中国顶级的互联网企业合作,培养了自身专业的能力和独特优势。5年来,秉承规模化、品牌化、专业化、互联网化的发展方向, ...
浅析商业智能的主要研究内容
2018-05-26
浅析商业智能的主要研究内容 BI是以现代管理理论为指导,信息技术为支撑的集成系统。近年来,它的研究热点主要集中在三个方面:支撑技术的研究、体系结构的研究、应用系统的研究。     1.支撑技 ...

Python机器学习算法之k均值聚类(k-means)

Python机器学习算法之k均值聚类(k-means)
2018-05-23
Python机器学习算法之k均值聚类(k-means) 一开始的目的是学习十大挖掘算法(机器学习算法),并用编码实现一遍,但越往后学习,越往后实现编码,越发现自己的编码水平低下,学习能力低。这一个k-means算法用Py ...

教你如何用R进行数据挖掘

教你如何用R进行数据挖掘
2018-05-16
教你如何用R进行数据挖掘 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用 ...

数据挖掘的客户知识管理模型研

数据挖掘的客户知识管理模型研
2018-04-04
数据挖掘的客户知识管理模型研 随着经济全球化和科技信息技术的快速发展。世界进入了一个崭新的知识经济时代。企业所处的竞争环境发生了深刻的变化,原有的市场开始衰落、竞争对手成倍增长、新技术突飞猛进、产 ...

大数据有什么技术,大数据技术内容介绍

大数据有什么技术,大数据技术内容介绍
2018-04-02
大数据有什么技术,大数据技术内容介绍 目前大数据发展一片火热,很多人都听说过大数据,但是对于大数据技术了解并不多,作为一个大数据工程师,经常会被行外人问到,大数据有什么技术。今天就专门写了一篇文章 ...

机器学习解决问题的步骤

机器学习解决问题的步骤
2018-03-20
机器学习解决问题的步骤 针对任何一个打算由机器学习算法来解决的问题,都有一种『套路』存在,只要按照这个模板『按部就班』就能够得到一个结果。就跟一个产品的生产流水线是一个道理。但是得到结果的好坏跟你 ...
机器学习入门报告之 解决问题一般工作流程
2018-03-20
机器学习入门报告之 解决问题一般工作流程 对于给定的数据集和问题,用机器学习的方法解决问题的工作一般分为4个步骤: 一.     数据预处理 首先,必须确保数据的格式符合要求 ...
数据挖掘的数据处理
2018-03-06
数据挖掘的数据处理 从数据本身来考虑,数据挖掘通常需要有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示8个步骤。 步骤(1)信息收集:根 ...

大数据分析整体技术流程及架构

大数据分析整体技术流程及架构
2018-03-02
大数据分析整体技术流程及架构 本文对项目中所用到的大数据分析整体流程技术及其架构进行简要的总结,以供大家在大数据分析平台对数据处理流程更加明确 1.1数据处理流程 该项目是一个纯粹的数据分析项目 ...

大数据处理之道(预处理方法)

大数据处理之道(预处理方法)
2018-02-28
大数据处理之道(预处理方法) 一:为什么要预处理数据? (1)现实世界的数据是肮脏的(不完整,含噪声,不一致) (2)没有高质量的数据,就没有高质量的挖掘结果(高质量的决策必须依赖于高 ...
【上海数道信息科技有限公司】招聘数据分析师
2018-01-23
【上海数道信息科技有限公司】招聘数据分析师 上海数道信息科技有限公司成立于2014年,公司位于浦东张江高科技园区。我们是一群来自于中科院、IBM、SPSS、SKF、TalkingData组成的工业大数据专业团队,专注于工业互联 ...
数据挖掘总结之主成分分析与因子分析
2018-01-12
数据挖掘总结之主成分分析与因子分析 主成分分析与因子分析 1)概念: 主成分分析概念:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。主成分分析(PCA)是一种数据降维技巧,它能 ...
数据分析工作的思考与总结
2017-12-24
数据分析工作的思考与总结 1.什么是数据分析? 基于现有的业务知识和统计学基础知识及基本思想的理解与掌握,通过数据库及统计分析工具对数据的调取与处理、分析,达到对现有问题or主题的探索与剖析,最终 ...
【川北真空科技(北京)有限公司】招聘数据分析师
2017-12-23
【川北真空科技(北京)有限公司】招聘数据分析师 CBVAC品牌创立于2002年。产业隶属于真空行业,是专业从事真空产品研发、设计、生产、销售和服务的综合性高新技术企业。成功研制中国第一台涡旋干式真空泵、中国第一台 ...
数据挖掘笔记-聚类-Canopy-原理与简单实现
2017-12-10
数据挖掘笔记-聚类-Canopy-原理与简单实现 Canopy聚类算法是一个将对象分组到类的简单、快速、精确地方法。每个对象用多维特征空间里的一个点来表示。这个算法使用一个快速近似距离度量和两个距离阈值 T1>T2来 ...

数据分析中非常实用的自编函数和代码模块整理

数据分析中非常实用的自编函数和代码模块整理
2017-12-04
数据分析中非常实用的自编函数和代码模块整理 搞了接近四个周的模型开发工作,今天整理代码文件,评分卡模型基本告一段落了。那么在模型开发或者是我们日常的数据分析工作中,根据我们具体的业务需求,经常会重 ...

OK