cda

数字化人才认证

首页 > 行业图谱 >

如何成为一名优质的数据科学家
2017-09-05
如何成为一名优质的数据科学家 开随着“数据驱动”的价值越来越明显,越来越多的企事业开始组建或扩大数据分析队伍,“数据科学家”这个职位也越来越被大家关注。 ▪ “数据科学家”是不是“统计师”更 ...

朴素贝叶斯算法的python实现方法

朴素贝叶斯算法的python实现方法
2017-08-20
朴素贝叶斯算法的python实现方法 本文实例讲述了朴素贝叶斯算法的python实现方法。分享给大家供大家参考。具体实现方法如下: 朴素贝叶斯算法优缺点 优点:在数据较少的情况下依然有效,可以处理多类别问 ...

机器学习中的各种相似性、距离度量

机器学习中的各种相似性、距离度量
2017-07-25
机器学习中的各种相似性、距离度量 本文主要关注点在于各个距离、相似度之间的优缺点,及使用时候的注意事项。 1. 闵可夫斯基距离 基本认识 该距离最常用的 p 是 2 和 1, 前者是欧几里得距离(Euc ...

机器学习之Logistic回归与Python实现

机器学习之Logistic回归与Python实现
2017-07-24
机器学习之Logistic回归与Python实现 logistic回归是一种广义的线性回归,通过构造回归函数,利用机器学习来实现分类或者预测。 一 Logistic回归概述 Logistic回归的主要思想是,根据现有的数据对分类边 ...
python绘图:matplotlib和pandas的应用
2017-07-01
python绘图:matplotlib和pandas的应用  在进行数据分析时,绘图是必不可少的模式探索方式。用Python进行数据分析时,matplotlib和pandas是最常用到的两个库。 1、matplotlib库的应用 准备工作如下:打开i ...

Python多进程并行编程实践: mpi4py的使用

Python多进程并行编程实践: mpi4py的使用
2017-05-18
Python多进程并行编程实践: mpi4py的使用 在高性能计算的项目中我们通常都会使用效率更高的编译型的语言例如C、C++、Fortran等,但是由于Python的灵活性和易用性使得它在发展和验证算法方面备受人们的青睐于是 ...

7行Python代码的人脸识别

7行Python代码的人脸识别
2017-04-18
7行Python代码的人脸识别 什么是词云呢?词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思 ...

机器学习中的常见问题—损失函数

机器学习中的常见问题—损失函数
2017-03-28
机器学习中的常见问题—损失函数 一、分类算法中的损失函数 在分类算法中,损失函数通常可以表示成损失项和正则项的和,即有如下的形式: 其中,L(mi(w))为损失项,R(w)为正则项。mi的具体形式如下 ...

机器学习算法实践—K-Means算法与图像分割

机器学习算法实践—K-Means算法与图像分割
2017-03-27
机器学习算法实践—K-Means算法与图像分割 一、理论准备 1.1、图像分割 图像分割是图像处理中的一种方法,图像分割是指将一幅图像分解成若干互不相交区域的集合,其实质可以看成是一种像素的聚类过程。通常使用 ...

使用Python分析纽约出租车搭乘数据

使用Python分析纽约出租车搭乘数据
2017-03-27
使用Python分析纽约出租车搭乘数据 在纽约,出租车分为两类:黄色和绿色。黄色出租(Yellow TAXI)车可以在纽约五大区(布朗克斯区、布鲁克林区、曼哈顿、皇后区、斯塔滕岛)内任何地点搭载乘客。绿色出租车(Gree ...
机器学习-Cross Validation交叉验证Python实现
2017-03-16
机器学习-Cross Validation交叉验证Python实现 1.原理 1.1 概念 交叉验证(cross-validation)主要用于模型训练或建模应用中,如分类预测、pcr、pls回归建模等。在给定的样本空间中,拿出大部分样本作为训练集来 ...

5个开源Python库,点亮你的机器学习之路

5个开源Python库,点亮你的机器学习之路
2017-03-14
5个开源Python库,点亮你的机器学习之路 机器学习令人兴奋,但实际操作却很困难也很复杂。它涉及到很多手动提升,如集合工作流,设置数据源,以及在内部部署与云部署的资源之间切换等。 Python 是一款强大的 ...

机器学习中的降维算法:ISOMAP & MDS

机器学习中的降维算法:ISOMAP & MDS
2017-03-11
机器学习中的降维算法:ISOMAP & MDS 降维是机器学习中很有意思的一部分,很多时候它是无监督的,能够更好地刻画数据,对模型效果提升也有帮助,同时在数据可视化中也有着举足轻重的作用。 一说到降维,大家第 ...

机器学习算法的随机数据生成

机器学习算法的随机数据生成
2016-12-02
机器学习算法的随机数据生成 在学习机器学习算法的过程中,我们经常需要数据来验证算法,调试参数。但是找到一组十分合适某种特定算法类型的数据样本却不那么容易。还好numpy, scikit-learn都提供了随机数据生 ...
【成都易我科技开发有限公司】招聘数据分析师
2016-10-08
【成都易我科技开发有限公司】招聘数据分析师 成都易我科技是一家高速发展的高新软件企业,专业从事数据安全软件服务。公司自2004年成立以来,已成长为全球知名数据安全软件企业,并和多家国外知名企业有紧密合作; ...

如何做好数据分析

如何做好数据分析
2016-09-24
如何做好数据分析 在这里,我将题主的“快速”理解为如何在最短的时间内高效率的成为数据分析师。我想这才是题主的初衷吧! 首先,成为任何一个技术型工作的从业者最需要的就是掌握相关的专业技能,因此也 ...
scikit-learn的主要模块和基本使用
2016-03-22
 scikit-learn的主要模块和基本使用 对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。 在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Py ...

数据科学家和大数据技术人员工具包汇总

数据科学家和大数据技术人员工具包汇总
2016-03-14
本文简介:数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分网址。为数据科学教育和知识分享 ...
【南京振古信息科技有限公司】招聘数据分析师
2016-03-09
【南京振古信息科技有限公司】招聘数据分析师 我们是一家致力于行业数据化业务系统和大数据分析技术研发的创业型公司,目前的业务主要包含两块: 一是行业数据化解决方案和数据驱动系统的开发,帮助客户实现其“数据 ...

七步精通Python机器学习_数据分析师

七步精通Python机器学习_数据分析师
2016-03-03
七步精通Python机器学习_数据分析师 开始。这是最容易令人丧失斗志的两个字。迈出第一步通常最艰难。当可以选择的方向太多时,就更让人两腿发软了。 从哪里开始? 本文旨在通过七个步骤,使用全部免费的 ...

OK