cda

数字化人才认证

首页 > 行业图谱 >

Python中的缺失值及其处理

Python中的缺失值及其处理
2017-12-01
Python中的缺失值及其处理 缺失值处理用到的主要工具为 Numpy 库和 Pandas库中的有关函数,要导入 Numpy 和 Pandas: >>>import numpy as np >>>import pandas as pd 在 Python 中,特殊的常量 None 通常被 ...

如何为时间序列数据优化K-均值聚类速度

如何为时间序列数据优化K-均值聚类速度
2017-11-24
时间序列数据(Time Series Data)是按时间排序的数据,利率、汇率和股价等都是时间序列数据。时间序列数据的时间间隔可以是分和秒(如高频金融数据),也可以是日、周、月、季度、年以及甚至更大的时间单位。数据分析 ...

 Python数据可视化:Matplotlib 直方图、箱线图、条形图、热图、折线图、散点图。。。

Python数据可视化:Matplotlib 直方图、箱线图、条形图、热图、折线图、散点图。。。
2017-10-26
 Python数据可视化:Matplotlib 直方图、箱线图、条形图、热图、折线图、散点图。。。 使用Python进行数据分析,数据的可视化是数据分析结果最好的展示方式,这里从Analytic Vidhya中找到的相关数据,进 ...

箱形图以及python实践

箱形图以及python实践
2017-10-25
箱形图以及python实践 最近在接触kaggle的竞赛示例,练习了一下,感觉受益匪浅。同时,心中也有个问题。拿到数据之后第一件事是什么?分析数据的情况?怎么分析?分析之后如何去处理数据呢?等等一些数据分析 ...

利用Python和OpenCV库将URL转换为OpenCV格式的方法

利用Python和OpenCV库将URL转换为OpenCV格式的方法
2017-10-04
利用Python和OpenCV库将URL转换为OpenCV格式的方法 过去几个月,有些PyImageSearch读者电邮问我:“如何获取URL指向的图片并将其转换成OpenCV格式(不用将其写入磁盘再读回)”。这篇文章我将展示一下怎么实现 ...

Python+Opencv识别两张相似图片

Python+Opencv识别两张相似图片
2017-10-04
Python+Opencv识别两张相似图片 在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系。 当然了,图像识别这个话题作为计算机科学的一个 ...

python实现逻辑回归的方法示例

python实现逻辑回归的方法示例
2017-10-02
python实现逻辑回归的方法示例 这篇文章主要介绍了python实现逻辑回归的方法示例,这是机器学习课程的一个实验,整理出来共享给大家, 本文实现的原理很简单,优化方法是用的梯度下降。后面有测试结果。 ...
python实现矩阵乘法的方法
2017-09-09
python实现矩阵乘法的方法 本文实例讲述了python实现矩阵乘法的方法。分享给大家供大家参考。具体实现方法如下:  def matrixMul(A, B):   res = [[0] * len(B[0]) for i in range(len(A))]   ...

python实现稀疏矩阵示例代码

python实现稀疏矩阵示例代码
2017-09-09
python实现稀疏矩阵示例代码 工程实践中,多数情况下,大矩阵一般都为稀疏矩阵,所以如何处理稀疏矩阵在实际中就非常重要。本文以Python里中的实现为例,首先来探讨一下稀疏矩阵是如何存储表示的。 1.sparse ...
如何成为一名优质的数据科学家
2017-09-05
如何成为一名优质的数据科学家 开随着“数据驱动”的价值越来越明显,越来越多的企事业开始组建或扩大数据分析队伍,“数据科学家”这个职位也越来越被大家关注。 ▪ “数据科学家”是不是“统计师”更 ...

朴素贝叶斯算法的python实现方法

朴素贝叶斯算法的python实现方法
2017-08-20
朴素贝叶斯算法的python实现方法 本文实例讲述了朴素贝叶斯算法的python实现方法。分享给大家供大家参考。具体实现方法如下: 朴素贝叶斯算法优缺点 优点:在数据较少的情况下依然有效,可以处理多类别问 ...

机器学习中的各种相似性、距离度量

机器学习中的各种相似性、距离度量
2017-07-25
机器学习中的各种相似性、距离度量 本文主要关注点在于各个距离、相似度之间的优缺点,及使用时候的注意事项。 1. 闵可夫斯基距离 基本认识 该距离最常用的 p 是 2 和 1, 前者是欧几里得距离(Euc ...

机器学习之Logistic回归与Python实现

机器学习之Logistic回归与Python实现
2017-07-24
机器学习之Logistic回归与Python实现 logistic回归是一种广义的线性回归,通过构造回归函数,利用机器学习来实现分类或者预测。 一 Logistic回归概述 Logistic回归的主要思想是,根据现有的数据对分类边 ...
python绘图:matplotlib和pandas的应用
2017-07-01
python绘图:matplotlib和pandas的应用  在进行数据分析时,绘图是必不可少的模式探索方式。用Python进行数据分析时,matplotlib和pandas是最常用到的两个库。 1、matplotlib库的应用 准备工作如下:打开i ...

Python多进程并行编程实践: mpi4py的使用

Python多进程并行编程实践: mpi4py的使用
2017-05-18
Python多进程并行编程实践: mpi4py的使用 在高性能计算的项目中我们通常都会使用效率更高的编译型的语言例如C、C++、Fortran等,但是由于Python的灵活性和易用性使得它在发展和验证算法方面备受人们的青睐于是 ...

7行Python代码的人脸识别

7行Python代码的人脸识别
2017-04-18
7行Python代码的人脸识别 什么是词云呢?词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思 ...

机器学习中的常见问题—损失函数

机器学习中的常见问题—损失函数
2017-03-28
机器学习中的常见问题—损失函数 一、分类算法中的损失函数 在分类算法中,损失函数通常可以表示成损失项和正则项的和,即有如下的形式: 其中,L(mi(w))为损失项,R(w)为正则项。mi的具体形式如下 ...

机器学习算法实践—K-Means算法与图像分割

机器学习算法实践—K-Means算法与图像分割
2017-03-27
机器学习算法实践—K-Means算法与图像分割 一、理论准备 1.1、图像分割 图像分割是图像处理中的一种方法,图像分割是指将一幅图像分解成若干互不相交区域的集合,其实质可以看成是一种像素的聚类过程。通常使用 ...

使用Python分析纽约出租车搭乘数据

使用Python分析纽约出租车搭乘数据
2017-03-27
使用Python分析纽约出租车搭乘数据 在纽约,出租车分为两类:黄色和绿色。黄色出租(Yellow TAXI)车可以在纽约五大区(布朗克斯区、布鲁克林区、曼哈顿、皇后区、斯塔滕岛)内任何地点搭载乘客。绿色出租车(Gree ...
机器学习-Cross Validation交叉验证Python实现
2017-03-16
机器学习-Cross Validation交叉验证Python实现 1.原理 1.1 概念 交叉验证(cross-validation)主要用于模型训练或建模应用中,如分类预测、pcr、pls回归建模等。在给定的样本空间中,拿出大部分样本作为训练集来 ...

OK