首页 > 行业图谱 >
- 机器学习中感知机是什么?如何实现?
- 2020-07-10
-
感知机(Perceptron)或者叫做感知器,是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络,是机器学习领域最基础的模型,被誉为机器学习的敲门砖。
...
- OpenCV入门及应用案例:手把手教你做DNN图像分类
- 2020-07-09
-
作者:吴至文 郭叶军 宗炜 李鹏 赵娟
来源:大数据DT(ID:hzdashuju)
内容摘编自《OpenCV深度学习应用与性能优化实践》
导读:本文将介绍OpenCV的源码结构、OpenCV深度学习应用的典型流程,以及深度学习 ...
- 数据告诉你:辽宁为何会跌落神坛,从无敌队到鱼腩队是郭艾伦的错?
- 2020-07-07
-
CDA数据分析师 出品
作者:泽龙、Mika
数据:真达
后期:泽龙
【导读】
CBA重启开赛,辽宁为什么从冠军队变成鱼腩队?是侄子坑叔,还是亚洲第一控卫变身综艺咖,本期我们用全面的数据证明到底 ...
- python数据清洗时,经常用到的工具有哪几种?
- 2020-07-06
-
数据清洗是整个数据分析过程的第一步,也是整个数据分析项目中最耗费时间的一步,下面小编整理了几种常用的python数据清洗工具,希望对大家有所帮助。
目前在python中, numpy和pandas是最主流的数据清洗工具,N ...
- SVC,NuSVC,LinearSVC有什么区别
- 2020-07-03
-
相信大家在机器学习中,一定常见到;SVC,NvSVC,LinearSVC,今天我们就来看看这三者的区别。
SVC(C-Support Vector Classification):
支持向量分类,基于libsvm实现的,数据拟合的时间复杂度是数据样本的二 ...
- 手把手教你用直方图、饼图和条形图做数据分析(Python代码)
- 2020-06-24
-
导读:对数据进行质量分析以后,接下来可通过绘制图表、计算某些特征量等手段进行数据的特征分析。
作者:张良均 谭立云 刘名军 江建明
来源:大数据DT(ID:hzdashuju)
内容摘编自《Python数据 ...
- 线上服务器崩溃,线下门店破万,社交新宠「剧本杀」是如何迅速爆火的?
- 2020-06-20
-
【导语】:今天我们来聊聊最近的社交游戏新宠--剧本杀,Python技术部分请看第三部分。
Show me data,用数据说话
今天我们聊一聊 剧本杀
如果问,线下聚会可以玩儿什么?狼人杀?密室逃脱?
nonono,说 ...
- pandas数据结构:Series
- 2020-06-16
-
pandas有Series和DataFrame两种数据结构,我们之前已经讲过了DataFrame,接下来给大家介绍下另一种数据结构Series。
什么是Series?
# 自定义Series索引
arr = np.random.rand(5)
s = pd.Series(arr, ind ...
- 交叉验证:评估模型的泛化能力表现
- 2020-06-16
-
注明:本文章所有代码均来自scikit-learn官方网站
在实际情况中,如果一个模型要上线,数据分析员需要反复调试模型,以防止模型仅在已知数据集的表现较好,在未知数据集上的表现较差。即要确保模型的泛化能力 ...
- pandas数据结构:DataFrame
- 2020-06-12
-
刚刚接触pandas的朋友,想了解数据结构,就一定要认识DataFrame,接下来给大家详细介绍!
初识pandas数据结构:DataFrame
import numpy as np
import pandas as pd
data = {\"name\": [\"Jack\", \"Tom\ ...
- 机器学习基础:无监督异常检测和半监督异常检测!
- 2020-06-12
-
异常值检测一般要求新发现的数据是否与现有观测数据具有相同的分布或者不同的分布,相同的分布可以称之为内点(inlier),具有不同分布的点可以称之为离群值。离群点和新奇点检测是不同的,有一个重要的区分必须掌 ...
- 【案例】用支持向量机SVM进行新奇点检测!
- 2020-06-12
-
异常值检测一般要求新发现的数据是否与现有观测数据具有相同的分布或者不同的分布,相同的分布可以称之为内点(inlier),具有不同分布的点可以称之为离群值。
下图是一个使用支持向量机SVM进行新奇点检测 ...
- 机器学习经典算法之k-means聚类
- 2020-06-10
-
K-means算法旨在选择一个质心, 能够最小化惯性或簇内平方和的标准:
K-means算法原理分析
首先随机选取K个初始质心,最基本的方法是从数据集$X$中选择$K$个样本。
将每 ...
- 百闻不如一练:随机森林等可视化调试模型超参数
- 2020-06-10
-
以下使用scikit-learn中数据集进行分享。
如果选用随机森林作为最终的模型,那么找出它的最佳参数可能有1000多种组合的可能,你可以使用使用穷尽的网格搜索(Exhaustive Grid Seaarch)方法,但时间成本将会很 ...
- 层次聚类算法:Affinity Propogation算法学习指南
- 2020-06-10
-
Affinity Propogation最初是由Brendan Frey 和 Delbert Dueck于2007年在Science上提出的。相比其它的层次聚类算法,Affinity Propogation算法不需要预先指定聚类个数。
Affinity Propogation算法的原理可以简单 ...
- python散点图:如何添加拟合线并显示拟合方程与R方?
- 2020-06-08
-
python散点图:如何添加拟合线并显示拟合方程与R方?我们可以使用polyfit()函数,使用最小二乘法将一些点拟合成一条曲线.
numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False)
# x:要拟合点的 ...
- 加快python算法的四个方法:Dask篇
- 2020-06-08
-
CDA数据分析师 出品
相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下python的计算时间,减少大家在算法上的等待 ...
- 加快python算法的四个方法:Numba篇
- 2020-06-09
-
CDA数据分析师 出品
相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下Python的计算时间,减少大家在算法上的等待 ...
- 为什么商界大佬潘石屹也学Python,TA魅力大吗?
- 2020-06-02
-
56岁生日当天,房地产大佬、SOHO中国董事长潘石屹发布了一条微博,表示自己要开始学Python。
很多人以为他只是开玩笑,然而潘石屹本人并不这样认为,至此以后,潘石屹的个人微博时不时会晒出一些Python学习 ...
- Kmeans优化算法:二分K-means聚类算法
- 2020-05-29
-
算法的理解
Bi这里是的意思就是Binary,二进制的意思,所以有时候叫这个算法为二进Kmeans算法。为什么我们需要用BiKmeans呢,就是为了解决初始化k个随机的质心点时其中一个或者多个点由于位置太极端而导致迭代 ...