cda

数字化人才认证

首页 > 行业图谱 >

基于标记数据学习降低误报率的算法优化

基于标记数据学习降低误报率的算法优化
2017-12-30
基于标记数据学习降低误报率的算法优化 无论是基于规则匹配的策略,还是基于复杂的安全分析模型,安全设备产生的告警都存在大量误报,这是一个相当普遍的问题。其中一个重要的原因是每个客户的应用场景和数据都 ...
【易往信息技术(北京)有限公司】招聘数据分析师
2017-12-29
【易往信息技术(北京)有限公司】招聘数据分析师 易往信息技术有限公司是一个集技、工、贸为一体的从事高新技术的高科技企业, 是家专业的制造执行系统供应商。随着公司业务日益发展,公司在上海、北京成立分支机构 ...

如何实现降维处理(R语言)

如何实现降维处理(R语言)
2017-12-07
如何实现降维处理(R语言) 现实世界中数据一般都是复杂和高维的,比如描述一个人,有姓名、年龄、性别、受教育程度、收入、地址、电话等等几十种属性,如此多的属性对于数据分析是一个严重的挑战,除了极大增加 ...

数据科学的基本内容

数据科学的基本内容
2017-10-31
数据科学的基本内容 什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都 ...
运营商自身如何用好大数据
2017-10-18
运营商自身如何用好大数据 大数据时代已经到来,如何更好地发挥数据资产的价值对于电信运营商来说是一个崭新的课题。电信运营商是大数据的传送者、生产者和使用者。在电信运营商为各行各业提供大数据应用时,首 ...

机器学习中的各种相似性、距离度量

机器学习中的各种相似性、距离度量
2017-07-25
机器学习中的各种相似性、距离度量 本文主要关注点在于各个距离、相似度之间的优缺点,及使用时候的注意事项。 1. 闵可夫斯基距离 基本认识 该距离最常用的 p 是 2 和 1, 前者是欧几里得距离(Euc ...
R语言多元分析系列
2017-07-21
R语言多元分析系列 R语言多元分析系列之一:主成分分析 主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一 ...
SPSS函数大全:关于字符串函数
2017-06-30
SPSS函数大全:关于字符串函数 SPSS函数大全:字符串函数 CONCAT(strexpr,strexpr[,...])字符串。返回由其全部参数拼接而成的字符串,对其求出的值必须为字符串。此函数需要两个或更多参数。 ...

机器学习需要哪些数学基础

机器学习需要哪些数学基础
2017-05-20
机器学习需要哪些数学基础 过去的几个月中,有几人联系我,诉说他们对尝试进入数据科学的世界,以及用机器学习的技术去探索统计规律并构建无可挑剔的数据驱动型产品的热忱。然而,我发现一些人实际上缺乏必要的 ...

一行R代码来实现繁琐的可视化

一行R代码来实现繁琐的可视化
2017-05-13
一行R代码来实现繁琐的可视化 ggfortify 是一个简单易用的R软件包,它可以仅仅使用一行代码来对许多受欢迎的R软件包结果进行二维可视化,这让统计学家以及数据科学家省去了许多繁琐和重复的过程,不用对结果进 ...
【新手必备】SAS常用函数整理
2017-04-01
【新手必备】SAS常用函数整理 本文根据网络资源对SAS的常用函数进行了整理。主要内容包括: 1. 数学函数 2. 数组函数 3. 字符函数 4. 日期和时间函数 5. 分布密度函数,分布函数 6. 分位数函 ...

机器学习中使用的神经网络

机器学习中使用的神经网络
2017-03-14
机器学习中使用的神经网络 这一小节介绍随机梯度下降法(stochastic gradient descent)在神经网络中的使用,这里首先回顾了第三讲中介绍的线性神经网络的误差曲面(error surface),如下图所示。线性神经网络对 ...

机器学习中的降维算法:ISOMAP & MDS

机器学习中的降维算法:ISOMAP & MDS
2017-03-11
机器学习中的降维算法:ISOMAP & MDS 降维是机器学习中很有意思的一部分,很多时候它是无监督的,能够更好地刻画数据,对模型效果提升也有帮助,同时在数据可视化中也有着举足轻重的作用。 一说到降维,大家第 ...

非常值得收藏的 IBM SPSS Modeler 算法简介

非常值得收藏的 IBM SPSS Modeler 算法简介
2017-03-08
非常值得收藏的 IBM SPSS Modeler 算法简介 IBM SPSS Modeler 以图形化的界面、简单的拖拽方式来快速构建数据挖掘分析模型著称,它提供了完整的统计挖掘功能,包括来自于统计学、机器学习、人工智能等方面 ...

这一年来,数据科学家都用哪些算法

这一年来,数据科学家都用哪些算法
2017-01-31
这一年来,数据科学家都用哪些算法 在“数据为王”的今天,越来越多的人对数据科学产生了兴趣。数据科学家离不开算法的使用,那么,数据科学家最常用的算法,都是哪些呢? 最近,著名的资料探勘信息网站KDnu ...

聚类分析实战解析与总结

聚类分析实战解析与总结
2016-10-10
聚类分析实战解析与总结 聚类分析是没有给定划分类别的情况下,根据样本相似度进行样本分组的一种方法,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度划分为若干组 ...

SAS市场研究应用介绍:多维尺度分析

SAS市场研究应用介绍:多维尺度分析
2016-09-17
SAS市场研究应用介绍:多维尺度分析 多维尺度概念 市场研究感兴趣的是,消费者在购买产品时是如何做决策的?产品的哪种属性是重要的?是否所有的消费者以同样的方式做决策?如果不是,又是如何不同的?在做出 ...

机器学习算法需要注意的一些问题

机器学习算法需要注意的一些问题
2016-05-05
机器学习算法需要注意的一些问题 对于机器学习的实际运用,光停留在知道了解的层面还不够,我们需要对实际中容易遇到的一些问题进行深入的挖掘理解。我打算将一些琐碎的知识点做一个整理。 1 数据不平衡问 ...

8个经过证实的方法:提高机器学习模型的准确率

8个经过证实的方法:提高机器学习模型的准确率
2016-05-05
8个经过证实的方法:提高机器学习模型的准确率 提升一个模型的表现有时很困难。如果你们曾经纠结于相似的问题,那我相信你们中很多人会同意我的看法。你会尝试所有曾学习过的策略和算法,但模型正确率并没有改 ...
机器学习的认知和算法总结
2016-04-10
机器学习的认知和算法总结 相信不少人都没弄明白机器学习和数据挖掘的区别是什么?其实机器学习并不等同于数据挖掘,数据挖掘更多的是从目标角度去理解数据,然后利用算法建模探索有价值的结论;而机器学习 ...

OK