大数据在信息安全方面的应用-CDA数据分析师官网

大数据在信息安全方面的应用

2016-06-03

大数据在信息安全方面的应用

用大数据的方法做信息安全的背景在于，传统的“见招拆招”的安全措施面对灵活多变的攻击手段有些捉襟见肘，但各种攻击手段大多会表现出一定的共性。所以当样本(malware样本，server log，traffic pattern 等等)足够多的时候，只要能正确提取出数据中的feature，就可能找到这些灵活多变的adversary的一些共性行为，以此来作为防御。

下面结合几篇论文结说一下：

1. Malware detection (恶意软件侦测)

恶意软件侦测除了传统的对可执行文件进行分析以外，还可以根据其行为进行侦测。比如赛门铁克(Symantec)搞了一个项目[1]，它的idea就是：你在网上浏(kan)览(pian)时下载了一个恶意软件，它可能会附带一些无害的文件(比如用于伪装)，这种情况下这些文件和这个恶意软件的同时出现 (co-occurrence)的概率就会比较高。当我们通过传统的侦测手段发现了这个恶意软件的时候，和它co-occurrence概率较高的一些文件就会被认为有bad reputation。比如这时你在另一个用户的电脑上发现了一些同样的无害的文件，但没有发现这个恶意软件，那么就认为有可能是这个恶意软件的变种造成的。赛门铁克通过大量用户上传的匿名文件集合(file collection)样本(1亿多台机器上的100多亿个文件)，对文件进行标记(labeling)，训练出了这样一个侦测恶意软件的模型，识别率很高(True Positive在0.99以上)，而且能做到比现有技术手段能提前一周识别。

2. 恶意链接预测

你在上网的时候很可能遇到过钓鱼网站，一般是那种看上去还比较正规但是你一点进去各种被骗输入密码或者个人信息的网站，比如我在知乎上也见到过：这封「知乎团队」的私信可信吗? - Sean 的回答，这个钓鱼站的域名是zhihuemail dot com，点进去你就上当了。怎样预测这样的域名是恶意网站呢?当有用户举报上当受骗时候显然已经晚了，而骇客们也会快速变换域名以躲避侦测。[2] 这篇paper 用大量的DNS记录， IP地址信息，以及域名管理方(whois)的记录，来预测一个域名是否是恶意网站。

3. DDoS检测

DDoS 是各个网站都很头疼的问题，网站流量突然升高，你怎么知道是真的访问用户多了还是骇客通过僵尸网络对你发动的攻击呢?在这么多访问中，你怎么知道哪个是用户哪个是僵尸呢?[3]这篇paper 提出用流量包中的source和destination 的地址，端口号，包的类型等作为feature，采用k-NN算法对其进行分类，来检测DDoS攻击。(当然这个模型比较简单，用于在这里举例比较方便，然而实际上魔高一丈DDoS攻击手段更加多样性，我怀疑这种相对简单的方法能不能真正有效)

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想查询CDA考试成绩，点击>>> “CDA成绩” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想获取CDA考试时间/费用/条件/大纲/通过率，点击 >>>“CDA考试官网” 了解CDA考试详情；

大数据

数据分析咨询请扫描二维码

上一篇大数据揭儿童节消费趋势，超龄儿童也过节

下一篇法律标准与事实标准-八谈大数据时代

大数据在信息安全方面的应用

CDA考试动态

CDA报考指南

热门栏目

最新资讯

数据分析师的工作内容是什么？岗位职责与发展前景 ...

金融数学专业学什么？从理论到实践的全面解析 ...

大数据一般学什么？从入门课程到核心技能全覆盖 ...

数据科学与大数据专业的就业方向与行业需求解析 ...

大数据专业毕业后去哪些岗位就业？高薪机会揭秘 ...

学数据分析需要学什么？课程内容全面解析 ...

学Python能做什么？这些高薪职业等你来 ...

数据分析的常用方法有哪些？详解五大实用技巧 ...

数据分析自学中常见问题

数据挖掘与分析中的机器学习方法

数据分析师应具备的数据可视化能力 ...

数据分析师的沟通能力要求

数字化转型的主要挑战与对策

数据分析师报考条件？怎么学？

数据分析自学的学习计划

数据分析相关职业选择

数据挖掘与分析在金融行业的使用

学习数据挖掘需要掌握哪些技能

统计学就业机会都在哪里

企业数字化转型的关键成功因素