总结一下我读过的机器学习/数据挖掘/数据分析方面的书,有的适合入门,有的适合进阶,没有按照层次排列,先总结一下,等总结的差不多了再根据入门--->进阶分块写。下面列的书基本上我写的都是读完过的,不然不敢写,怕误人子弟 = =
///数据分析篇
实习的时候只会Matlab,公司小,没钱买正版,所以领导要我两星期把R学会,当时看的有这些书
1.R语言实战
https://book.douban.com/subject/20382244/
评价:很好的入门书,从安装、入门、基本的统计分析,作图命令,以及常见的分类、回归、降维等方法都有写
推荐指数:★★★★★
2.数据分析-R语言实战
https://book.douban.com/subject/25953866/
评价:专门用R语言写的数据分析的书,掌握R的基础后可以看看,侧重数据分析的基本方法,介绍了一些常见的分析方法,比较基础。
推荐指数:★★★★☆
3.探索性数据分析
https://book.douban.com/subject/1551897/
评价:外国人写的书,但是翻译真的太烂了。而且内容其实没什么干货啊,关于分位数、展布等这些概念直接找本统计学的教材看看吧。
推荐指数:★★★☆
4.R语言编程艺术
https://book.douban.com/subject/24699632/
评价:在图书馆意外发现了这本好书,对于R中的数据结构和性能提升讲的不错。
推荐指数:★★★★
5.利用Python进行数据分析
https://book.douban.com/subject/25779298/
评价:这本书是pandas模块的作者写的书,一句话总结:Pandas使用手册。如果用Python做数据分析,基本上Pandas是必不可少的包。
推荐指数:★★★★
1.大数据时代的R语言 数据挖掘:R语言实战
https://book.douban.com/subject/25901568/
评价:和上面的“数据分析-R语言实战”好像是一个系列的,基本上常见的数据挖掘方法都介绍了,有理论有实例,适合入门。
推荐指数:★★★★
2.数据挖掘概念与技术
https://book.douban.com/subject/2038599/
评价:入门书,理论多,好像是很多研究生学数据挖掘的教材,很详细,孟小峰老师的翻译还是不错的,相对很多翻译很烂的还是可以的。
推荐指数:★★★★
3.机器学习实战
https://book.douban.com/subject/24703171/
评价:Python写的,没有Python基础的话还是先学学Python吧,基本上都是实例为主,代码很详细,讲的也很通俗易懂,github上可以下载代码
推荐指数:★★★★★
4.集体智慧编程
https://book.douban.com/subject/3288908/
评价:和机器学习实战一起看的,也基本上都是实例,翻译的也可以,比“探索性数据分析”的翻译好多了!!有代码,可以实操,基本上真正掌握了可以应对一般的数据挖掘的需求了。
推荐指数:★★★★★
5.统计学习方法
https://book.douban.com/subject/10590856/
评价:李航博士写的机器学习常见算法的数学推导,讲的算是比较详细了,对于有数学基础的还是很好理解的,如果没有数学基础,可以先看看数分高代凸优化之类的书再看。适合有一定基础的学习。
推荐指数:★★★★★
6.推荐系统实战
https://book.douban.com/subject/10769749/
评价:看名字就知道是讲推荐系统的,对于不知道推荐系统是啥的可以好好看看,看完基本上了解推荐系统的大概框架和流程,也有一些例子,但是每个例子以及理论都讲的很浅,没有深入,只适合入门。
推荐指数:★★★★
7.数据挖掘导论
https://book.douban.com/subject/5377669/
评价:实习的同事本科时上课的教材,也是一部大巨头啊,外国人写的书,很通俗易懂,非常非常详细。
推荐指数:★★★★
以下是关于hadoop/Python/Spark的书,以及一些比较不错的论文。
8.Spark快速大数据分析
https://book.douban.com/subject/26616244/
评价:8.4/10,很薄的一本书,主要介绍的Spark的基本语法命令之类的,适合快速入门,Learning Spark的中文版
推荐指数:★★★★★
9.Spark高级数据分析
https://book.douban.com/subject/26647951/
评价:豆瓣上评价很少,但是我买回来看了以后发现还是不错的,基本上从分类,聚类,推荐,征信这几块都有实例讲解,比较详细,看的也很快,上手不错。
推荐指数:★★★★★
10.Hadoop权威指南
https://book.douban.com/subject/6523762/
评价:7.8/10,很厚,Hadoop讲的很深,不太适合入门,适合做数据仓库的人看,数据挖掘的可以先看看hadoop实战
推荐指数:★★★
11.Hadoop实战
https://book.douban.com/subject/20275953/
评价:7.0/10,我看的是国内的一个教授写的,并不是“Hadoop in anction”的中文译本,这个写的很浅,适合入门,但是感觉还是Hadoop in action 写的好一些
推荐指数:★★★☆
12.Hive编程指南
https://book.douban.com/subject/25791255/
评价:7.4/10 ,讲Hive操作的,讲真,如果真的只想了解下hive怎么操作,可以不用看这本书,直接去搜一下hive编程命令集合就可以了,这本书比较适合ETL的人,如果只是数据挖掘入门入门的话可以暂时先不用看这本书。但是书本身讲的还是很好的
推荐指数:★★★★
13.R语言与网站分析
https://book.douban.com/subject/25854151/
评价:7.4/10,本来只是去国图偶然看到的一本书,但是看了几章后觉得讲的挺清晰,而且后面的实例讲的挺好的,就去亚马逊上买了kindle电子书,关联规则和社群分析讲的都挺不错的,看的特别快。
推荐指数:★★★★
14.R的极客理想工具篇
https://book.douban.com/subject/25962666/
评价:7.5/10,作者是张丹,最开始是关注他的博客,写的很清晰,步骤也很明确,对于学习R的人来说是个不错的学习地方。这本书后面几张讲的主要是R的性能、以及数据库、hadoop、hive结合起来做的方法,值得一看。
推荐指数:★★★★
15.Mysql必知必会
https://book.douban.com/subject/3354490/
评价:8.4/10,不多说,入门Mysql必读书,很薄的一本小册子。
推荐指数:★★★★★
16.高性能MySQL
https://book.douban.com/subject/4241826/
评价:8.7/10,专业级的MySQL书籍,适合进阶,但是中文翻译很烂,买英文版英文版英文版
推荐指数:★★(还有三颗星给了英文版)
17.凸优化
https://book.douban.com/subject/21249088/
评价:9.4/10,很好的教材,而且很全,之前上数值分析这门课学的很多内容都包含在里面了,机器学习的很多概念也可以在里面找到,读完可以让你更深入的理解机器学习,而不是仅仅只会套用包。
推荐指数:★★★★★
18.Pattern Recognition and Machine Learning
https://book.douban.com/subject/2061116/
评价:9.6/10,PRML是机器学习的经典教材啊,非常值得看!有人翻译了中文版的,如果需要的话可以留言我把链接发出来~
推荐指数:★★★★★
19.统计自然语言处理
https://book.douban.com/subject/25746399/
评价:8.8/10,做自然语言处理的入门书,书很厚,但是讲的很多概念性的东西,却一点也不觉得枯燥,唯一的缺点就是,大概因为是经典教材类的书,所以实例比较少,有点像综述,大而全,如果想实战,可以看看Python写的一本自然语言处理的书,nltk,忘记叫啥名了,想起来了贴上来(评论里有人补充了,贴一个,Natural Language Processing with Python https://book.douban.com/subject/3696989/)
推荐指数:★★★★
20.机器学习
https://book.douban.com/subject/26708119/
评价:上次居然忘了写这本书,周志华老师的新书,公式推导很详细,豆瓣评分9.2,周老师在讲数据挖掘的算法之前先讲了如何评估算法的效果与选择,可以宏观的了解机器学习一些基础知识,在之后学习算法的时候对于它们的适用场景也会有个大概的了解。作者的思路很清晰,强烈推荐啊!!
推荐指数:★★★★★
再推荐几本科普书,业余可以看看提升下兴趣
· 从0到1
· 大数据时代
· 浪潮之巅
· 数学之美
· 数据之巅
本文由CDA作者库成员Charlotte原创,并授权发布。转载请获得授权并注明来源
原文:http://www.cnblogs.com/charlotte77/p/5381681.html
CDA作者库凝聚原创力量,只做更有价值的分享。
如果你也想推荐优质文章,请微信添加trasn863为好友,或发送邮件至songpeiyang@pinggu.org
CDA数据分析师考试相关入口一览(建议收藏):
▷ 想报名CDA认证考试,点击>>>
“CDA报名”
了解CDA考试详情;
▷ 想加入CDA考试题库,点击>>> “CDA题库” 了解CDA考试详情;
▷ 想学习CDA考试教材,点击>>> “CDA教材” 了解CDA考试详情;
▷ 想查询CDA考试成绩,点击>>> “CDA成绩” 了解CDA考试详情;
▷ 想了解CDA考试含金量,点击>>> “CDA含金量” 了解CDA考试详情;
▷ 想获取CDA考试时间/费用/条件/大纲/通过率,点击 >>>“CDA考试官网” 了解CDA考试详情;