一年以前,我还只是一个没有任何编程经验的技术宅。在试着上了一些在线课程之后,我深受启发,接着决定开始学习加拿大最好的计算机科学课程之一。
两周后,我意识到我可以通过 edX ,Coursera 和 Udacity 来学习我需要的一切知识,并且更快、更有效、成本更低。所以我退学了。
在不久之后,我开始通过使用在线课程创建自己专属的数据科学硕士学位。并且制定了一份数据科学编程方向的课程清单,其中很多课程我已经上过,其他课程均根据网站评分和评论等进行了筛选。
对于该系列的第一篇,我为数据科学初学者推荐了一些编程课程(想学习数据科学?我们整理了一份优质编程入门课程清单)。接着是统计和概率类课程(数据科学优质课程推荐#2:统计入门课程篇)。然后是数据科学导论,以及数据可视化课程。机器学习是第五个篇课题推荐。本篇是该系列的总结篇。
以下是对之前所有课程推荐的总结,以及其他13个补充主题
对于本系列的其他课程推荐,每一个我都花了几个小时找寻有关该主题的所以每个在线课程,并从其大纲和评论中提取关键信息,结合课程评分。我的目标是推荐每个主题的三个最优课程。
关于13个补充主题(如数据库,大数据和通用软件工程)没有足够的课程。但是在过去的八个月里,我搜集了尽可能多的该类课程。同时也补充了可能错过的课程。
除了开源的 Class Central 社区和它数以千计的课程评分及评论的数据库,我没有借助其他任何帮助。
自 2011 年以来, Class Central 的创始人 Dhawal Shah 一直密切的关注着在线课程。 在 Dhawal 的帮助下,我列出了这份课程清单。
如何选择课程
该系列每个课程指南中的课程必须符合一些标准。除去特定标准,每片指南有两个通用的标准:
1.它必须可以随时学习或每几个月可以学习。
2.必须是可互动的在线课程,不能仅提供书本或文本教程。
虽然这些都是可行的学习方法,但本指南的重点是课程。严格意义上的视频课程(即没有测验,作业等)也被排除在外。
我们尽力涵盖符合上述标准的所有课程。如果我们错过了一些课程,请给我们留言。
如何评估课程
我们从 Class Central 以及其他评论网站整合了课程的平均评分和评论数量。然后计算每个课程的综合评分。同时根据具体课程评论,并使用此反馈来补充课程评分。
我们根据每个学科的各种特定因素制定了评估大纲。例如,编程导论课程的标准:
1.课程对编程基础的覆盖面。
2.对编程中更先进但实用课题的覆盖面。
3.教学大纲与数据科学的相关度。
以下是每个主题对应的最佳课程。从而构成了一个全面的数据科学课程推荐。
主题#1:编程入门
学习编程:基本原理(LPT1)和制作质量代码(LPT2)
(多伦多大学,Coursera)
多伦多大学的该系列课程为初级数据科学家提供了难度和范围适宜的内容。课程使用 Python ,该系列课程有 284 条评论,综合评分为 4.71 。
通过Python学习交互式编程入门(Part1)(Part2)
(莱斯大学,Coursera)
莱斯大学的Python系列交互式编程包括两个最好的在线课程。课程倾向于游戏和互动应用程序,这在数据科学中不太适用。该系列课程有 6,069 条评论,综合评分为 4.93 。
R 语言编程轨迹
(DataCamp)
如果你正在学习 R 语言,该课程有效地结合了编程基础知识和 R 语言语法指令。该课程有 14 条评论,综合评分为 4.29 。
主题#2:统计与概率
数据分析的基础-Part1:使用 R 语言进行统计和Part2:推理统计
(德克萨斯大学奥斯丁分校,edX)
在 UT Austin 的数据分析系统基础课程中,该课程是少数几个具有高评价,同时教授统计和概率,着力于编程示例的课程。该课程有 28 条评论,综合评分为 4.61 。
统计数据与 R 语言专业化
(杜克大学,Coursera)
该系列分为五个课程,具有全面的教学大纲,全面的介绍概率。该系列课程有 60 条评论,综合评分为 4.77 。
概率导论——科学的不确定性
(麻省理工学院(MIT),edX)
该课程目前在统计学和概率课程推荐中评分最高。该课程比大多数 MOOC 课程更长(15周)同时更具挑战性。该课程有 38 条评论,综合评分为 4.82 。
主题#3:数据科学入门
数据科学A—Z™:包括实际数据科学练习
(Kirill Eremenko,SuperDataScience团队,Udemy )
该课程在教授数据科学的广度和深度方面表现优异。讲师的教学能力出众。该课程有 5,078 条评论,综合评分为 4.5 。
数据分析入门
(Udacity )
该课程使用 Python ,涵盖了的数据科学过程。该课程有 2 条评论,综合评分为 5 。
数据科学基础
(Big Data University)
课程涵盖了完整的数据科学过程,并介绍了 Python,R 语言和其他几个开源工具。分析用的评论网站上没有关于本课程的评论。
主题#4:数据可视化
数据可视化与 Tableau 专业化
(加利福尼亚大学戴维斯分校,Coursera)
该课程深入介绍了可视化理论。通过演练和最终项目提供使用 Tableau 练习的机会。该课程有 2 条评论,综合评分为 4 。
数据可视化与 ggplot2 系列
(DataCamp)
该课程涵盖了大量的理论,并得到 ggplot2 创建者 Hadley 韦翰的支持。课程完成后你会很好掌握关于 R 语言及其句法。分析用的评论网站上没有关于本课程的评论。
Tableau 10 系列(Tableau 10 A-Z和 Tableau 10 进阶训练)
(Kirill Eremenko,SuperDataScience 团队,Udemy)
该系列课程主要侧重于工具覆盖(Tableau),而不是数据可视化理论。这两个课程共有 3,724 条评论,综合评分为 4.6 。
主题#5:机器学习
机器学习
(斯坦福大学,Coursera )
课程讲师为 Google Brain 创始人,百度前首席科学家吴恩达。课程涵盖了机器学习工作流程的所有方面和几种算法。使用 MATLAB 和 Octave,课程有 422 条评论,综合评分为 4.7 。
机器学习
(哥伦比亚大学,edX )
与斯坦福大学相比,该课程是一门更新的课程。本课程的作业可以用 Python、MATLAB 或 Octave完成。该课程有 10 条评论,综合评分为 4.8 。
机器学习A-Z™:使用 Python 和 R 语言进行数据科学实践
(Kirill Eremenko,Hadelin de Ponteves,Udemy)
该课程提供了令人印象深刻的详细教程,并且使用 Python 和 R 语言教学,这在其他顶级课程中是罕见的。该课程有 8,119 条评论,综合评分为 4.5 。
主题#6:深度学习
使用 TensorFlow 学习深度学习的创造性应用
(Kadenze)
Parag Mital 在深度学习方面的创造性应用为技术学科增添了独特的转折性。“创造性应用”是鼓舞人心的,这门课程是专业制作的。课程使用 Python ,该课程有 16 条评论,综合评分为 4.75。
机器学习的神经网络
(多伦多大学,Coursera )
Geoffrey Hinton 称为“深度学习的教父”,他在人工神经网络方面的研究享誉国际。他的机器学习神经网络是一门进阶课程。课程使用 Python ,有 35 条评论,综合评分为 4.11。
深度学习A-Z™:人工神经网络实践
(Kirill Eremenko,Hadelin de Ponteves,Udemy )
该课程介绍了深度学习基础知识,Kirill Eremenko 提供了直观的解释,Hadelin de Ponteves 进行了代码演示。课程使用 Python ,有 1,314 条评论,综合评分为 4.6。
以下是数据科学方面相关的补充主题
Python 及其工具
Python 编程追踪,以及其他 pandas 课程(DataCamp):
• pandas 基础
• 用 pandas 操纵数据帧
• 用 pandas 合并数据帧
DataCamp的重视代码的教学风格和浏览器内置编程环境非常适合学习语法。其Python课程有 14 条评论,综合评分为 4.64。Udacity的数据分析入门课程,也包含 NumPy 和 panda 内容也是数据科学入门课程的推荐之一。
R 语言及其工具
R 语言编程追踪,以及相关 dplyr 和 data.table 课程(DataCamp):
• 使用 R 语言的 dplyr 进行数据处理
• 使用 R 语言的 dplyr 连接数据
• 通过 data.table 方式 用 R 语言进行数据分析
该课程有效地结合了编程基础知识和 R 语言语法。该课程有 14 条评论,综合评分为 4.29。
数据库和SQL
数据库导论
(斯坦福大学, 斯坦福OpenEdx)
该课程全面介绍数据库理论,同时引入了几个开源工具。编程练习很具挑战性。该课程有 59 条评论,综合评分为 4.61。
数据准备
导入和清除数据追踪(DataCamp):
• 使用 Python 轨道导入和清除数据
• 使用 R 语言 轨道导入和清除数据
该系列课程擅长教授为分析和/或可视化准备数据的机制。分析用的评论网站上没有关于本课程的评论。
探索性数据分析
使用 R 语言进行数据分析
(Udacity,Facebook)
该课程对探索性数据分析进行了。对Facebook的数据科学家进行的专家访谈是富有洞察力和鼓舞人心的。同时还可以作为对 R 语言的简单介绍。该课程有 19 条评论,综合评分为 4.58。
大数据
终极实践Hadoop - 驯服你的大数据!以及其他相关工具课程(Frank Kane,Udemy):
• 使用 Apache Spark 和 Python 驯服大数据 - 实践!
• 使用 MapReduce 和 Hadoop 驯服大数据 - 实践!
• Apache Spark 2.0 与 Scala - 大数据交流!
• 使用 Spark Streaming 和 Scala 驯服大数据 - 实践!
Frank Kane的大数据系列课程教授了所有最受欢迎的大数据技术,其中包括超过 25 个“终极”课程。Kane 分享了他在亚马逊和IMDb分享系统工作十年的经验知识。总共这些课程有 6,932 条评论,综合评分为 4.52。
软件技能
软件测试 (Udacity)
软件调试 (Udacity)
版本控制与Git 和 GitHub协作(Udacity) (更新到如何使用Git&GitHub课程)
软件技能是数据科学教育的一个经常被忽视的部分。Udacity的测试、调试和版本控制课程介绍了与代码相关的三个核心主题。总共这些课程有 68 条评论,综合评分为 4.34。佐治亚理工学院和Udacity有一个新的课程,包括软件测试和调试,尽管它更先进,但不完全与数据科学家相关。
其他
建立数据科学团队
(约翰霍普金斯大学 , Coursera)
学会如何学习:强大的心里工具帮助你掌握难题
(Barbara Oakley 博士,加州大学圣地亚哥分校,Coursera)
思维转移:突破学习障碍,发掘潜在潜能
(Barbara Oakley 博士,麦克马斯特大学,Coursera)
约翰霍普金斯大学的课程在建设数据科学团队的实践中提供了有用的探索。这是一门非常短的课程,可以在几个小时内完成,并免费审核。忽略其有 12 条评论,综合评分为 3.41,其中一些可能来自付费客户。
Barbara Oakley 博士的这两门课程本身并不是数据科学课程。“学会如何学习”是最受欢迎的在线课程,包括通过研究的实践从而以最有效地掌握难题,以及记忆技术和处理拖延。在“思维转移”中,她展示了如何充分利用在线学习和MOOC课程,如何寻求并与导师一起工作,以及避免生活中的职业路线和一般路线的秘密。这是每个人都应该参加的两门课程。课程分别有 959 和 407 条评论,综合评分为 4.74 和 4.87。
结语
本文是六部曲系列的最后一篇文章,介绍了进入数据科学领域的最佳在线课程。第一篇文章介绍了编程(想学习数据科学?我们整理了一份优质编程入门课程清单),第二篇介绍了统计和概率(数据科学优质课程推荐#2:统计入门课程篇),第三篇介绍了数据科学入门课程,第四篇介绍了数据可视化,第五篇介绍了机器学习相关课程。
ref:
https://medium.freecodecamp.com/the-best-data-science-courses-on-the-internet-ranked-by-your-reviews-6dc5b910ea40
原作者 David Venturi
编译 CDA 编译团队
本文为 CDA 数据分析师原创作品,转载需授权
CDA数据分析师考试相关入口一览(建议收藏):
▷ 想报名CDA认证考试,点击>>>
“CDA报名”
了解CDA考试详情;
▷ 想加入CDA考试题库,点击>>> “CDA题库” 了解CDA考试详情;
▷ 想学习CDA考试教材,点击>>> “CDA教材” 了解CDA考试详情;
▷ 想查询CDA考试成绩,点击>>> “CDA成绩” 了解CDA考试详情;
▷ 想了解CDA考试含金量,点击>>> “CDA含金量” 了解CDA考试详情;
▷ 想获取CDA考试时间/费用/条件/大纲/通过率,点击 >>>“CDA考试官网” 了解CDA考试详情;