在机器学习中如何选择一个合适的算法？-CDA数据分析师官网

在机器学习中如何选择一个合适的算法？

2019-05-08

在我们使用机器学习处理问题的时候，我们需要选择算法，选择一个好的算法能够帮助我们提高工作效率。但是很多朋友对选择算法不是很理解，在这篇文章中我们就给大家介绍一下关于机器学习选择算法的相关建议，希望能够对大家有所帮助。

1.选择算法的意义

我们选择算法就是为了更高效率的进行处理问题。在我们充分了解数据及其特性以后，就能够帮助我们更有效地选择机器学习算法。采用某种流程就可以缩小算法的选择范围，使我们少走些弯路，但在具体选择哪种算法方面，一般并不存在最好的算法或者可以给出最好结果的算法，在实际做项目的过程中，这个过程往往需要多次尝试，有时还要尝试不同算法。但是对于初学者，选择算法还是按照下面提到的算法进行选择。

2.选择算法的步骤

通常来说，选择算法是一个比较麻烦的事情，但是并不是不能选择，选择就需要我们十分细心，这样我们才能够选择出一个合适的算法，以便于我们更好的处理问题。选择算法首先需要分析业务需求或者场景，这一步完成以后，就需要我们初探数据，看看自己是否需要预测目标值，如果需要的话，那么就使用监督学习，当然，使用监督学习的时候，如果发现了目标变量，如果是离散型，那么就使用分类算法，如果是连续型，那么就使用回归算法。当然，如果我们发现不需要预测目标值，那么就使用无监督学习，具体使用的算法就是K-均值算法、分层聚类算法等其他算法。

3.SQL spark算法的优势

有一种算法十分常见并且实用，那就是SQL spark算法，Spark SQL算法有着功能强大、性能优良的机器学习库，还可以用于图像处理和用于流式处理的工具，其优势十分明显。

（1）这个算法能够与Hadoop、Hive、HBase等无缝连接：Spark可以直接访问Hadoop、Hive、Hbase等的数据，同时也可使用Hadoop的资源管理器。

（2）在完整的大数据生态系统中，有我们熟悉的SQL式操作组件Spark SQL，还有功能强大、性能优良的机器学习库、图像计算及用于流式处理等算法。

（3）在高性能的大数据计算平台中，由于数据被加载到集群主机的分布式内存中。数据可以被快速的转换迭代，并缓存后续的频繁访问需求。基于内存运算，Spark可以比Hadoop快100倍，在磁盘中运算也比hadoop快10倍左右。

这篇文章我们给大家介绍了机器学习处理问题时如何选择一个合适的算法以及spark算法的优势的相关内容，相信大家对如何选择算法有了更加清晰的认识了吧？祝愿大家可以早日学有所成、学以致用。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

机器学习 SQL Hadoop spark Hive 大数据无监督无监督学习

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇做好人工智能需要注意什么？

下一篇机器学习的基本任务是什么？

在机器学习中如何选择一个合适的算法？

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】解锁企业数据价值的3大关键 ——从政策 ...

【CDA案例】基于 EAST和 FineBI 实现 AARRR 信用卡 ...

【CDA干货】互联网运营必看：私域用户质量数据分析 ...

【CDA持证人案例分享】用 Excel 精准监控电商及推广 ...

【CDA持证人干货分享】13年国企财务：如何借助DeepS ...

【CDA持证人案例分享】Excel动态报表设计：基于业务 ...

【CDA干货】字节大佬：如何通过动态分级快速提升转 ...

Windows 系统和 MacOS 系统下的 Anaconda 安装教程 ...

数据运营的工作内容、技能要求及发展前景 ...

【干货】字节大佬：教培行业销售运营全景作战地图【 ...

四大一线城市约50%人口租房，数据分析能挖出哪些 “ ...

Python 实战案例 —RFM 客户价值分析模型 ...

【案例】奥利奥坚果新品与蒙牛“数字牧场”的成功经 ...

美关税政策下的全球金融市场动荡：深度数据分析与洞 ...

【重磅】苹果捐赠3000万给浙大这专业，透露未来就业 ...

非专业，怎么才能证明自己的数据分析能力？ ...

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...

【干货】如何用RFM模型精准识别高价值客户？ ...