你用Python做过什么有趣的数据挖掘项目? 大概一年多以前,和几个小伙伴均认同一个趋势:觉得通过技术手段获取网上越来越丰富的数据,并基于这些数据做分析及可视化,必能产生有价值的结果,帮助大家改善生活 ...
2016-04-06数据时代的反爬虫绝技 网络爬虫已经成了很普及的网络技术,会代码的可以自己捣鼓一个高级的“人工智能”爬虫,不会的也可以从网上下载一个开源的,然后找个机器或一些代理服务器,就可以肆无忌惮的薅羊毛了。轻 ...
2016-04-06App数据分析之旅,如何收集数据? 为什么要针对App收集数据,想必大家能够举出很多理由。大家可以想一下,尽量不要设计到数据后期的分析,不要涉及产品优化,不要设计用户体验,更不要设计运营优化,等等。因 ...
2016-04-06“当你在深夜遇到系统挂了和数据损坏,有什么办法可以避免那些痛苦和头痛?” 这是DJ·Patil在最近的CTO峰会提到的。他是RelateIQ前任产品副总裁,和美国现任首席数据科学家,Patil总结所有产生变革的经验教训和失 ...
2016-04-05如何面对PB级别数据的架构变迁? 面对PB级别数据存储,我们一路走来也踩过很多坑,这里就直接进入主题了,给大家分享一下监控宝系统架构变迁的两个比较重要的点。 一、Redis的扩展 我们面临的第一个的问题 ...
2016-04-05基于你的点赞轨迹,数据挖掘可以探知你的性格秘密 整理了一些社交媒体数据挖掘的结果,你会发现,大数据、行为痕迹和社交媒体的结合,展现了无限的机会和可能。例如,基于脸书的挖掘,可以探知你的智商、神经质 ...
2016-04-05懂你的推荐算法,推荐逻辑是怎样的? 作为一个喜欢思考人生的美男子,我时常感慨,现在这个年代,人们上网获取信息的成本真的好低。智能手机,人手一台,打开3G就能上网,百度一搜,什 么都有。当然百度上搜出 ...
2016-04-05非一般的数据挖掘机:关联规则法 机器学习中的许多数据挖掘方法主要是针对数值型数据的,算法也很偏向数理方法(例如支持向量机)。而分类数据(非数值型数据),其本质不过是简单的计数,针对这类数据的一个简 ...
2016-04-05一篇文章透彻解读聚类分析及案例实操(二) 4 SAS聚类分析案例 1 问题背景 考虑下面案例,一个棒球管理员希望根据队员们的兴趣相似性将他们进行分组。显然,在该例子中,没有响应变量。管理者希望 ...
2016-04-05一篇文章透彻解读聚类分析及案例实操(一) 本文主要是介绍一下SAS的聚类案例,希望大家都动手做一遍,很多问题只有在亲自动手的过程中才会有发现有收获有心得。这里重点拿常见的工具SAS+R语言+Python介绍! 1 ...
2016-04-05用SAS进行数据分析:绘制累积柱状图并添加折线 对于很多数据分析着来说,sas很多初级的朋友对他的应用不是很多,下面就介绍下一如何用SAS绘制累积柱状图并添加折线 PS:直接上代码,对SAS CODE ...
2016-04-04数据分析师?科学家?架构师?大数据人才的工作内容及年薪比较 随着大数据时代的到来,数据分析与探勘成为科技显学,各行各业对于大数据的浓厚兴趣也直接反映在大数据人才的丰厚薪资中。 根据美国大数据及商业 ...
2016-04-04妙用Excel语音校对功能实现数据核对 单位经常用Excel来统计分点压力数据,每次统计完成后还要对上百个中低压数据进行校对。如果用眼睛校对,很容易出差错。而使用Excel的“文本到语音”功能,让软件自动报 ...
2016-04-04如何破解word文件密码与Excel表格密码 为Word文档加密本来无可厚非,但如果忘记了word文件密码怎么办?虽然网络上很多各种各样破解word文件密码软件,但它们无一例外的采用暴力破解office文件加密的方式,耗费 ...
2016-04-04大数据面试可能遇到的问题 1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。 2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的? 3、什么是:提升值、关键绩效指标、强壮 ...
2016-04-04数据分析应从数据积累做起 “不会酿酒,也能成为好的品酒师。”在IBM数据分析沙龙中,AsiaAnalytics首席执行官莫利伟通过品酒师的事例,说明企业应该如何正确进行数据分析,为大数据的应用作准备。作为一个企 ...
2016-04-04模型验证的常用武器 分类模型是数据挖掘中应用非常广泛的算法之一,常用的分类算法有Logistic模型、决策树、随机森林、神经网络、Boosting等。针对同一个数据集,可以有这么多的算法进行分析,那如何评估什 ...
2016-04-03澄清P问题、NP问题、NPC问题的概念 这或许是众多OIer最大的误区之一。 你会经常看到网上出现“这怎么做,这不是NP问题吗”、“这个只有搜了,这已经被证明是NP问题了”之类的话。你要知道,大多数人此时所 ...
2016-04-03各种排序算法总结 排序算法是最基本最常用的算法,不同的排序算法在不同的场景或应用中会有不同的表现,我们需要对各种排序算法熟练才能将它们应用到实际当中,才能更好地发挥它们的优势。今天,来总结下各种 ...
2016-04-03有时候数字确实需要分享一个美丽的故事分享! 当今社会,数据可视化是至关重要的。没有强大的可视化,几乎不可能在堆积如山的数据中创造或者叙述它的故事。这些故事有助于我们构建策略,并做出明智的商业决 ...
2016-04-03在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31本人基本情况: 学校及专业:厦门大学经济学院应用统计 实习经历:快手数据分析、字节数据分析、百度数据分析 Offer情况:北京 ...
2025-01-3001专家简介 徐杨老师,CDA数据科学研究院教研副总监,主要负责CDA认证项目以及机器学习/人工智能类课程的研发与授课,负责过中 ...
2025-01-29