20道问题识别假的数据科学家
雇用数据科学家是不容易的工作,特别是当有一群假的数据科学家在里面装腔作势。这儿有现成的一些问题能够帮助区分真假的数据科学家。
21道必须懂得的关于数据科学的面试问题和答案
如今数据科学家是公认的21世纪最性感的工作,每个人都想分一杯羹。
这就意味着里面会混着一些对大数据装着很懂的人。这些人称自己为数据科学家,但是不具备关于数据方面的能力。
当然他们不是有意去欺骗大家:他们是数据科学家。数据科学本身的崭新性和人们对相关工作内容的不够理解会让他们自己认为因为他们在处理数据,所以他们是数据科学家。
“假的数据科学家经常是很擅长某一特定学科的,然后会坚持他们所在的学科是唯一的真正的数据科学。这个信念没有领会到数据的真正含义,即数据科学是根据科学工具和技术(如:数学方面的,计算机方面的,可视化方面的,分析方面的,统计方面的,经验方面的,还有问题定义,模型建立和验证)完全的应用,然后从数据收集里面获得发现,见识和价值。”
–Kirk Borne ,Booz Allen Hamilton首席数据科学家和Rocket Data Science.org的创办人。
发现假的数据科学家第一个方法是了解你要寻找的人应该具备哪些能力。
明白数据科学家,数据分析师,数据工程师之间的不同是很重要的,特别是在如果你计划雇用他们中的一种的时候。
为了帮助大家从假(或误以为)的数据科学家中找出真的,我们已经准备了20道面试问题,你可以在面试他们的时候采用。
1.解释什么是规则化,为什么它是有用的。
2.你最欣赏哪个数据科学家,是哪个创业企业的。
3.你如何通过多次回归,验证你所创建的模型生成的关于数量结果的预测模型是可变的。
4.解释什么是查全率,它们和ROC 曲线的关系。
5.你如何证实你带到算法里面的一个改进是有意义的,但是没有起到作用。
6.造成分析的根源是什么?
7.你熟悉定价优化,价格弹性,存货管理和竞争智能吗?请举例。
8.什么是检验效能?
9.解释什么是重抽样方法,为什么有用?它们的局限性在哪里。
10.存在很多的假阳性是不是更好,或者许多假阴性呢。请解释。
11.什么是选择误差,为什么它很重要以及你如何避免。
12.请举例,你如何使用试验设计回答关于用户行为的问题。
13.数据格式的“长”和“宽”有什么不同。
14.关于某特定领域的全面的真实信息,你通过什么方式决定相关统计数据无论是否发表于文章都是错的,或者被提出用以支持作者的观点也是不对的。
15.解释Edward Tufte关于图表垃圾的概念。
16.你如何检查极端值,如果你发现了一个你将怎么办?
17.极值理论,蒙特卡洛模拟,数理统计,任意使用其中一种理论,你如何正确预测一件罕见事件的发生概率。
18.推荐引擎是什么?它是如何工作的。
19.解释什么是假阳性和假阴性。为什么区分两者很重要。
20.你在使用什么工作进行可视化。你怎么看待Tableau?R?SAS?(关于图表的)。如何在一个表格或者视频里高效的描绘第五维?
“一个真正的数据科学家懂得如何运用数学和统计学,懂得通过合适的试验性设计创建和验证模型。如果拥有了IT技能,却不会统计技能,你就像只懂得举着手术刀的外科医生一样,只懂得如何拿手术刀(却不会做手术)。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24