在Springboard,我们的学生经常问我们这样的问题“数据科学家是做什么?”或者“数据科学家每天的工作是什么样子?”这些问题很棘手。答案因角色和公司不同而不同。
因此,我们咨询了Raj Bandyopadhyay, Springboard数据科学教育主管,看看他是否有一个更好的答案。Raj提供了下图中的框架,它既可以帮助你了解数据科学家的日常工作,也可以帮你理解数据科学解决问题的流程,Raj称之为“数据科学工作流程”。
在解决问题之前,首先要做的是把问题界定清楚,去定义它到底是什么。你必须能够将数据问题转化为可操作的东西。
你经常会从持有问题的人那里得到模糊的描述。你必须培养直觉:通过问一些别人不会问的问题,把这些模糊描述转换成可操作的问题。
假设您正在为公司的销售人员解决问题,你应该了解他们的目标是什么以及数据问题背后真正的本质是什么?在你开始考虑问题之前,你必须与他们合作,明确界定问题。正确地提问是这一步骤的关键。你应该弄清楚销售过程是什么样子,谁是客户。你需要尽可能了解背景知识以便将数据转换为洞察力。为此,你应该问类似下面的问题:
(1)谁是顾客?
(2)他们为什么买我们的产品?
(3)我们如何预测,一个客户是否会买我们的产品?
(4)表现好和差客户细分群体之间的区别在哪里?
(5)如果我们不能把产品卖给目标客户,我们的损失有多大?
在回答你的问题时候,销售人员可能会发现他们想知道为什么产品在部分细分客户群体中的销售不及预期。他们的最终目标可能是确定是否继续投资于这些群体,或是降低它们的优先级。这样你进一步细化了问题,针对细化后的问题发掘答案。在这个阶段的最后,你应该有了所有你需要解决问题的背景知识。
一旦定义好了问题,你需要通过数据来寻找解决方案。这一进程中要想清楚需要什么样的数据?通过什么渠道可以获取这些数据?是要内部数据库数据还是需要购买外部数据?
或许你可能会发现,你要数据都存储在公司的客户关系管理CRM系统中,那么就可以将数据用CSV文件的形式导出。
现在,你有了原始数据,但是还需要为后续的分析做数据预处理。通常情况下,数据都是杂乱无章的,特别是没有很好地存储的情况下。很多东西都可以导致后续分析的错误:null值,重复值和缺失值。对数据的精心核查才能保障从数据中得到有价值的见解。
你要检查以下常见错误:
(1)缺失值,例如客户没有初次接触日期
(2)损坏值,如无效输入项
(3)时区差异,也许你的数据库没有考虑到用户处在不同的时区
(4)日期范围错误,也许你会有没有任何意义日期数据,比如销售开始前的注册数据。
你需要对数据文件的行和列进行统计,并对某些值进行测试,看看它们是不是有意义。如果您发现没有意义,你需要删除数据,或者使用默认值替换它。这里,你需要利用你直觉:如果客户没有初次接触日期,是否就真没有初次接触日期?或者你可以询问销售人员,是否是把初次接触日期的数据弄丢了?一旦你完成数据清理工作,你就可以开始准备探索性数据分析。
当你的数据是干净的,你就应该开始使用它!这里的困难在于如何对真正有见解的想法进行测试。你必须为数据科学项目设定最后期限(销售人员可能正等待的分析),所以你必须对问题进行优先级划分。“你必须先看看最有趣的模式:帮助解释为什么某些客户群体的销量减少了。您可能会注意到,他们在社交媒体上不是非常活跃,只有少数人有Twitter或Facebook帐户。您可能还注意到,其中大部分人的年龄偏大,你可以开始跟踪这些模式进行更深入分析。
这一步你要应用统计学、数学和数据科学工具,围绕有趣的模型进行详细分析。
在这种情况下,你可能需要创建预测模型比较业绩不佳组客户与客户平均。你可能会发现,年龄和社交媒体活跃度是影响购买产品的显著因素。
如果你在问题界定阶段就已经了解了很多背景信息,你可能会意识到该公司营销活动集中在社交媒体上与年轻受众进行互动。但是某些客户却喜欢电话的交流,而不是社交媒体。你开始看到该产品的营销方式对销售的影响,也许那部分客户是不应该流失的群体。公司应该从过分依赖社会化媒体营销策略向更加个性化的策略转变。
现在,您可以将所有数据定量分析得到的定性见解,通过讲故事的方式说服相关人员采取行动。
让销售人员理解你们的发现很重要。沟通交流的有效性决定了你的方案是否被采纳。
你应该撰写一个有令人信服的故事,将自己的知识与数据恰当嵌入其中。你可以从解释老年人中销售业绩不佳背后的原因开始;你可以巧妙地将销售人员给你信息和数据中发现见解结合起来;然后你转到解决问题的具体办法:可以将部分资源从社会化媒体转移到私人电话推销中。
了解以上步骤,对于系统思考数据科学有极大的帮助。
数据分析咨询请扫描二维码
数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列的技能和能力,以确保能够有效地处理、分析和解释数据,从而支持业务决策。以下是数据分析师所需的主要 ...
2024-11-22需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21数据分析行业正在迅速发展,随着技术的不断进步和数据量的爆炸式增长,企业对数据分析人才的需求也与日俱增。本文将探讨数据分析 ...
2024-11-21数据分析的常用方法包括多种技术,每种方法都有其特定的应用场景和优势。以下是几种常见的数据分析方法: 对比分析法:通过比 ...
2024-11-21企业数字化转型是指企业利用数字技术对其业务进行改造和升级,以实现提高效率、降低成本、创新业务模式等目标的过程。这一过程不 ...
2024-11-21数据分析作为一个备受追捧的职业领域,吸引着越来越多的女性加入其中。对于女生而言,在选择成为一名数据分析师时,行业选择至关 ...
2024-11-21大数据技术专业主要学习计算机科学、数学、统计学和信息技术等领域的基础理论和技能,旨在培养具备大数据处理、分析和应用能力的 ...
2024-11-21