
关于数据科学家在金融服务领域的工作,最好的事情之一是用例的丰富程度和数据科学家可以对现实世界产生的影响。当然,所有面向客户的业务都有常见的应用程序,如个性化体验、有针对性的交叉销售优惠或防止客户流失的积极策略。但银行、保险公司和他们的金融技术挑战者以许多其他有趣和有影响力的方式使用数据和分析。
例子包括:
对许多数据科学家来说,第二个吸引力是数据集的广度和深度,可以用来产生有意义的见解。银行和保险公司通常可以获得大量的数据,如人口统计、交易和关系,无论是在宏观层面还是在个人客户层面。尽管对它们的使用有一些限制,但像这样的高质量数据集的可用性通常可以追溯到几年前,这可能是数据科学家在构建预测模型时的梦想。
金融服务公司在数据和技术上的支出的规模以及其数据生态系统的相对成熟度也可以使它们对数据科学家具有吸引力。例如,大多数银行将其年收入的10%以上用于技术。数据和分析支出是其中越来越重要的组成部分,对许多大型企业来说,每年很容易达到或超过数亿美元--这一数字是科技行业中除最大企业外的所有企业都无法比拟的。由于多年在数据上的花费,很多也拥有了相对成熟的数据团队。因此,数据科学家可能会发现已经建立良好的支持系统,并且不希望自己管理从数据管道到数据治理的所有事情。
最后,在大多数地区,银行、保险公司和金融机构通常是数据科学家的最佳收入来源。虽然它本身很有吸引力,但它也是一个有用的指标,表明数据科学在这些公司中的价值,以及它对长期职业生涯的影响。在至少一家主要的全球银行,首席数据和分析官现在直接向集团首席执行官报告。
当然,有一个陷阱。在银行和保险公司(尤其是较大的银行和保险公司)从事数据科学家工作的所有有趣之处,有时也会使其变得笨拙和令人沮丧。一些数据科学家将这些纯粹视为挑战;其他人也可能认为它们是发展自己并产生更大影响的机会。
鉴于数据和分析在行业中的高风险使用,有一个很高的信任标准来证明数据和模型在实际生活中的使用足够好。例如,如果一个数据科学家正在建立一个预测模型,可以用来拒绝某人的贷款或保险,或者将某人标记为潜在的洗钱者,那么他们可能应该期待大量的审查。
类似地,考虑到客户通常信任银行和保险公司提供他们生活中最亲密的方面--例如,他们的收入或他们的病史,数据科学家可以围绕数据可用性和可用性找到详细的控制。每个行业都存在关于数据隐私、主权、道德和安全的问题,但很少有其他行业在管理这些问题上花费如此多的时间和精力。
在数据和相关技术上的大量支出,以及由数据工程师、分析师和风险专家组成的资源丰富的团队,可以为数据科学家提供茁壮成长的肥沃土壤。但是,同样的因素也会导致丧失敏捷性。在许多情况下,这些可能会转化为数据科学家的限制性技术选择,或者在他们的工作真正出现在生产中之前,通过精心控制和移交的多步骤过程。让新加入银行业的人感到惊讶的一个特殊领域是,需要让一个独立的团队对所有重要模型进行正式验证--这一步骤可以为正常的模型生命周期增加几周甚至几个月的时间。
支撑上述所有挑战的是,金融服务业是全球监管最严格的行业之一。作为回应,大多数银行和保险公司建立了一个DNA,尤其是在2008年金融危机之后。在许多地区,银行和保险公司的高级经理对其雇主的行为负有个人责任,因此任何可能违反客户信任或监管要求的事情都要特别谨慎对待。数据和算法的使用勾选了所有的框。毫不奇怪,金融监管机构是第一批就负责任地使用数据和人工智能提出指导方针的国家之一--例如,在新加坡、香港、欧盟、英国和美国。
显然,不是每个数据科学家都会喜欢银行、保险公司,甚至是受监管的金融技术公司。但是,如果:
BIOS:Shameek Kunduis是从技术和商业战略角度来看人工智能的领先专家,他的大部分职业生涯都在推动金融服务业负责任地采用数据分析/AI。他是Truera的首席战略官和金融服务主管。他是英格兰银行人工智能公私论坛和经合组织人工智能全球伙伴关系的成员,也是新加坡金融管理局人工智能公平、道德、问责制和透明度指导委员会的成员。最近,Shameek是渣打银行的集团首席数据官,在那里他帮助银行在多个领域探索和采用人工智能(例如,信贷、金融犯罪合规、客户分析、监控)。
Divya Gopinath是TruEra的研究工程师,TruEra是一家专注于让人工智能可信和透明的公司。在加入之前,Divyacomplement在麻省理工学院获得了本科和硕士学位,她的研究重点是为医疗保健领域构建机器学习算法。Divya是值得信赖的人工智能《走向数据科学》的主要贡献者,专注于公平和解决机器学习模型中的偏见的主题。
Arridhana Ciptadiis是Truera工程团队的成员。他以前是蓝六边形创始团队的一员,在那里他是公司所有机器学习工作的技术负责人。在此之前,他是亚马逊Lab126的机器学习科学家,在那里他为亚马逊的各种产品开发机器学习和计算机视觉技术。Ciptadi拥有博士学位佐治亚理工学院计算机科学专业。
相关:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10