京公网安备 11010802034615号
经营许可证编号:京B2-20210330
关于数据科学家在金融服务领域的工作,最好的事情之一是用例的丰富程度和数据科学家可以对现实世界产生的影响。当然,所有面向客户的业务都有常见的应用程序,如个性化体验、有针对性的交叉销售优惠或防止客户流失的积极策略。但银行、保险公司和他们的金融技术挑战者以许多其他有趣和有影响力的方式使用数据和分析。
例子包括:
对许多数据科学家来说,第二个吸引力是数据集的广度和深度,可以用来产生有意义的见解。银行和保险公司通常可以获得大量的数据,如人口统计、交易和关系,无论是在宏观层面还是在个人客户层面。尽管对它们的使用有一些限制,但像这样的高质量数据集的可用性通常可以追溯到几年前,这可能是数据科学家在构建预测模型时的梦想。
金融服务公司在数据和技术上的支出的规模以及其数据生态系统的相对成熟度也可以使它们对数据科学家具有吸引力。例如,大多数银行将其年收入的10%以上用于技术。数据和分析支出是其中越来越重要的组成部分,对许多大型企业来说,每年很容易达到或超过数亿美元--这一数字是科技行业中除最大企业外的所有企业都无法比拟的。由于多年在数据上的花费,很多也拥有了相对成熟的数据团队。因此,数据科学家可能会发现已经建立良好的支持系统,并且不希望自己管理从数据管道到数据治理的所有事情。
最后,在大多数地区,银行、保险公司和金融机构通常是数据科学家的最佳收入来源。虽然它本身很有吸引力,但它也是一个有用的指标,表明数据科学在这些公司中的价值,以及它对长期职业生涯的影响。在至少一家主要的全球银行,首席数据和分析官现在直接向集团首席执行官报告。
当然,有一个陷阱。在银行和保险公司(尤其是较大的银行和保险公司)从事数据科学家工作的所有有趣之处,有时也会使其变得笨拙和令人沮丧。一些数据科学家将这些纯粹视为挑战;其他人也可能认为它们是发展自己并产生更大影响的机会。
鉴于数据和分析在行业中的高风险使用,有一个很高的信任标准来证明数据和模型在实际生活中的使用足够好。例如,如果一个数据科学家正在建立一个预测模型,可以用来拒绝某人的贷款或保险,或者将某人标记为潜在的洗钱者,那么他们可能应该期待大量的审查。
类似地,考虑到客户通常信任银行和保险公司提供他们生活中最亲密的方面--例如,他们的收入或他们的病史,数据科学家可以围绕数据可用性和可用性找到详细的控制。每个行业都存在关于数据隐私、主权、道德和安全的问题,但很少有其他行业在管理这些问题上花费如此多的时间和精力。
在数据和相关技术上的大量支出,以及由数据工程师、分析师和风险专家组成的资源丰富的团队,可以为数据科学家提供茁壮成长的肥沃土壤。但是,同样的因素也会导致丧失敏捷性。在许多情况下,这些可能会转化为数据科学家的限制性技术选择,或者在他们的工作真正出现在生产中之前,通过精心控制和移交的多步骤过程。让新加入银行业的人感到惊讶的一个特殊领域是,需要让一个独立的团队对所有重要模型进行正式验证--这一步骤可以为正常的模型生命周期增加几周甚至几个月的时间。
支撑上述所有挑战的是,金融服务业是全球监管最严格的行业之一。作为回应,大多数银行和保险公司建立了一个DNA,尤其是在2008年金融危机之后。在许多地区,银行和保险公司的高级经理对其雇主的行为负有个人责任,因此任何可能违反客户信任或监管要求的事情都要特别谨慎对待。数据和算法的使用勾选了所有的框。毫不奇怪,金融监管机构是第一批就负责任地使用数据和人工智能提出指导方针的国家之一--例如,在新加坡、香港、欧盟、英国和美国。
显然,不是每个数据科学家都会喜欢银行、保险公司,甚至是受监管的金融技术公司。但是,如果:
BIOS:Shameek Kunduis是从技术和商业战略角度来看人工智能的领先专家,他的大部分职业生涯都在推动金融服务业负责任地采用数据分析/AI。他是Truera的首席战略官和金融服务主管。他是英格兰银行人工智能公私论坛和经合组织人工智能全球伙伴关系的成员,也是新加坡金融管理局人工智能公平、道德、问责制和透明度指导委员会的成员。最近,Shameek是渣打银行的集团首席数据官,在那里他帮助银行在多个领域探索和采用人工智能(例如,信贷、金融犯罪合规、客户分析、监控)。
Divya Gopinath是TruEra的研究工程师,TruEra是一家专注于让人工智能可信和透明的公司。在加入之前,Divyacomplement在麻省理工学院获得了本科和硕士学位,她的研究重点是为医疗保健领域构建机器学习算法。Divya是值得信赖的人工智能《走向数据科学》的主要贡献者,专注于公平和解决机器学习模型中的偏见的主题。
Arridhana Ciptadiis是Truera工程团队的成员。他以前是蓝六边形创始团队的一员,在那里他是公司所有机器学习工作的技术负责人。在此之前,他是亚马逊Lab126的机器学习科学家,在那里他为亚马逊的各种产品开发机器学习和计算机视觉技术。Ciptadi拥有博士学位佐治亚理工学院计算机科学专业。
相关:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11