【SAS宏】使用WOE和IV实现风险因素筛选 在信用风险评估领域,信用评分卡模型在国内外都是一种非常成熟的预测模型,无论是使用传统的Logistic回归建模乃至一些使用Neural networks算法建模,变量筛选都是整个建 ...
2017-06-01SAS数据集中重复数据的处理方法 在使用SAS在处理数据的时候,经常会遇到或产生一些重复数据,有些重复数据是我们需要的,而有的则是多余的。下面讲到的内容就是筛选/排除某一数据集里重复数据以及去重的几种常 ...
2017-06-01[SAS 测试语法]变数门限回归 今天介绍正在测试中的语法 变数门限回归 首先,创造一个虚拟q, 该虚拟变量唯一个随机数值,我们假设这个变量造成了结构性改变 形成了两种回归式 (是的,我们的回归 ...
2017-06-01sas—日期格式及函数 很久不用sas了,把日期的格式给忘了,重新学习下。 前不久,有个同事问我怎么把 date9.如“21jan2016”d 的格式换成yymmdd10. 2016-01-21的格式; 用informat设定好变量格式即可。 ...
2017-06-01SAS—计算K-S值及画图 近来,时于夜半下雨,也常在梦里被雨扰醒。究其原因,也是因为近来工作无趣,本身也只喜欢写写SAS或Python代码,做模型,可近来却连数据权限都没有,万灰俱灭。雨声轻轻,却也容易愁闷得 ...
2017-06-01【R语言】单一样本推断问题 非参数统计概念: 在实际问题中,对数据的分布形式和统计模型难以作出比较明确的假定,最多只能对总体的分布做出类似于连续性型分布或者对某点对称等一般性假定。这种不假设总体 ...
2017-05-31R语言-组间差异的非参数检验 7.5 组间差异的非参数检验 如果数据无法满足t检验或ANOVA的参数假设,可以转而使用非参数方法。举例来说,若结果变量在本质上就严重偏倚或呈现有序关系,那么你可能会希望使用本节 ...
2017-05-31R语言-回归之简单线性回归 8.1 回归的多面性 回归是一个令人困惑的词,因为它有许多特殊变种(见表8-1)。对于回归模型的拟合, R提供的强大而丰富的功能和选项也同样令人困惑。例如, 2005年Vito Ricc ...
2017-05-31R语言-有交互项的多元线性回归 许多很有趣的研究都会涉及交互项的预测变量。以mtcars数据框中的汽车数据为例,若你对汽车重量和马力感兴趣,可以把它们作为预测变量,并包含交互项来拟合回归模型,参见代码清单 ...
2017-05-31R语言-如何处理违背回归假设的问题 我们已经花费了不少篇幅来学习回归诊断,你可能会问:“如果发现了问题,那么能做些什么呢?”有四种方法可以处理违背回归假设的问题: 删除观测点; 变量变换; 添加或删除 ...
2017-05-31R语言解读多元线性回归模型 在许多生活和工作的实际问题中,影响因变量的因素可能不止一个,比如对于知识水平越高的人,收入水平也越高,这样的一个结论。这其中可能包括了因为更好的家庭条件,所以有了更好的 ...
2017-05-31R语言里面的因子 R语言中的因子确实不好理解,很多人都这么觉得。在R语言中,因子(factor)表示的是一个符号、一个编号或者一个等级,即,一个点。例如,人的个数可以是1,2,3,4......那么因子就包括,1,2 ...
2017-05-30R语言自定义函数 R语言某种程度来说本身就是一个函数库,因为它有大量的函数可供调用,加上函数式编程,使得R语言的功能很强大。但是,有时候,根据实际需要,我们还是需要自己动手编写函数,从而减少代码的缀 ...
2017-05-30R语言逻辑运算 R语言包括两个逻辑值:TRUE、FALSE,其它编程语言经常称为布尔值,下面就来介绍R语言逻辑的应用。 条件运算产生逻辑值 > a <- 1 > b <- 2 > a>b [1] FALSE > a<b [1] T ...
2017-05-30R语言-线性模型假设检验 让我一起学习下gvlma包中的gvlma()函数。gvlma()函数由Pena和Slate(2006)编写,能对线性模型假设进行综合验证,同时还能做偏斜度、峰度和异方差性的评价。换句话说,它给模型假设提供 ...
2017-05-30R语言-如何处理回归中的异常值点 异常观测值 一个全面的回归分析要覆盖对异常值的分析,包括离群点、高杠杆值点和强影响点。这些数据点需要更深入的研究,因为它们在一定程度上与其他观测点不同,可能对结 ...
2017-05-30R语言解读资本资产定价模型CAPM 伴随2016年中国金融交易市场的跌宕起伏,风险越来越不确定,利率持续走低,理财等无风险资产收益持续下降的情况,唯有投资组合才能让我们的资产保值、增值。根据资本资产定价模 ...
2017-05-30SAS中的协方差分析 所谓的协方差分析,就是在方差分析的基础上加上协变量这一额外因素,而方差分析则只考虑组变量这一因素。协变量可以有一个,也可以有多个。 在这篇文章中,我只讲述单变量的协方差分析。 ...
2017-05-29R语言分类算法之随机森林 1.原理分析: 随机森林是通过自助法(boot-strap)重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练集样本集合,然后根据自助样本集生成k个决策树组成的随 ...
2017-05-29R语言实战k-means聚类和关联规则算法 1、R语言关于k-means聚类 数据集格式如下所示: [plain] view plain copy ,河东路与岙东路&河东路与聚贤桥路,河东路与岙东路&新悦路与岙东路,河东路与岙东路&火炬路与聚贤 ...
2017-05-29在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31本人基本情况: 学校及专业:厦门大学经济学院应用统计 实习经历:快手数据分析、字节数据分析、百度数据分析 Offer情况:北京 ...
2025-01-3001专家简介 徐杨老师,CDA数据科学研究院教研副总监,主要负责CDA认证项目以及机器学习/人工智能类课程的研发与授课,负责过中 ...
2025-01-29