SPSS中异常值检验的几种方法介绍(7)_数据分析师-CDA数据分析师官网

热线电话：13121318867

SPSS中异常值检验的几种方法介绍(7)_数据分析师

2015-01-04

加权方法：

采用因子加权：对满足特定变量或指标的所有样本赋予一个权重，通常用于提高样本中具有某种特性的被访者的重要性；例如，研究一种香烟的口味是否需要改变，那么不同程度吸食者的观点也应该有不同的重要性对待：例如：重度吸食者=3，经常吸食者=2，偶尔/不抽烟=1，记住：实际应用时候，如果“经常/偶尔”的基数足够大，往往单独分析，不进行加权处理；

采用目标加权：对某一特定样本组赋权，以达到们预期的特定目标；例如：我们想要：品牌 A 的 20%使用者 = 品牌 B 的 50%使用者；或者品牌 A 的 20%使用者 = 使用品牌 A 的 80%非使用者；

采用轮廓加权：多因素加权，因子/目标加权不同(一维的)，轮廓加权应用于对调查样本相互关系不明确的多个属性加权；面对多个需要赋权的属性，轮廓加权过程应

该同时进行，以尽可能少的对变量产生扭曲；

我们应该知道，无论加权的动机是什么，但操作过程是一样的：

1. 依不同属性变量/指标将样本分为多个组(加权组)，然后根据所希望各个组代表的个体规模赋予不同的权重；即明确分析子集/样本组，通常，经常以人口结构变量、地域变量作为分类指标；明确各个分析子集/样本组中个体的代表性强弱(权重)； 2. 加权是在数据收集结束后采取的数据“纠偏”行为，但一定要清醒的知道：配额设置不合适、FW 执行差或其他错误而造成的“不好”的原始数据收集，即使加权也一定是“无效的”； 3. “提前避免错误/失误发生，总好过事后的任何补救！”

事后加权案例：例如：我们为了研究，得到某小公司职员吸烟习惯的信息，进行了一项调查。从 N=78 个人的目录中抽出了一个 n=25 人的简单随机样本。在调查的设计阶段，并没有可用于分层的辅助信息。在收集关于吸烟习惯的信息的同时，还收集了每个回答者的年龄和性别情况。总共有 nr=15 个人作出了回答。由此得到样本数据的下列分布：

假设我们估计知道某公司约有 16 个男性职员和 62 个女性职员，而且男女的吸烟比例不同。经过加权后我们得到该公司吸烟的比例估计在 53%；我们总是希望调查所得的估计值与已知的男性和女性数量比例相一致，当我们认为一个人是否吸烟与他的性别之间可能存在相关性，因此他们认为，使用事后分层能够提高估计的精度。然而实际上，如果在调查的设计阶段就已经获得这些信息的话，就可以用性别来进行分层。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；