《数据分析专项练习题库》
《CDA数据分析认证考试模拟题库》
《企业数据分析面试题库》
一、单选题
1.统计图中的散点图主要用来( A )。
A.观察变量之间的相关关系 B.主要用来表示总体各部分所占的比例
C.主要用来表示次数分布 D.主要用来反映分类数据的频数分布
2.抽样误差是指( D )
A.在调查过程中由于观察、测量等差错所引起的误差
B.人为原因所造成的误差
C.在调查中违反随机原则出现的系统误差
D.随机抽样而产生的代表性误差
3.检查异常值常用的统计图形:( B )
A、条形图
B、箱体图
C、帕累托图
D、线图
4.线性回归里的残差分析不可能用于诊断( D )
A、残差独立性
B、变量分布
C、异常值侦察
D、最大迭代次数
5.拟合logistic回归模型时有两个分类变量,分别是Gender(水平为female和male),Class(水平为1 、2和3),下表为输出结果,下面哪个选项的说法是正确的?(C)
A.变量Gender和Class采用效应编码
B.变量Gender采用引用编码,引用水平为female
C.变量Class采用引用编码,引用水平为3
D.变量Gender和Class采用全量编码
6.因子分析的主要作用:( A )
A、对变量进行降维
B、对变量进行判别
C、对变量进行聚类
D、以上都不对
7.关于K-means 聚类过程正确的是:( A )
A、使用的是迭代的方法
B、均适用于对变量和个案的聚类
C、对变量进行聚类
D、以上都不对
8.东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!"
以上对话体现了数据分析方法中的( A )
9.已知甲班学生“统计学”的平均成绩为86分,标准差是12.8分,乙班学生“统计学”的平均成绩是90分,标准差是10.3分,下列表述正确的是( A )
A. 乙班平均成绩的代表性高于甲班
B. 甲班平均成绩的代表性高于乙班
C. 甲、乙两班平均成绩的代表性相同
D. 甲、乙两班平均成绩的代表性无法比较
10.根据样本资料估计得出人均消费支出Y对人均收入X的回归模型,表明人均收入每增加1%,人均消费支出将增加( B )
A. 0.2% B. 0.75% C. 2% D. 7.5%
11.某企业根据对顾客随机抽样的信息得到对该企业产品表示满意的顾客比率的95%置信度的置信区间是(56%,64%)。下列正确的表述是( A )
A.总体比率的95%置信度的置信区间为(56%,64%)
B.总体真实比率有95%的可能落在(56%,64%)中
C.区间(56%,64%)有95%的概率包含了总体真实比率
D.由100次抽样构造的100个置信区间中,约有95个覆盖了总体真实比率
12.以下哪个语句可以将字符型数值date(示例:“2001-02-19”)转换为数值类型? ( A )
A、INPUT(date,YYMMDD10.)
B、PUT(date,YYMMDD10)
C、INPUT(date,YYMMDD10.)
D、PUT(date,YYMMDD10)
13. ,取值范围在[0,1],反映回归曲线的拟合优度,当趋近于0,则回归曲线拟合优度( B )
A.越好 B. 越差 C. 适中 D. 以上都不对
14.分析购买不同产品的频次时,使用以下哪个任务? ( D )
A、列表数据
B、汇总表
C、汇总统计量
D、单因子频数
15.当你用跑步时间(RunTime)、年龄(Age)、跑步时脉搏(Run_Pulse)以及最高脉搏(Maximum_Pulse)作为预测变量来对耗氧量(Oxygen_Consumption )进行回归时,年龄(Age)的参数估计是-2.78. 这意味着什么?( B )
A、年龄每增加一岁,耗氧量就增大2.78.
B、年龄每增加一岁,耗氧量就降低2.78.
C、年龄每增加2.78岁,耗氧量就翻倍。
D、年龄每减少2.78岁,耗氧量就翻倍。
16.ROC曲线凸向哪个角,代表模型约理想?( A )
A、左上角
B、左下角
C、右上角
D、右下角
17.在所有两位数(10-99)中任取一两位数,则此数能被2或3整除的概率为 ( B )
A. 6/5 B. 2/3 C. 83/100 D.均不对
18.对事件A和B,下列正确的命题是 ( D )
A.如A,B互斥,则,也互斥
B. 如A,B相容,则, 也相容
C. 如A,B互斥,且P(A)>0,P(B)>0,则A.B独立
D. 如A,B独立,则,也独立
19.掷二枚骰子,事件A为出现的点数之和等于3的概率为 ( B )
A.1/11 B. 1/18 C. 1/6 D. 都不对
20.A和B两事件,若 P(AUB)=0.8,P(A)=0.2,P()=0.4 则下列 ( B )成立。
A. P()=0.32 B. P()=0.2
C. P(AB)=0.4 D. P()=0.48
21.随机地掷一骰子两次,则两次出现的点数之和等于8的概率为 ( C )
A. 3/36 B. 4/36 C. 5/36 D. 2/36
22.抽样推断中,可计算和控制的误差是 ( D )
A.登记误差 B.系统性误差(偏差)
C.抽样实际误差 D.抽样平均误差
23.假设检验中显著性水平是 ( B )
A.推断时犯取伪错误的概率 B.推断时犯取伪弃真的概率
C.正确推断的概率 D.推断时视情况而定
24.抽样调查中,无法消除的误差是 ( A )
A.随机误差 B.工作误差 C.登记误差 D.偏差
25.当时,两个相关变量 ( C )
A.低度相关 B.中度相关
C.高度相关 D.不相关
26.描述一组对称(或正态)分布资料的离散趋势时,最适宜选择的指标是(B)
A.极差 B.标准差 C.均数 D.变异系数
27.以下指标中那一项可用来描述计量资料离散程度(D)
A.算术均数 B.几何均数 C.中位数 D.极差
28.偏态分布资料宜用下面那一项描述其分布的集中趋势(C)
A.算术均数 B.标准差 C.中位数 D.四分位数间距
29.下面那一项可用于比较身高和体重的变异度(C)
30.正态曲线下,横轴上从均数到+∞的面积为(C)
A.97.5% B.95% C.50% D.5%
31.横轴上,标准正态曲线下从0到1.96的面积为: (D)
A.95% B.45% C.97.5% D.47.5%
32.下面那一项分布的资料,均数等于中位数。(D)
A.对数正态 B.左偏态 C.右偏态 D.正态
33.K-均值类别侦测要求输入的数据类型必须是( B )。
A整型 B数值型 C字符型 D逻辑型
34.某一特定的X水平上,总体Y分布的离散度越大,即σ2越大,则( A )。
A.预测区间越宽,精度越低 B.预测区间越宽,预测误差越小
C 预测区间越窄,精度越高 D.预测区间越窄,预测误差越大
35.如果X和Y在统计上独立,则相关系数等于( C )。
A.1 B.-1 C.0 D.∞
36.根据决定系数R2与F统计量的关系可知,当R2=1时,有( D )。
A.F=1 B.F=-1 C.F=0 D.F=∞
37.假设两变量线性相关,两变量是等距或等比的数据,但不呈正态分布,计算它们的相关系数时应选用( B )。
A. 积差相关 B.斯皮尔曼等级相关
C.二列相关 D.点二列相关
38.回归模型中,关于检验所用的统计量,下列说法正确的是( D )。
A.服从 B.服从
C.服从 D.服从
39.下面有关HAVING子句描述错误的是(B)。
A:HAVING子句必须与GROUP BY 子句同时使用,不能单独使用
B:使用HAVING子句的同时不能使用WHERE子句
C:使用HAVING子句的同时可以使用WHERE子句
D:使用HAVING子句的作用是限定分组的条件
40. 是( C )分布的密度函数。
A.指数 B. 二项 C. 均匀 D. 泊松
41.根据判定系数R2与F统计量的关系可知,当R2=1时有( C )。
A.F=1 B.F=-1 C.F=∞ D.F=0
42.在SQL查询时,使用WHERE子句指出的是(C)。
A:查询目标
B:查询结果
C:查询条件
D:查询视图
43.SQL查询语句中HAVING子句的作用是(C)。
A:指出分组查询的范围
B:指出分组查询的值
C:指出分组查询的条件
D:指出分组查询的字段
44.SQL的数据操作语句不包括(D)。
A:INSERT
B:UPDATE
C:DELETE
D:CHANGE
45.SQL语句中查询条件短语的关键字是(A)。
A:WHERE
B:FOR
C:WHILE
D:CONDITION
A:MODIFY TABLE
B:MODIFY STRUCTURE
C:ALTER TABLE
D:ALTER STRUCTURE
47.SQL语句中删除表的命令是(A)。
A:DROP TABLE
B:DELETE TABLE
C:ERASE TABLE
D:DELETE DBF
二、多选题
48.相关有以下几种(ABC)。
A.正相关 B.负相关 C.零相关 D.常相关
49.相关系数的取值可以是(ABC)。
A. 0 B.-1 C. 1 D. 2
50.某种产品的生产总费用2003年为50万元,比2002年多2万元,而单位产品成本2003年比2002年降低5%,则( ACDE )
A、生产费用总指数为104.17% B、生产费用指数为108.56%
C、单位成本指数为95% D、产量指数为109.65%
E、由于成本降低而节约的生产费用为2.63万元
51.三个地区同一种商品的价格报告期为基期的108%,这个指数是( BE )
A、个体指数 B、总指数 C、综合指数
D、平均数指数 E、质量指标指数
52.有关数据库的说法正确的是(ABCD)
A.元数据是描述数据的数据
B.使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引
C.数据库中一行叫做记录
D.数据库中的每一个项目叫做字段
53.统计数据按来源分类,可以分为(BD)
A.类别数据 B.二手数据
C.序列数据 D.一手数据
E.数值数据
53.以下哪些变量代表RFM方法中的M:( AB )
A.最近3期境外消费金额
B.最近6期网银平均消费金额
C.信用卡的消费额度
D.距最近一次逾期的月数
54.在作逻辑回归时,如果区域这个变量,当Region=A时Y取值均为1,无法确定是否出现的是哪个问题?(ABD)
A. 共线性
B. 异常值
C. 拟完全分离(Quasi-complete separation)
D. 缺失值
55.下列Z值( BCD )可以被认为是异常值。
A、0 B、-3 C、6 D、10
56.下列问题( ABC )使用参数检验分析方法。
A、评估灯泡使用寿命 B、检验食品某种成分的含量
C、全国小学一年级学生一学期的平均课外作业时间 D、全国省市小康指数高低
57.两独立样本t检验的前提( ABC )
A、样本来自的总体服从或近似服从正态分布 B、两样本相互独立
C、两样本的数量可以不相等 D、两样本的数量相等
58.两配对样本t检验的前提( ABD )
A、样本来自的总体服从或近似服从正态分布 B、两样本观察值的先后顺序一一对应
C、两样本的数量可以不相等 D、两样本的数量相等
59.下面给出的t检验的结果,( CD )表明接受原假设,显著性水平为0.05。
A、0.000 B、0.039 C、0.092 D、0.124
60.方差分析的基本假设前提包括( AC )
A、各总体服从正态分布 B、各总体相互独立
61.下列( ABC )属于多选项问题。
A、购买保险原因调查 B、高考志愿调查
C、储蓄原因调查 D、各省市现代化指数分析
A、凝聚方式聚类 B、分解方式聚类 C、Q型聚类 D、R型聚类
——学数据分析技能一定要了解的大厂入门券,CDA数据分析师认证证书!
CDA(数据分析师认证),与CFA相似,由国际范围内数据科学领域行业专家、学者及知名企业共同制定并修订更新,迅速发展成行业内长期而稳定的全球大数据及数据分析人才标准,具有专业化、科学化、国际化、系统化等特性。
“CDA数据分析师认证”是一套专业化,科学化,国际化,系统化的人才考核标准,分为CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ,涉及金融、电商、医疗、互联网、电信等行业大数据及数据分析从业者所需要具备的技能,符合当今全球大数据及数据分析技术潮流,为各界企业、机构提供数据分析人才参照标准。
报名方式
登录CDA认证考试官网注册报名>>点击报名
报名费用
Level Ⅰ:1200 RMB
Level Ⅱ:1700 RMB
Level Ⅲ:2000 RMB
考试地点
Level I+II:中国区30+省市,70+城市,250+考场,考生可就近考场预约考试 >看看我所在的地哪里报名<
Level III:中国区30所城市,北京/上海/天津/重庆/成都/深圳/广州/济南/南京/杭州/苏州/福州/太原/武汉/长沙/西安/贵阳/郑州/南宁/昆明/乌鲁木齐/沈阳/哈尔滨/合肥/石家庄/呼和浩特/南昌/长春/大连/兰州>看看我所在的地哪里报名<
报考条件
CDA Level I >了解更多<
▷ 报考条件:无要求。
▷ 考试时间:随报随考。
CDA Level II >了解更多<
▷ 报考条件:获得CDA Level I 认证证书;
▷ 考试时间:随报随考。
CDA Level III >了解更多<
▷ 报考条件:获得CDA Level II认证证书
▷ 考试时间:一年四届 3月、6月、9月、12月的最后一个周六。
——热门课程推荐:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析领域,Excel作为一种普及率极高且功能强大的工具,无疑为无数专业人士提供了便捷的解决方案。尽管Excel自带了丰富的功 ...
2025-01-17在这个瞬息万变的时代,许多人都在寻找能让他们脱颖而出的职业。而数据分析师,作为大数据和人工智能时代的热门职业,自然吸引了 ...
2025-01-14Python作为一门功能强大的编程语言,已经成为数据分析和可视化领域的重要工具。无论你是数据分析的新手,还是经验丰富的专业人士 ...
2025-01-10完全靠数据决策,真的靠谱吗? 最近几年,“数据驱动”成了商界最火的关键词之一,但靠数据就能走天下?其实不然!那些真正成功 ...
2025-01-09SparkSQL 结构化数据处理流程及原理是什么?Spark SQL 可以使用现有的Hive元存储、SerDes 和 UDF。它可以使用 JDBC/ODB ...
2025-01-09在如今这个信息爆炸的时代,数据已然成为企业的生命线。无论是科技公司还是传统行业,数据分析正在深刻地影响着商业决策以及未来 ...
2025-01-08“数据为王”相信大家都听说过。当前,数据信息不再仅仅是传递的媒介,它成为了驱动经济发展的新燃料。对于企业而言,数据指标体 ...
2025-01-07在职场中,当你遇到问题的时候,如果感到无从下手,或者抓不到重点,可能是因为你掌握的思维模型不够多。 一个好用的思维模型, ...
2025-01-06在现代企业中,数据分析师扮演着至关重要的角色。每天都有大量数据涌入,从社交媒体到交易平台,数据以空前的速度和规模生成。面 ...
2025-01-06在职场中,许多言辞并非表面意思那么简单,有时需要听懂背后的“潜台词”。尤其在数据分析的领域里,掌握常用术语就像掌握一门新 ...
2025-01-04在当今信息化社会,数据分析已成为各行各业的核心驱动力。它不仅仅是对数字进行整理与计算,而是在数据的海洋中探寻规律,从而指 ...
2025-01-03又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-03在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-03在数据分析的江湖里,有两个阵营总是争论不休。一派信奉“大即是美”,认为数据越多越好;另一派坚守“小而精”,力挺质量胜于规 ...
2025-01-02数据分析是一个复杂且多维度的过程,从数据收集到分析结果应用,每一步都是对信息的提炼与升华。可视化分析结果,以图表的形式展 ...
2025-01-02在当今的数字化时代,数据分析师扮演着一个至关重要的角色。他们如同现代企业的“解密专家”,通过解析数据为企业提供决策支持。 ...
2025-01-02数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪 ...
2024-12-31数据分析,听起来好像是技术大咖的专属技能,但其实是一项人人都能学会的职场硬核能力!今天,我们来聊聊数据分析的核心流程,拆 ...
2024-12-31提到数据分析,你脑海里可能会浮现出一群“数字控”抱着电脑,在海量数据里疯狂敲代码的画面。但事实是,数据分析并没有你想象的 ...
2024-12-31关于数据分析师是否会成为失业高危职业,近年来的讨论层出不穷。在这个快速变化的时代,技术进步让人既兴奋又不安。今天,我们从 ...
2024-12-30