数据挖掘分类方法小结_数据挖掘中的基于决策树的分类方法 数据仓库,数据库或者其它信息库中隐藏着许多可以为商业、科研等活动的决策提供所需要的知识。分类与预测是两种数据分析形式,它们可以用来抽取能够描 ...
2016-12-14哑变量 虚拟变量 线性回归_spss 线性回归 哑变量 哑变量又称虚拟变量(Dummy Variable),又称虚设变量、名义变量或哑变量,是量化了的质变量,通常取值为0或1。 在研究一个因变量的时候,解释变量中除了定 ...
2016-12-13标准化矩阵 协方差矩阵 相关系数矩阵 在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。 期望值分别为E(X) = μ 与 E( ...
2016-12-13样本方差为什么分母N-1 自由度_样本方差自由度 样本方差不是让你就算出样本方差来,而是用样本方差来估计总体方差,如果用n做分母那么算出的方差不是无偏估计,也就是说n做分母的样本方差的期望值不等于总体方差的 ...
2016-12-13数据挖掘分类技术_数据挖掘分类 1、过分拟合问题: 造成原因有:(1)噪声造成的过分拟合(因为它拟合了误标记的训练记录,导致了对检验集中记录的误分类);(2)根据少量训练记录做出分类决策的模型也容易 ...
2016-12-13SQL Server中存储过程比直接运行SQL语句慢的原因 在很多的资料中都描述说SQLSERVER的存储过程较普通的SQL语句有以下优点: 存储过程只在创造时进行编译即可,以后每次执行存储过程都不需再重新编译,而我们 ...
2016-12-13在Excel中使用频率最高的函数的功能和使用方法 在Excel中使用频率最高的函数的功能和使用方法,按字母排序: 1、ABS函数 函数名称:ABS 主要功能:求出相应数字的绝对值。 使用格式:ABS(number) ...
2016-12-13数据库范式1NF 2NF 3NF BCNF实例分解 设计范式(范式,数据库设计范式,数据库的设计范式)是符合某一种级别的关系模式的集合。构造数据库必须遵循一定的规则。在关系数据库中, 这种规则就是范式。 关系数据 ...
2016-12-12一个普通数据挖掘工程师的成长经历_数据挖掘工程师辛苦吗 不知不觉毕业两年多了,有些想入门的朋友总想了解一下我是怎么学习数据挖掘、数据分析的,我就综合大家常见的问题分享一下自己的经历经验。 首先我不 ...
2016-12-12大数据和数据挖掘_大数据数据挖掘区别 大数据是不是数据挖掘的延伸?两者的相似度有多少? 数据挖掘基于数据库理论,机器学习,人工智能,现代统计学的迅速发展的交叉学科,在 ...
2016-12-12数据挖掘技术的应用领域_数据挖掘应用前景 很多公司已成功地部署了数据挖掘应用系统。随着这一技术的早期采用者已经逐步趋于信息密集型工业时,例如财务服务和直邮市场公司,这一技术已经对任何想利用一个大的 ...
2016-12-12关于模型检验的ROC值和KS值的异同_ROC曲线和KS值 按我的理解,ROC曲线是累计坏占比曲线(图中蓝色曲线)下面的面积(>0.5),KS值是累计坏占比曲线-累计好占比曲线差值(图中红色曲线)的最大值。实际上他们都 ...
2016-12-11机器学习实战之朴素贝叶斯 一、概述 朴素贝叶斯分类算法是基于概率论中的贝叶斯公式得到的,也是比较常用的一种算法,而朴素代表的是属性之间的独立性,这样联合概率可以转换成各概率分量的乘积。 二、算法思想 ...
2016-12-11用R语言求概率分布_r语言 概率分布图 R语言一个很方便的用处是提供了一套完整的统计表集合。函数可以对累积分布函数P(X≤x),概率密度函数,分位函数(对给定的q,求满足P(X≤x) > q的最小x)求值,并根据分布 ...
2016-12-11Python的lambda匿名函数 lambda函数也叫匿名函数,即,函数没有具体的名称。先来看一个最简单例子: def f(x): return x**2 print f(4) Python中使用lambda的话,写成这样 g = lambda x : x**2 print ...
2016-12-11二次指数平滑法摘抄_二次指数平滑法算例 指数平滑法是一种特殊的加权平均法,加权的特点是对离预测值较近的历史数据给予较大的权数,对离预测期较远的历史数据给予较小的权数,权数由近到远按指数规律递减,所 ...
2016-12-11SPSS—非线性回归(模型表达式)案例解析 由简单到复杂,人生有下坡就必有上坡,有低潮就必有高潮的迭起,随着SPSS的深入学习,已经逐渐开始走向复杂,今天跟大家交流一下,SPSS非线性回归,希望大家能够指点一二 ...
2016-12-11最优尺度回归分析_SPSS统计分析案例 1、什么是最优尺度回归? 英文简称CATREG,也称分类回归。 普通线性回归对数据的要求十分严格,当遇到分类变量时,线性回归无法准确地反映分类变量不同取值的距离,比如 ...
2016-12-10R ceiling、round & floor_r语言 R语言里面数字取整相关的操作有一组函数: ceiling ;floor;trunc; round; signif ceiling返回对应数字的\'天花板\'值,就是不小于该数字的最小整数 a<-(1,2.5,3.2,3 ...
2016-12-10R语言之主成分分析_用R语言写主成分分析的代码 1、关键点 综述:主成分分析 因子分析 典型相关分析,三种方法的共同点主要是用来对数据降维处理的 从数据中提取某些公共部分,然后对这 些公共部分进行分析和 ...
2016-12-10大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31