数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。 在数据分析与挖掘中,我们通常需要根据一些数据建立起特定的模型,然后处理。模型的建立需要 ...
2020-07-06进行商业分析时,自然少不了BI分析工具的应用,小编今天就整理了一些常用的BI分析工具,供大家参考。 1.tableau tableau是目前市面上较为成功的BI分析工具。产品既有针对性,又有普适性。拖放式界面,操作简 ...
2020-07-06说到数据管理和数据可视化工具,往往大家第一个想到的就是tableau。tableau是用来做数据的管理和数据可视化的工具,致力于帮助人们查看并理解自己的数据,可以说是在数据分析工具中最好用的数据管理及可视化软件, ...
2020-07-06powerBI 是微软新一代商业分析工具,用于在组织中提供见解。能够根据filter条件,对数据执行动态筛选,从不同的角度和粒度上分析数据;可连接数百个数据源、简化数据准备并提供即席分析;能够把相关的静态数据转换为 ...
2020-07-06概括地说,泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据对背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为 ...
2020-07-03今天小编给大家带来的是现在非常火爆的机器学习方法——集成学习。集成学习,顾名思义,通过将多个单个学习器集成/组合在一起,使它们共同完成学习任务,有时也被称为“多分类器系统(multi-classifier system)”、 ...
2020-07-03今天我们来盘点一下那些常见的机器学习中的损失函数有哪些。 用于计算损失的函数称为损失函数。模型每一次预测的好坏用损失函数来度量。机器通过损失函数进行学习,如果预测值与实际结果偏离较远,损失函数会得 ...
2020-07-03支持向量机是一种二类分类模型.它的基本模型是定义在特征空间上的间隔最大的线性分类器。其学习策略是间隔最大化,可形式化为求解凸二次规划问题,也等价于正则化的合叶损失函数的最小化问题。 支持向量机学习 ...
2020-07-03SVM和LR是机器学习中常用的算法,今天就让我们来看一下这两者有哪些相同点和不同点吧。 SVM和LR的相同点: 1.LR和SVM都是有监督的学习 2.LR和SVM都可以处理分类问题,且一般都用于处理线性二分类问题(在 ...
2020-07-03相信大家在机器学习中,一定常见到;SVC,NvSVC,LinearSVC,今天我们就来看看这三者的区别。 SVC(C-Support Vector Classification): 支持向量分类,基于libsvm实现的,数据拟合的时间复杂度是数据样本的二 ...
2020-07-03支持向量机SVM(Support Vector Machine),是常见的一种判别方法。在机器学习领域,是有监督学习模型,通常用来进行模式识别、分类及回归分析,主要针对小样本数据进行学习、分类和预测,类似的根据样本进行学习的 ...
2020-07-03在机器学习中,有成千上万甚至几十万的维度的数据需要处理,这种情况下机器学习的资源消耗是不可接受的,并且很大程度上影响着算法的复杂度,因此对数据降维是必要的。PCA(Principal Component Analysis)是一种常 ...
2020-07-03函数是组织好的,能够重复使用的,用来实现单一,或相关联功能的代码段。python提供了许多内建函数,这些函数提高了应用的模块性,和代码的重复利用率。下面是小编整理的python内建函数中的反射类,希望对各位学习 ...
2020-07-03echarts是一个纯JavaScript图表库,底层依赖于轻量级的Canvas类库ZRender(矢量图形库),基于BSD开原协议,是一款非常优秀的可视化前端框架。 优点: 1.免费商用 2.兼容当前绝大部分浏览器,包括:IE8/9/1 ...
2020-07-02正态分布(Normal distribution)又称为高斯分布(Gaussian distribution),是统计学中一个重要且常见的连续概率分布。 特性: 1)集中性:曲线的最高峰位于正中央,且位置为均数所在的位置。 2)对称性:正态 ...
2020-07-02数据分析时,数据量大不可怕,可怕的是数据倾斜。当出现数据倾斜时,小量任务耗时远高于其它任务,从而使得整体耗时过大,未能充分发挥分布式系统的并行计算优势。下面小编就给大家分享几种数据倾斜优化的方法,希 ...
2020-07-02文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法,主要用途 ...
2020-07-02echarts是一个使用 JavaScript 实现的开源可视化库,因为其着良好的交互性,精巧的图表设计,受到众多开发者青睐。Python 是一门富有表达力的语言,在数据处理方面很在行。当Python数据分析遇上echarts数据可视化 ...
2020-07-02seaborn是建立在Matplotlib基础之上的高级的API,是比Matplotlib更为高级的的一种python可视化库。专攻于统计可视化,有丰富的可视化库,包括一些复杂类型,如时间序列、联合分布图(jointplots)和小提琴图(violind ...
2020-07-02相信只要接触过python的人,对于matplotlib都很熟悉。matplotlib是一种python可视化库。 matplotlib 是一个用于创建二维图和图形的底层库,是python可视化库中规中矩的一种库,像大多数编程语言的标准库一 ...
2020-07-02持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27