R中的apply族函数 如果计算涉及到一个单一的向量,而结果也是一个向量,tapply函数是一个可选项,不同于aggregate函数,它返回一个向量或数组,这使得其单个元素很容易被访问。 将组定义为矩阵的行或列,即 ...
2017-02-19R语言中的离群值检测和处理 数据中的离群值往往会扭曲预测结果并影响模型精度,回归模型中离群值的影响尤其大,因此我们需要对其进行检测和处理。 离群值检测的重要性 处理离群值或者极端值并不是数据建 ...
2017-02-19简单的认识R语言和逻辑斯蒂回归 在生活中并不是所有的问题都要预测一个连续型的数值,比如药剂量,某人薪水,或者客户价值;逻辑斯蒂回归回归它主要用于只有两个结果的分类问题,它定义结果的变量只有两类的值 ...
2017-02-19用R建立岭回归和lasso回归 1 分别使用岭回归和Lasso解决薛毅书第279页例6.10的回归问题 例6.10的问题如下: 输入例题中的数据,生成数据集,并做简单线性回归,查看效果 cement <- data.frame(X1 = c( ...
2017-02-19R贱客之apply族 为什么贱客呢?主要是因为apply函数家族的几个函数经常容易搞混,有时候不知道该用哪个函数才合适呢?现在我就给咱们把apply函数家族细细说来,让这个贱客变成真正的剑客! apply函数 app ...
2017-02-19R语言SQL管理数据库的方法 SQL,是结构语言化查询语言(Structured Query Language)的简称。SQL语言是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统;同时也是数据库脚本文件 ...
2017-02-18最棒的7种R语言数据可视化 随着数据量不断增加,抛开可视化技术讲故事是不可能的。数据可视化是一门将数字转化为有用知识的艺术。 R语言编程提供一套建立可视化和展现数据的内置函数和库,让你学习这门艺术 ...
2017-02-18用R语言进行数据探索 这一次我们来说一下数据的探索性分析,R语言图标100X76 1) 主要分析工具 主要的图形表示方法有 1条图(barplot):用于分类数据。 2.直方图(hist)、点图(dotchart)、茎叶图(stem) ...
2017-02-18JAVA如何与R完美结合起来 为什么要用java调用R? Java作为一个非常流行的编程语言,具有功能强大和简单易用两个特征。Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的 ...
2017-02-18R语言直接调用Java代码 我们都知道Java语言长期处于霸主地位,在所有编程语言排行榜中,Java也是常年位居第一。在近几年也是爆炸式发展,几乎覆盖到了应用开发的所有领域。而R语言则在统计圈和数据可视化处于佼 ...
2017-02-18python数据分析笔记—数据加载与整理 数据加载 导入文本数据 1、导入文本格式数据(CSV)的方法: 方法一:使用pd.read_csv(),默认打开csv文件。 9、10、11行三种方式均可以导入文本 ...
2017-02-18R语言,如何切换镜像 这个技巧很重要,一般来说,R语言自带的install.packages函数来安装一个包时,都是用的默认的镜像! 如果你是用的Rstudio这个IDE,你的默认镜像就是:https://cran.rstudio.com/ 如 ...
2017-02-17R语言学习-基础篇 从2月10日开始自学R in action,将我的学习所得逐渐发布在这。 chapter1.新手上路 工作空间:存储着所有用户定义的对象(向量,矩阵,函数,数据框,列表); 当前 ...
2017-02-17R语言学习笔记三 10)求解线性方程组和逆矩阵 Solve函数求出a%*%x=b中的x向量值,即求解线性方程组,通常使用前2个参数,第一个是a,为系数矩阵,第二是b为常数项,当b缺失时,默认为单位矩阵。 ax=b=>ax= ...
2017-02-17R语言学习笔记二 今天主要学习了两个统计学的基本概念:峰度和偏度,并且用R语言语言来描述。 > vars<-c(\"mpg\",\"hp\",\"wt\") > head(mtcars[vars]) mpg hp wt Mazda RX4 21.0 110 2.620 Mazda RX4 Wag ...
2017-02-17R语言学习笔记与感悟一 学习内容:1.理解数据分析系统2.R与RStudio的关系、RStudio的基本使用3.注意事项、帮助函数、管理工作空间的函数、文本与图形的输入与输出4.数据结构、数据的输入5.添加变量标签和值标签 ...
2017-02-17利用R语言对游戏用户进行深度挖掘 随着游戏市场竞争的日趋激烈,在如何获得更大收益延长游戏周期的问题上,越来越多的手机游戏开发公司开始选择借助大数据,以便挖掘更多更细的用户群、了解用户习惯来进行精细 ...
2017-02-17R语言之正则表达式 正则表达式表通常被用来检索、替换那些符合某个模式(规则)的文本。在我看来,正则表达式的主要用途有两种:①查找特定的信息②查找并编辑特定的信息,也就是我们经常用的替换。。比如我们要 ...
2017-02-16R语言:表格的线图转化 最先选取的是北京各区普通住宅成交十年(2016年及2006年)涨幅对比。这张图比较plain,主要拿来练习: 1.数据表格的基本整理及计算 2. 数据的初步分析 3.线图的基本绘图 ...
2017-02-16R语言初学者必须要知道的事儿 2017年1月24日晚8点半,乐逗游戏挖掘团队负责人、资深R语言用户谢佳标带来了主题为“数据分析利器:R语言快速入门”的Chat交流。以下是主持人孙莫默整理的实录,记录了谢佳标与读 ...
2017-02-16统计学基础 - 理解统计学的基本概念和方法是数据分析师必备的技能之一。统计学为他们提供了处理数据、进行推断和建模的基础。 数 ...
2024-11-25数据分析师在如今信息爆炸的时代扮演着至关重要的角色。他们不仅需要具备扎实的数据分析技能,还需要不断学习和适应不断发展的技 ...
2024-11-25数据分析师的工作职责涉及多个关键方面,从数据的获取到处理、分析再到可视化,旨在为企业的决策提供有力支持。让我们深入了解数 ...
2024-11-25数据分析师:洞察力量的引擎 数据分析师的兴起 数据分析师行业目前正处于快速发展阶段,市场需求持续增长,薪资水平也有所提升。 ...
2024-11-25数据收集与整理 - 从各种来源收集数据,清洗和整理以确保数据质量和可用性。 数据分析与建模 - 运用统计学方法和机器学习模型对 ...
2024-11-25数据分析是当今社会中不可或缺的一项技能,涵盖了广泛的工具和技术。其中,掌握各种数据处理函数对于数据分析师至关重要。本文将 ...
2024-11-25“大数据治理”是一个涵盖广泛的复杂概念,其核心在于确保大规模、多样化的数据资源能够被有效管理和利用。不仅涉及数据的采集、 ...
2024-11-25一、引言 背景介绍 随着信息技术的快速发展和互联网的普及,大数据已经成为现代社会的重要资产。大数据的兴起不仅推动了各行各业 ...
2024-11-25《Python数据分析极简入门》 第2节 7 Pandas分组聚合 分组聚合(group by)顾名思义就是分2步: 先分组:根据某列数据的值进行 ...
2024-11-25数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22