cda

数字化人才认证

首页 > 行业图谱 >

R语言实现分层抽样(Stratified Sampling)以iris数据集为例

R语言实现分层抽样(Stratified Sampling)以iris数据集为例
2017-07-02
R语言实现分层抽样(Stratified Sampling)以iris数据集为例 1.观察数据集 head(iris)   选取数据集中前6个数据,我们可以看出iris数据集一共有5个字段。 dim(iris)   iris数据集一 ...

R语言生存分析

R语言生存分析
2017-07-01
R语言生存分析 生存分析涉及预测当特定事件将要发生的时间。它也被称为故障时间分析,或死亡时间的分析。例如,预测天的人患有癌症将生存的数量和预测时间时机械系统是要失败。 在R中包名为 survival 是用来 ...

数据仓库的几个原则,让你避免“陷阱”

数据仓库的几个原则,让你避免“陷阱”
2017-06-30
数据仓库的几个原则,让你避免“陷阱” 想要数据粒度的合理性、模型的灵活性得到保证,并且能够适应未来的信息资源,需要遵守维度建模的一些原则。否则,很容易会遇到数据仓库障碍,并且把用户弄糊涂。 1.原 ...

SPSS数据标准化分析处理方法分析

SPSS数据标准化分析处理方法分析
2017-06-29
SPSS数据标准化分析处理方法分析 进行多元统计分析时,我们往往要收集不同量纲的数据,比如销售总额(万元),利润率(百分数)。这表现为变量在数量级和计量单位上的差别,从而使得各个变量之间不具有综合性, ...

8种常被忽视的SQL错误用法

8种常被忽视的SQL错误用法
2017-06-23
8种常被忽视的SQL错误用法 1. LIMIT 语句 分页查询是最常用的场景之一,但也通常也是最容易出问题的地方。比如对于下面简单的语句,一般 DBA 想到的办法是在 type, name, create_time 字段上加组合索引。这 ...

大数据技术体系中的语义分析

大数据技术体系中的语义分析
2017-06-18
大数据技术体系中的语义分析 本文介绍了语义的相关概念、特征,指出语义分析技术在大数据挖掘中的重要性,并给出了示例。 一、什么是语义 在现实世界中,事物所代表的概念的含义,以及它与其他概念之间的 ...

大数据在价格认定工作中的运用前景浅析

大数据在价格认定工作中的运用前景浅析
2017-06-17
大数据在价格认定工作中的运用前景浅析 大数据的爆炸式增长在大容量、多样性和高增速方面,全面考验着我们的数据处理和分析能力,同时,也带来了获取更丰富、更深入和更准确地洞察市场行为的大量机会。关于数据 ...

使用R语言预测泰坦尼克号乘客生存率

使用R语言预测泰坦尼克号乘客生存率
2017-06-09
使用R语言预测泰坦尼克号乘客生存率 1912年4月10日,号称 “世界工业史上的奇迹”的豪华客轮泰坦尼克号开始了自己的处女航,从英国的南安普顿出发驶往美国纽约,4月14日晚,泰坦尼克号在北大西洋撞上冰山而倾覆 ...

13个真实世界情景中的数据科学应用

13个真实世界情景中的数据科学应用
2017-06-06
13个真实世界情景中的数据科学应用 现在让我们看看13个在真实世界情景下的例子,了解现代数据科学家可以帮助我们做些什么。这些例子将有助于你学习如何专注于一个问题和如何形式化一个问题,以及如何仔细评估所 ...

如何写出高性能SQL语句

如何写出高性能SQL语句
2017-06-03
如何写出高性能SQL语句 1、 首先要搞明白什么叫执行计划? 执行计划是数据库根据SQL语句和相关表的统计信息作出的一个查询方案,这个方案是由查询优化器自动分析产生的,比如一条SQL语句如果用来从一个 10万 ...

SQL优化经验总结34条

SQL优化经验总结34条
2017-06-03
SQL优化经验总结34条 我们要做到不但会写SQL,还要做到写出性能优良的SQL,以下为笔者学习、摘录、并汇总部分资料与大家分享! (1) 选择最有效率的表名顺序(只在基于规则的优化器中有效): ORACLE 的解 ...

Hadoop常见错误和处理方式

Hadoop常见错误和处理方式
2017-05-28
Hadoop常见错误和处理方式   常见问题及处理 mysql版本,必须是MYSQL5.1。 查询办法mysqladmin version 在建立hive数据库的时候,最好是:create database hive; oozie的数据库,同样:create ...

利用SQL查询扶贫对象医保报销比率的审计方法

利用SQL查询扶贫对象医保报销比率的审计方法
2017-05-27
利用SQL查询扶贫对象医保报销比率的审计方法 扶贫资金惠及贫困百姓的切身利益,主管部门多,资金实行逐级下拨,并且扶贫项目小而分散,主要在乡镇和农村实施。根据湖北省审计厅关于2017年扶贫审计工作方案的精 ...

SQL经典面试题 - 行列转换

SQL经典面试题 - 行列转换
2017-05-27
SQL经典面试题 - 行列转换 在我们的实际工作中,为了研发出功能完整、系统健壮的软件,需要我们测试人员想法设法的去挑出软件的问题,所以很多公司对测试人员的要求甚至高于开发人员,而通过SQL语句的编写,测 ...

在PHP中全面阻止SQL注入式攻击

在PHP中全面阻止SQL注入式攻击
2017-05-26
在PHP中全面阻止SQL注入式攻击 一、 注入式攻击的类型 可能存在许多不同类型的攻击动机,但是乍看上去,似乎存在更多的类型。这是非常真实的-如果恶意用户发现了一个能够执行多个查询的办法的话。 如果你 ...

SQL语句优化技巧

SQL语句优化技巧
2017-05-26
SQL语句优化技巧 1、应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描。 2、对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 ...

SPSSModeler中数据测量类型的含义

SPSSModeler中数据测量类型的含义
2017-05-25
SPSSModeler中数据测量类型的含义 数据测量类型 查看IBM SPSS Modeler 帮助文档,解释如下: • 默认值。具有未知存储类型和值的数据(例如,由于其尚未被读取)将 ...

Hadoop+Hive常用知识总结

Hadoop+Hive常用知识总结
2017-05-24
Hadoop+Hive常用知识总结 1、什么是Hadoop?什么是hive? Hadoop:一个分布式系统基础架构,由Apache基金会开发,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力告诉运算和存 ...

提升数据建模的10种技术措施

提升数据建模的10种技术措施
2017-05-21
提升数据建模的10种技术措施 随着企业有了能够轻松访问和分析数据以提高性能的新机会,数据建模也是变形的。数据建模不仅仅是任意组织数据结构和关系,还必须与最终用户的需求和问题联系起来,并提供指导,帮助 ...

神通广大的10个Excel筛选神技

神通广大的10个Excel筛选神技
2017-05-09
Excel 的筛选(Excel 2003 以及更早的版本叫做筛选成为自动筛选)功能非常强大而且极其实用,操作也很简单。本文整理了其中最实用的 10 技巧(前 6 个技巧为“筛选”的技巧,后 4 个为“高级筛选”的技巧),帮助大 ...

OK