cda

数字化人才认证

首页 > 行业图谱 >

一文带你了解中文文本分类的关键技术--中文分词

一文带你了解中文文本分类的关键技术--中文分词
2020-07-28
通常来说,计算机对于网络上存在的大量半结构化或结构化的文本数据,计算机很难直接进行处理,因此我们需要在文本分类之前对这些数据作相应的预处理。 文本的预处理分为:文本分词、去除停用词、词义消歧、统 ...

数据工程师需要掌握的18个python库

数据工程师需要掌握的18个python库
2020-07-24
python之所以这么火,是因为它的应用广泛,之所以应用广泛,是因为它包含有许多功能强大的库。对于不是专业数据分析人员的我们,平时在工作和生活中,主要是用python来获取信息,制作可视化报表,但是专业的数据工 ...

数据分析师,如何打造人见人爱的数据产品

数据分析师,如何打造人见人爱的数据产品
2020-07-24
文章来源: 接地气学堂 作者: 接地气的陈老师 上一篇《数据分析师的绩效,该如何考核?》引发同学们很大反响。很多同学表示:我明明做了BI,可为啥体现不了业绩,甚至平时看报表的人都不多。 ...

EXCEL中的数据透视表这个功能如何使用?

EXCEL中的数据透视表这个功能如何使用?
2020-07-20
怎样让EXCEL表中的数字活起来,更直观、更形象的表达出数据的结果呢?答案当然是:制成图表啦。今天小编跟大家分享的就是如何使用EXCEL中的数据透视表功能,希望对大家有所帮助。 一、首先让我们了解一下什么是E ...

2020年底前全面取消事业编制,32种事业编工种受殃及……

2020年底前全面取消事业编制,32种事业编工种受殃及……
2020-07-17
据悉,从事生产经营活动的事业单位,将在2020年底前全部转企业,取消事业编制,在职职工转为签订劳动合同,不再是原有的事业单位聘用合同。 此次改革受到波及的事业单位主要有32类,如:工程建设、维修、养 ...

快速教会你EXCEL重复值处理常用的几个小技巧!

快速教会你EXCEL重复值处理常用的几个小技巧!
2020-07-17
EXCEL是我们在工作中经常用到的数据统计和分析工具,我们在使用EXCEL分析数据,制作图表时经常会遇到有重复值需要处理的状况,今天小编与大家分享的就是EXCEL重复值处理的一些方法和技巧,希望对大家有所帮助。 ...

吃货的自我修养 | 口味虾哪家最好吃?我用python告诉你

吃货的自我修养 | 口味虾哪家最好吃?我用python告诉你
2020-07-14
CDA数据分析师 出品 作者:Mika、真达 数据:真达 后期:泽龙 【导读】今天我们用数据来聊一聊口味虾。 Show me data,用数据说话 今天我们聊一聊 口味虾 说起湖南这个地方,大家想到的 ...

B2B的用户画像怎么做?

B2B的用户画像怎么做?
2020-07-13
来源:接地气学堂微信公众号 作者:接地气的陈老师 分享一个B2B用户画像的做法。网上流传的资料大多是B2C相关的,导致在B2B企业的同学很困惑:”老师,说是RFM模型,可我们的客户都是n久没有一张单,一张订 ...

终于有人把数据科学、机器学习和人工智能讲明白了

终于有人把数据科学、机器学习和人工智能讲明白了
2020-07-10
作者:Alex Castrounis 来源:大数据DT(ID:hzdashuju) 内容摘编自《AI战略:更好的人类体验与企业成功框架》 导读:本文讨论与人工智能相关的概念和技术,包括机器学习、深度学习、数据科学和大数据。还 ...

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了
2020-07-13
作者:张良均 谭立云 刘名军 江建明 来源:大数据DT(ID:hzdashuju) 内容摘编自《Python数据分析与挖掘实战》(第2版) 导读:数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是 ...

干活的干不过写PPT的?或许只是工作汇报的方式错了……

干活的干不过写PPT的?或许只是工作汇报的方式错了……
2020-07-09
还记得那首火爆全网,根据沙漠骆驼改编的大胆神曲《释放自我》吗? 当时可谓掀起了巨浪,其歌词精炼,一针见血,令人印象最深刻的是“干活的累死累活,有成果那又如何,到头来干不过写PPT的”。 歌词 ...
mysql数据库(库操作和表操作)常用基本命令汇总
2020-07-09
库: show databases;显示所有数据库 create database <数据库名> ;创建数据库 use <数据库名>;使用数据库 drop <数据库名> 直接删除数据库, 不提醒 show tables; 查看当前数据库中的表 desc na ...

你需要掌握的4种常用数据降维方法

你需要掌握的4种常用数据降维方法
2020-07-09
近来数据记录和规模属性都在急剧增长,由于大多数数据挖掘算法都是直接逐列处理数据,因此导致算法越来越慢。为了保证减少数据列数的同时,丢失的数据信息尽可能少, 数据降维处理算法应运而生。 一、降维的 ...

关于numpy概念的简单理解

关于numpy概念的简单理解
2020-07-06
numpy是Python中科学计算的基础包。它是一个Python库,提供多维数组对象,各种派生对象(如掩码数组和矩阵),以及用于数组快速操作的各种API,有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、 ...

分析20万条弹幕告诉你,8.9分的高分剧《隐秘的角落》到底好看在哪儿?

分析20万条弹幕告诉你,8.9分的高分剧《隐秘的角落》到底好看在哪儿?
2020-06-30
最近这部《隐秘的角落》彻底火了,目前在豆瓣高达8.9分,有45万余人进行了评论。 一时间剧中张东升那句「爬山」、「你说我还有机会吗」 承包了6月份的梗。各种表情包和段子齐飞。 ...
SQL:窗口函数的简介和分类
2020-06-29
函数大家都知道,那么窗口函数呢?窗口是标准的SQL术语,用来描述SQL语句内OVER子句划定的内容,这个内容就是窗口函数的作用域。下面就跟小编一起来看窗口函数的具体内容吧。 窗口函数是 SQL 中一类特别的函数, ...

哪些数据库是行存储?哪些是列存储?有什么区别?

哪些数据库是行存储?哪些是列存储?有什么区别?
2020-06-28
作者:Alex Petrov 来源:大数据DT(ID:hzdashuju) 内容摘编自《数据库系统内幕》 导读:本文带你了解面向列与面向行的数据库。 大多数数据库系统存储一组数据记录,这些记录由表中的列和行组成。 ...
EXCEL数据透视表的制作方法
2020-06-24
数据透视表堪称是EXCEL最强大的功能了,是一种交互式的表,可以进行某些计算,如求和与计数等。所进行的计算与数据跟数据透视表中的排列有关。之所以称为数据透视表,是因为可以动态地改变它们的版面布置,以便按 ...

从Hadoop到ClickHouse,现代BI系统有哪些问题?如何解决?

从Hadoop到ClickHouse,现代BI系统有哪些问题?如何解决?
2020-06-24
导读:一次机缘巧合,在研究BI产品技术选型的时候,我接触到了ClickHouse,瞬间就被其惊人的性能所折服。这款非Hadoop生态、简单、自成一体的技术组件引起了我极大的好奇。那么ClickHouse好在哪呢?本文带你做一个 ...
SQL结构化查询语言分类
2020-06-24
SQL是数据分析常用的一种工具,今天跟小编一起来学习一下SQL结构化查询语言都有哪些分类吧。 结构化查询语言(英语:Structural Query Language,缩写:SQL),是一种特殊目的之编程语言,用于数据库中的标准数据 ...

OK