PROC REPORT基础-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读PROC REPORT基础

PROC REPORT基础

2016-05-04

PROC REPORT基础

1 PROC REPORT语法

PROC REPORT data= SAS-data-set options ;

COLUMNS variable_1 …. variable_n;

DEFINE variable_1;

DEFINE variable_2;

. . .

DEFINE variable_n;

COMPUTE blocks

BREAK … ;

RBREAK … ;

RUN;

COLUMNS：指定输出到报表的列

DEFINE：上述列的格式等

COMPUTE：计算模块

BREAK / RBREAK：生成合计，或报表其它类型的格式。

PROC REPORT的选项Options有很多，下面介绍几个常用的：

DATA= 指定做报表的数据集

PROMPT= PROMPT模式

NOWINDOWS= 不输出到结果

REPORT = 指定一个存储的报表来生成新报表

OUTREPT= 指定新路径来存放报表

OUT= 建立新数据集

HEADLINE 在报表变量标题和内容间生成一个水平分隔线

HEADSKIP 在报表变量标题和内容间生成一行空格

2 先生成一个基本的报表

先生成数据：

data mnthly_sales;

length zip $ 5 cty $ 8 var $ 10;

input zip $ cty $ var $ sales;

label zip="Zip Code"

cty="County"

var="Variety"

sales="Monthly Sales";

datalines;

52423 Scott Merlot 186.

52423 Scott Chardonnay 156.61

52423 Scott Zinfandel 35.5

52423 Scott Merlot 55.3

52388 Scott Merlot 122.89

52388 Scott Chardonnay 78.22

52388 Scott Zinfandel 15.4

52200 Adams Merlot 385.51

52200 Adams Chardonnay 246

52200 Adams Zinfandel 151.1

52200 Adams Chardonnay 76.24

52199 Adams Merlot 233.03

52199 Adams Chardonnay 185.22

52199 Adams Zinfandel 95.84

;

run;

Proc Report生成最基本的报表：

proc report data=mnthly_sales

headline headskip ;

title1 "Simple Report";

column cty zip var sales;

define cty / display width=6 'County/Name';

define zip / display;

define var / display;

define sales / display format=6.2 width=10;

run;

这里的define后面的’/’，其后面有很多选项来对变量格式，输出方式等进行设置，其选项如下：

GROUP：分组显示

DISPLAY：一般显示

ANALYSIS：其值用于计算或统计

ORDER：按其值排序显示

ACROSS：交叉显示

COMPUTED：其值在compute块里计算得到

结果：

3 使用order，按指定变量名排序显示

proc report data=mnthly_sales

headline headskip ;

title1 "Simple Report";

column cty zip var sales;

define cty / order width=6 'County/Name';

define zip / display;

define var / display;

define sales / display format=6.2 width=10;

run;

结果：

4 group分组显示

proc report data=mnthly_sales nofs

headline headskip ;

title1 "Simple Report";

column cty zip var sales;

define cty / group width=6 'County/Name';

define zip / group;

define var / group order=freq descending;

define sales / display format=6.2 width=10;

run;

结果：

5 analysis，统计量求和

proc report data=mnthly_sales nofs

headline headskip ;

title1 "Simple Report";

column cty zip sales;

define cty / group width=6 'County/Name';

define zip / group;

define sales / analysis sum format=6.2 width=10;

run;

结果：

6 求多个统计量

proc report data=mnthly_sales nofs

headline headskip ;

title1 "Simple Report";

column cty zip sales sales=mean_sales;

define cty / group width=6 'County/Name';

define zip / group;

define sales / analysis sum format=6.2 width=10 'sum';

define mean_sales / analysis mean format=6.2 width=10 'Mean of/Sales';

run;

结果：

7 如果你想让某变量的每一个值都作为一列，那就要用到across。这里要注意的是，有across选项的var，在column时后面加了一个’,’，从而将其后面的变量的数据直接放到across变量下。。

proc report data=mnthly_sales nofs headline headskip;

title1 "Cross Tab Report (Across Type)";

column cty zip var,sales;

define cty / group width=6 'County/Name';

define zip / group;

define var / across order=freq descending '- Grape Variety -';

define sales / analysis sum format=6.2 width=10 'Revenue';

run;

结果：

这里，变量variety的每一个值都成为了新的列

8 BREAK与RBREAK，对分组后的报表汇总

proc report data=mnthly_sales nofs headline headskip;

title1 "Report with Breaks";

column cty zip var,sales;

define cty / group width=6 'County/Name';

define zip / group;

define var / across order=freq descending '- Grape Variety -';

define sales / analysis sum format=6.2 width=10 'Revenue';

break after cty / ol skip summarize suppress;

rbreak after / dol skip summarize;

run;

结果：

这里说明一下BREAK与RBREAK后面的选项：

OL 汇总上方加一条线

DOL汇总上方加两条线

UL汇总下方加一条线

DUL 汇总下方加两条线

summarize 对每组进行汇总

skip 加入一空白行

suppress 在汇总行不显示组名

9 compute块，计算统计变量，这个以后将专门介绍

proc report data=mnthly_sales nofs headline headskip;

title1 "Report with Row Sums (Computed Type)";

column cty zip var,sales row_sum;

define cty / group width=6 'County/Name';

define zip / group;

define var / across order=freq descending '- Grape Variety -';

define sales / analysis sum format=6.2 width=10 'Revenue';

define row_sum / computed format=comma10.2 'Total';

break after cty / ol skip summarize suppress;

rbreak after / dol skip summarize;

compute row_sum;

row_sum = sum(_C3_,_C4_,_C5_,_C6_,_C7_,_C8_);

endcompute;

run;

结果：

Compute块是以compute开始，endcompute为结尾，可以计算出很多复杂的数据。这里的_C*_表示第几列的变量，例如_C3_表示第三列，_C#_代表最后一行。这里的_C7_和_C8_是多余的，但不影响结果。

10 proc report与ODS，以后会详细介绍。这里用ODS输出report过程结果，方法很简单，就是将上面的report代码放入ods语句之间。

ods listing close;

ods rtf file = ‘c:sugi30.rtf’;

上面的proc report过程代码放在这里就行

ods rtf close;

即：

ods listing close;

ods rtf file = 'c:sugi30.rtf';

proc report data=mnthly_sales nofs headline headskip;

title1 "Report with Row Sums (Computed Type)";

column cty zip var,sales row_sum;

define cty / group width=6 'County/Name';

define zip / group;

define var / across order=freq descending '- Grape Variety -';

define sales / analysis sum format=6.2 width=10 'Revenue';

define row_sum / computed format=comma10.2 'Total';

break after cty / ol skip summarize suppress;

rbreak after / dol skip summarize;

compute row_sum;

row_sum = sum(_C3_,_C4_,_C5_,_C6_,_C7_,_C8_);

endcompute;

run;

ods rtf close;

结果：

11 report设置style，让报表更炫一点。这个以后也会详细介绍

ods listing close;

ods rtf file = 'c:sugi30.rtf';

proc report data=mnthly_sales nofs headline headskip

style(header)={background=lightskyblue foreground=black}

style(column)={background=lightcyan foreground=black};

title1 "Report with Row Sums (Computed Type)";

column cty zip var,sales row_sum;

define cty / group width=6 'County/Name';

define zip / group;

define var / across order=freq descending '- Grape Variety -';

define sales / analysis sum format=6.2 width=10 'Revenue';

define row_sum / computed format=comma10.2 'Total';

break after cty / ol skip summarize suppress;

rbreak after / dol skip summarize;

compute row_sum;

row_sum = sum(_C3_,_C4_,_C5_,_C6_,_C7_,_C8_);

endcompute;

run;

ods rtf close;

结果：

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇回归系列（一）| 怎样正确地理解线性回归

下一篇2020美国总统竞选大戏开锣，川普当选的奇迹会再发生吗？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

PROC REPORT基础

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】数据清洗全指南：基础核心+常用工具实操 ...

【CDA干货】数据挖掘与数据分析：区别、联系与职场 ...

CDA数据分析师：精通统计制图，让数据规律直观可感 ...

【CDA干货】MySQL分区键后，其他索引还生效吗？真相 ...

【CDA干货】Tableau同比环比增长率实操全指南：从入 ...

CDA数据分析师：特征处理实操指南，打通数据到价值 ...

【CDA干货】机器学习算法工程实用案例解析：从落地 ...

【CDA干货】卷积神经网络与无迹卡尔曼滤波融合：原 ...

CDA数据分析师：数据清洗实操指南，筑牢数据分析的 ...

【CDA干货】决策树模型变量重要性排序：原理、方法 ...

【CDA干货】Excel卡方检验实操全指南：从原理到落地 ...

CDA数据分析师：数据整合实操指南，打破数据孤岛， ...

【CDA干货】数据分析全流程常见问题：成因、危害与 ...

【CDA干货】维度表与事实表：数据仓库的核心双子星 ...

CDA数据分析师：数据读取实操指南，打通数据价值转 ...

【CDA干货】用户行为分析中泛化性指标：计算方法、 ...

【CDA干货】以数为鉴，读懂用户：三大行业用户行为 ...

CDA数据分析师：量化策略分析框架，解锁数据驱动决 ...

【CDA干货】随机森林模型训练全解析：从参数调优到 ...

【CDA干货】随机森林算法重要性分析：原理、实操与 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载