前不久,经管之家邀请到了吉林大学数据学院概率统计系教授朱复康博士参与了论坛的线上互动问答,与广大坛友就
时间序列分析、保险精算等内容进行了交流,小编将问答内容整理如下,以飨读者。
本期嘉宾
朱复康博士,吉林大学数学学院概率统计系教授,研究方向为时间序列分析、保险精算,主要教授时间序列分析、多元统计分析与线性模型、统计软件、概率统计、数理统计、多元统计分析、统计基础等研究生和本科课程,新加坡南洋理工大学访问学者, 美国佐治亚理工学院博士后,现兼任吉林省工业与应用数学学会理事,中国现场统计研究会高维数据统计分会理事,19个英文SCI杂志审稿人,Wiley出版社书稿评审人,德国洪堡基金推荐人等职。
问答汇总
坛友lzguo568:
朱复康老师,我平时喜欢学习有关统计方面知识,也看一些有关时间序列分析、多元统计分析与线性模型的书籍,对统计软件SPSS和R及Python也熟悉。但在实际统计工作中好像这些知识极少用到,一元线性回归用过几次,预测一下十三五期间每年供水总量。我在自来水集团公司做营销管理工作,请老师讲几个有关多远统计分析在自来水行业应用实例,拓宽一下我工作的视野及思路。谢谢!!!
另外我在给排水杂志上看到一篇文章,介绍利用马尔科夫链进行供水调度和管网管理,坦白讲没有看懂。请老师简单介绍一下马尔科夫链。谢谢!!!
朱复康:
1. 这样的实例有很多,仅举一些在中国知网搜索到的三个例子:白云《时间序列特性驱动的供水量预测方法研究及应用》,江潮《陕西省不同区域城区用水定额及需水量预测研究》,朱苹《多元线性回归模型在北京市用水量预测中的应用》。
2. 马尔可夫链,是指具有马尔可夫性质的离散事件随机过程。该过程中,在给定当前信息的情况下,以前的信息对于预测将来是无关的。
坛友飞天大老鼠 :
朱老师,在电力负荷预测方面用时间序列分析可行吗,因为电力数据受天气人口等因素影响随机扰动项比较大,如果预测误差比较大是应该建立综合评价模型还是对原时序模型进行修正?因公司需求刚开始看时间序列这块,请老师指点一下,谢谢!另外,课本里一个例子对随机游动做adf.test检验p值竟然小于0.05,是因为误差吗?如果在实际应用时碰到这种问题该如何解决?
朱复康:
1. 时间序列是可以用来预测电力负荷的,这时候不能简单地采用经典的ARMA模型,而是采用一些时间序列--回归模型,可以参考经典文献R Engle, C.W.J. Granger, J. Rice and A. Weiss, Semi-parametric estimates of the relation between weather and electricity demand, Journal of American Statistical Association 81 (1986): 310-320或者如下网址:https://www.wiwi.hu-berlin.de/de ... FranziskaSchulz.pdf给出的ppt。
2. 单位根检验的结果依赖于你的研究框架(是否具有常数项、是否具有确定时间趋势),不能仅仅通过p值来得出结论,可以参考如下网页的更多讨论:https://www.researchgate.net/pos ... ficiency_in_market2
坛友zxj246:
朱老师好!请问对于金融交易的时间序列数据分析方法中,有没有成功的非线性科学或者说复杂理论的一些模型?国内有些基金和证券公司简单地采用的HURST指数用于量化择时靠谱吗?你的生存模型有没有可能移植到金融交易的时间序列数据分析中,另外传统的富里叶分析等技术对于金融交易的时间序列数据分析还有优势吗?
朱复康:
我的《生存模型》是一门课程,讲授保险精算或生存分析的相关知识,与你说的金融交易无关。理论研究与证券公司采用的方法是有差距的,主要原因是证券公司要求所采用的的方法一定要简单并且能够以极快的速度算出结果。新方法如果优势不是特别明显,一般很少能在实际中得到推广。
坛友0903clili:
朱老师好!请问面板马夫科夫体制转换模型该怎么进行估计和编程呢?
朱复康:
你可以先考虑普通的马尔科夫体制转换模型,这方面有现成的程序包,比如:
https://sites.google.com/site/ma ... ng-models-in-matlab
http://blogs.mathworks.com/pick/ ... g-models-in-matlab/
给出的Matlab程序,在Eviews中也可以,参见网页
http://www.eviews.com/EViews8/ev8ecswitch_n.html
或者R程序包:https://cran.r-project.org/web/packages/MSwM/
在弄懂编程方法的基础上,将现有程序修改使之适合面板情形。
坛友512002855:
朱老师,您好,现在网上公开可以下载的资料或者论文(知网等),您可以推荐两篇关于时间序列解决实际问题的吗?非常感谢!学习了时间序列分析,但是用的时候感觉ARIMA,ARGCH等好像很难拟合的好。
朱复康:
除了前面提到的自来水例子,你可以看看Gait Shmueli著、李洪成翻译的《时间序列预测实践教程》,里面有很多具体的例子。
坛友complicated:
朱老师好,我从事互联网相关工作,所在部门尝试用R语言时间序列包(arima,tsoutliers做过滤)做一些业绩预测的事情。我们的问题是异常波动很剧烈,很频繁。比如收入预测,经常会受周期/力度不等的营销活动的影响,一直没有找到有效处理这些异常的方法,我看到google和twitter开发了一些异常侦测方面的包,但是他们的出发点跟我们的应用场景好像不太一样。希望您能指点一下,谢谢!
朱复康:
一般的处理方法是先进行异常值处理,然后再用常见的模型,但这不适合数据流或者在线预测。可以Online Outlier Detection for Data Streams为主题搜索新方法,也可以参考R帮助文档的第七章http://cran.r-project.org/doc/contrib/Zhao_R_and_data_mining.pdf
你说的twitter不知道是不是指下面的网页:
https://blog.twitter.com/2015/in ... on-in-a-time-series
如果和你的出发点不一样,但是可以借鉴他们的想法为你所用。
坛友HH公子:
朱老师好:探究两组金融市场时间序列数据的相互影响关系,用GARCH类的模型,还是用SVAR之类的模型做分析合适呢?抑或说,研究哪种相关关系适合哪种分析方法呢。谢谢。
朱复康:
多元GARCH模型和结构向量自回归(SVAR)模型都可以用来研究多元时间序列数据,多元GARCH是允许两组数据间有相关性,但不能很好地用来研究这种相关性,相对来说用SVAR合适,它可以捕捉模型系统内各个变量之间的即时的(instantaneous)结构性关系。
坛友hyq2003:
朱老师,你好,请教单位根检验的问题:
1、李子奈《计量经济学》中是这样讲的:用ADF逐次检验(1)含截距和趋势项(2)含截距不含趋势(3)不含截距和趋势项
什么时候平稳就停止检验,三者都不平稳就认为不平稳。但是有的书上说先看时间序列的折线图,根据折线图的形状选择对应的方程形式。
请问:规范的单位根检验过程是怎样的?
2、接上面问题,单位根检验的滞后阶数的选择,李子奈的书上是对残差进行LM检验,以没有自相关为标准,请问这样对吗?,EViews中怎样在进行ADF检验的同时完成残差的LM检验?
3、月度数据获季度数据在进行单位根检验之前需要进行季节调整吗?
朱复康:
1. 李的书应该没有错误,根据折线图具有很大人为的随意性,可以参阅Harvey et al. (2009, Econometric Theory, 25, 587–636)的论文,下载网址:
http://econweb.tamu.edu/keli/Fall2011_679/Readings/HLT2009.pdf
2. 统计学中没有对与错之分,只有好与坏之分。这个问题实际上本论坛已经讨论过,参见
http://bbs.pinggu.org/thread-1109346-1-1.html
http://bbs.pinggu.org/thread-2171661-2-1.html
引用一段话作为答案吧“滞后阶数的问题。最佳滞后阶数主要根据AIC SC准则判定,当你选择好检验方式,确定好常数项、趋势项选择后,在lagged differences栏里可以从0开始尝试,最大可以尝试到7。你一个个打开去观察,看哪个滞后阶数使得结论最下方一栏中的AIC 和SC值最小,那么该滞后阶数则为最佳滞后阶数。”
3. 最好先做季节调整,以消除季节趋势,再做单位根检验。
坛友condmn:
朱老师好!您如何看待时间学列和动态随机一般均衡等新模型的结合?如何看待现在越来越多的顶级期刊应用时间序列越来越少?
朱复康:
时间序列只有和其它领域结合才能显示其强大生命力,而不是固步自封于自己的小圈子,比如,JTSA杂志2012年9月出了一期专刊,介绍时间序列在生物科学中的应用。至于顶级期刊的论文少,可能的原因是时间序列最近一段时间的重大进展比较少,这不是说时间序列没有研究问题了,而是难点问题还没有解决。
坛友mings:
问题一:在宏观经济研究中,在多元线性回归模型中,随着在模型中增减变量、甚至常数项,核心解释变量的符号会变?问题出在哪里?如何修正。如何选择正确并区分错误的。
问题二:在宏观经济研究中,多元线性回归出现修正R^2位负数,是什么原因,如何修正?
问题三:在宏观经济研究中,可以替换变量,或者增减变量,也可以变化模型的形式(例如解释变量为一次,可以变为二次),如何评价、选择这些模型。
在模型中加入了一阶AR(1),模型的修正R^2变为了1,原来是0.23,如何解释?这是所谓的饱和模型么?这个模型是否需要修正,具体如何做?
另外,朱老师。请问您,宏观指数时间系列数据,应该选择什么样的模型?目的是为了 解释指数如何变化。
能将其作为被解释变量进行回归么?还是如何?感谢!
朱复康:
1. 这是因为很多变量之间具有交互效应,所以一些变量的系数符号会改变。除了多元线性回归,还可以考虑线性混合效应模型,根据一定的准则找出最好的模型。
2. 这归咎于模型中较多的变量个数,这一变量个数与方差的自由度密切相关。
3. 根据一些信息准则(如AIC和BIC)进行模型筛选。
R^2的变动不能说明什么,因为两种情形下R^2本身的定义不同。
这与你考虑的指数有关,比如,居民消费价格指数可以用乘积季节模型,也可以用非参数自回归模型。
坛友zxj246:
朱老师好!统计工具能否揭示周期循环与非周期循环?
朱复康:
一些人认为是能做到的,比如下面这篇论文
http://escholarship.org/uc/item/9jv108xp#page-1
本文由经管之家CDA数据分析师独家整理,转载请注明来源
CDA数据分析师考试相关入口一览(建议收藏):
▷ 想报名CDA认证考试,点击>>>
“CDA报名”
了解CDA考试详情;
▷ 想加入CDA考试题库,点击>>> “CDA题库” 了解CDA考试详情;
▷ 想学习CDA考试教材,点击>>> “CDA教材” 了解CDA考试详情;
▷ 想查询CDA考试成绩,点击>>> “CDA成绩” 了解CDA考试详情;
▷ 想了解CDA考试含金量,点击>>> “CDA含金量” 了解CDA考试详情;
▷ 想获取CDA考试时间/费用/条件/大纲/通过率,点击 >>>“CDA考试官网” 了解CDA考试详情;