用ols法建立税收与gdp的gdp一元线性回归模型模型,则模型的r2值是多少

 上传我的文档
 下载
 收藏
粉丝量:69
该文档贡献者很忙,什么也没留下。
 下载此文档
计量经济学大作业-------税收与三大产业的关系模型_免
下载积分:1000
内容提示:计量经济学大作业-------税收与三大产业的关系模型_免
文档格式:DOC|
浏览次数:79|
上传日期: 07:44:40|
文档星级:
全文阅读已结束,如果下载本文需要使用
 1000 积分
下载此文档
该用户还上传了这些文档
计量经济学大作业-------税收与三大产业的关系模型_免
关注微信公众号您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
 税收收入预测模型-计量经济学作业.doc 12页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
需要金币:200 &&
 税收收入预测模型-计量经济学作业
你可能关注的文档:
··········
··········
税收收入预测模型
选题背景:
数据挖掘是涉及数据库、统计学等学科的一门相当活跃的研究领域,是从数据集中识别出有效的、新颖的、潜在有效的以及最终可理解的模式的非平凡过程。预测是数据挖掘技术中重要的组成部分。税收收入预测一直是税务部门的一项重要工作,它决定着税收计划的制定,而税收计划的制定是经济活动的一项重要内容。针对目前税收计划的制定仍以基数加预计增长率这一方式进行的现状,要求尽快建立起一套以税收收入预测为基础的科学预测的体系,从而掌握组织收入的主动性。因此利用统计学及数据挖掘的方法科学正确的进行税收预测工作对于税务部门具有非常重要的意义。 本文对数据挖掘的相关概念、过程,统计学的相关知识进行了介绍,将数据挖掘应用于税收预测中,通过对大量历史数据的记录和与之相关的各种数据的分析,使用回归和滚动预测方法建立预测模型,对税收收入情况进行了预测,实现了对2005年度税收收入预测。并对各预测模型进行了实验结果的对比分析,指出滚动预测方法较回归预测方法能更好地进行税收收入分月预测,从而更好地指导税收计划的完成,为科学地建立税收计划进行了有效地探索,并为税收计划工作提供了重要的科学依据。 本文的主要工作是对郑州市国税局征管系统中的征收数据进行挖掘分析,建立回归和滚动预测模型。通过对税收收入问题的研究与实现,从中探索了一些可行的方法,这为税收预测问题提出了一个新的视角。本课题的成果对于税收收入预测体系,特别是基于回归预测和滚动预测的方法具有一定的参考价值。
税收收入预测是指在一定的经济理论指导下,根据经济和税收统计资料,在定性分析的基础上,运用定量方法,对未来税收收入总量和结构等发展趋势所做出的分析、判断和推测。
税收收入预测对税收工作有着
重要的作用,不仅可以为领导制订计划提供数理依据,同时也有助于加强组织收入工作,有助于税务工作者根据经济的变化及时调整相应的政策。
1税收预测工作为税收决策提供科学依据
在税收管理中,经常要做出各种决策。要做到决策科学正确,其前提应是在对客观经济税源的调查研究基础上做出科学的预测。科学的税收预测体现了税收经济规律、税收征管工作和税收发展趋势,为税收决策提供真实、准确、详实的一手材料。没有科学的预测做依据,做出的决策必然难以避免盲目与臆测的成分。
2税收预测工作为制订税收计划提供依据
制定税收计划不仅要掌握和分析实际税源资料,而且应掌握和分析未来经济税源的发展变化趋势。对未来经济税源的发展变化有了科学的预测,制订出的税收计划就有了切实可靠的依据,就可以把税收计划建立在既科学又稳妥的基础之上。
3税收预测工作是实现税收任务的保证
在税收计划执行过程中,为了掌握计划执行情况,分析计划能否完成或超额完成,要利用科学的预测方法对税收计划执行的可能结果进行预先推测,以便提前作好准备,及时采取措施,保证税收任务目标的全面实现。
4税收预测工作是税源管理的起点和终点
税源管理包括税收预测、计划编制、分配落实、税收分析四个环节和税源监控的基本保证,它们之间相互联系、相互作用,构成一个有机的整体。税源监控是税收计划管理的基础和保证,税源监控产生的数据是税收预测的源泉,税收预测是计划编制的前提,计划编制是分配落实的关键,税收分析是分配落实结果的反映。税收预测工作是税源管理的起点和终点。抓住了税收预测工作,就抓住了税源管理的龙头,从而可以有效带动征管工作质量的提高。
税收是国家财政收入的主要来源,也是宏观调控的重要手段。为完善现行的靠经验预测来年税收收入的传统做法,需要引入现代计量经济方法;以使税收收入预测建立在更加科学的基础上,从而为制定税收计划和国家预算提供科学的依据。从1994年税制改革以来,全国税收每年以千亿元的速度递增。国民经济稳定发展和企业效益好转是全年税收增长的最重要因素。
改革开放以来,我国在 1984 年和 1994 年先后进行了两次税制改革。因新税制的影响是连续的,故我们采用两个阶跃函数型干预变量分析税制改革对税收收入的影响。
从税总的税收统计资料可以看出,2005年与去年同期相比,全年国内增值税完成10792.11亿元,增长19.7%,增收1775亿元;企业所得税完成5343.92亿元,增长35.04%,增收1386.59亿元;海关代征进口税收1633.81亿元,增长8.8%,增收131.91亿元。全年合计增收4612.86亿元。全年各月份、各地区收入增幅差距缩小,收入均衡性增强。在12个月份中月份收入增幅均在20%左右,同时,全国大部分地区收入增幅较高。全国的财政收入、物价水平以及国内生产总值对税收产生一定影响。下面着重分析该问题。
选择变量和模型关系形式:
本模型研究的是税收收入与财政收入、全国物价水平、国内生产总值之间的关系。其中税收收入为被解释变量,财政收入、全国物价水平、国内生产总值水平为解释变量
正在加载中,请稍后...
91页40页141页42页87页152页43页45页133页124页【图文】最小二乘法OLS和线性回归_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
最小二乘法OLS和线性回归
大小:696.50KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢第四章 放宽基本假定的模型doc下载_爱问共享资料
第四章 放宽基本假定的模型.doc
第四章 放宽基本假定的模型.doc
第四章 放宽基本假定的模型.doc
简介:本文档为《第四章 放宽基本假定的模型doc》,可适用于高等教育领域,主题内容包含、异方差性中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入除从事农业经营的收入外还包括从事其他产业的经营性收入以及工资性收入、财产收入符等。
侵权或盗版
*若权利人发现爱问平台上用户上传内容侵犯了其作品的信息网络传播权等合法权益时,请按照平台要求书面通知爱问!
赌博犯罪类
添加成功至
资料评价:
所需积分:1当前位置: >>
第五章 模型的建立与估计中的问题及对策(计量经济学,潘省初)
第五章 模型的建立与估计中的 问题及对策1 本章内容第一节 误设定第二节 多重共线性 第三节 异方差性第四节 自相关2 OLS估计量令人满意的性质,是根据一组假设条件而 得到的。在实践中,如果某些假设条件不能满足,则 OLS就不再适用于模型的估计。下面列出实践中可能碰 到的一些常见问题:l l l l 误设定(Misspecification 或specification error) 多重共线性(Multicollinearity) 异方差性(Heteroscedasticity或Heteroskedasticity) 自相关(Autocorrelation)??本章将对上述问题作简要讨论,主要介绍问题的后 果、检测方法和解决途径。3 第一节 误设定采用 OLS 法估计模型时,实际上有一个隐含的 假设,即模型是正确设定的。这包括两方面的含 义:函数形式正确和解释变量选择正确。在实践 中,这样一个假设或许从来也不现实。我们可能 犯下列三个方面的错误: l 选择错误的函数形式 l 遗漏有关的解释变量 l 包括无关的解释变量 从而造成所谓的“误设定”问题。4 一. 选择错误的函数形式这类错误中比较常见的是将非线性关系作为线性 关系处理。函数形式选择错误,所建立的模型当然 无法反映所研究现象的实际情况,后果是显而易见 的。因此,我们应当根据实际问题,选择正确的函 数形式。5 我们在前面各章的介绍中采用的函数形式以线性 函数为主,上一章还介绍了因变量和解释变量都采用 对数的双对数模型,下面再介绍几种比较常见的函数 形式的模型,为读者的回归实践多提供几种选择方案。 这几种模型是: ? 半对数模型 ? 双曲函数模型 ? 多项式回归模型6 1. 半对数模型 半对数模型指的是因变量和解释变量中一个为对数 形式而另一个为线性的模型。因变量为对数形式的 称为对数-线性模型(log-lin model)。解释变量为对数 形式的称为线性-对数模型(lin-log model)。我们先介 绍前者,其形式如下:ln Yt ? ? 0 ? ?1 X t ? ut对数 - 线性模型中,斜率的含义是 Y 的百分比变动, 即解释变量X变动一个单位引起的因变量Y的百分比 变动。这是因为,利用微分可以得出:d ln Y ? 1 ?? dY ? dY ?1 ? ? ? ?? ? ? dX ? Y ?? dX ? Y (? dX ? 1)7 这表明,斜率度量的是解释变量 X 的单位变动所 引起的因变量Y的相对变动。将此相对变动乘以100, 就得到 Y 的百分比变动,或者说得到 Y 的增长率。 由于对数-线性模型中斜率系数的这一含义,因而也 叫增长模型 (growth model)。增长模型通常用于测 度所关心的经济变量(如GDP)的增长率。例如, 我们可以通过估计下面的半对数模型ln( GDPt ) ? ? 0 ? ?1t ? ut得到一国GDP的年增长率的估计值,这里t为时间趋 势变量。8 线性-对数模型的形式如下:Yt ? ? 0 ? ?1 ln X t ? ut与前面类似,我们可用微分得到 因此dY dY ?1 ? X ? dX dX XY的绝对变动 ?Y ? X的相对变动 ?X XdY ?1? ? ?1 ? ? dX ?X?这表明 ?1 ?? ?X ? ?Y ? ?1 ? ? ? X ?上式表明,Y的绝对变动量等于 ?1 乘以X的相对变动量。因 此 , 线性-对数模型通常用于研究解释变量每变动 1% 引起的 因变量的绝对变动量是多少这类问题。9 2. 双曲函数模型 双曲函数模型的形式为:? 1 Yt ? ? 0 ? ?1 ? ?X ? t ? ? ? ? ut ?不难看出,这是一个仅存在变量非线性的模型, 很容易用重新定义的方法将其线性化。 双曲函数模型的特点是,当 X 趋向无穷时, Y 趋 向 ? 0 ,反映到图上,就是当X趋向无穷时,Y将无 限靠近其渐近线(Y = ? 0 )。 双曲函数模型通常用于描述著名的恩格尔曲线和 菲利普斯曲线。10 3. 多项式回归模型 多项式回归模型通常用于描述生产成本函数,其 一般形式为:Yt ? ?0 ? ?1 X t ? ?2 X ? ...... ? ? p X t ? ut2 t p其中 Y 表示总成本, X 表示产出, P 为多项式的阶 数,一般不超过四阶。 多项式回归模型中,解释变量X以不同幂次出现在 方程的右端。这类模型也仅存在变量非线性,因而 很容易线性化,可用OLS法估计模型。11 二. 遗漏有关的解释变量模型中遗漏了对因变量有显著影响的解释变量的 后果是:将使模型参数估计量不再是无偏估计量。三. 包括无关的解释变量模型中包括无关的解释变量,参数估计量仍无偏, 但会增大估计量的方差,即增大误差。[注] 有关上述两点结论的说明请参见教科书P112-113。12 四. 选择解释变量的四条原则在模型设定中的一般原则是尽量不漏掉有关的解释 变量。因为估计量有偏比增大误差更严重。但如果方 差很大,得到的无偏估计量也就没有多大意义了,因 此也不宜随意乱增加解释变量。 在回归实践中,有时要对某个变量是否应该作为解 释变量包括在方程中作出准确的判断确实不是一件容 易的事,因为目前还没有行之有效的方法可供使用。 尽管如此,还是有一些有助于我们进行判断的原则可 用,它们是:13 选择解释变量的四条原则 1. 理论: 从理论上看,该变量是否应该作为解释变 量包括 在方程中? 2. t检验:该变量的系数估计值是否显著?3. R2: 该变量加进方程中后,R 是否增大?24. 偏倚: 该变量加进方程中后,其它变量的系数 估计值是 否显著变化?如果对四个问题的回答都是肯定的,则该变量应该包括在 方程中;如果对四个问题的回答都是“否”, 则该变量是 无关变量,可以安全地从方程中删掉它。这是两种容易决 策的情形。14 但根据以上准则判断并不总是这么简单。在很多 情况下,这四项准则的判断结果会出现不一致。例如, R2 有可能某个变量加进方程后, 增大,但该变量不显 著。在这种情况下,作出正确判断不是一件容易的事, 处理的原则是将理论准则放在第一位。 在选择变量的问题上,应当坚定不移地根据理论而 不是满意的拟合结果来作决定,对于是否将一个变量 包括在回归方程中的问题,理论是最重要的判断准则。 如果不这样做,产生不正确结果的风险很大。15 *五、模型的选择上一段讨论了某个解释变量应否包括在模型中的 几条原则。实践中,要解决的一个问题是如何从大量 的潜在解释变量的集合中选择一个最合适的子集,以 得到一个正确设定的模型。 上个世纪六十年代后相当一段时间,人们使用逐步 回归法来解决解释变量的选择问题。这种由计算机机 械挑选变量的做法如今已不流行了。目前比较通行的 做法是从少量精心设定的备选模型中选择一个。 计量经济学家就此提出了很多基于统计学的选择 标准,我们这里讨论其中几种,如表5-1所示。16 令RSSj表示第j个模型(有kj个解释变量)的残差 平方和,并定义? ? ?2 jRSS j n ?kj2? m 用表示包含全 为第j个模型的的 ? 2 估计值。我们 ? 2 部k个解释变量的模型的 ? 估计值。17 表5-1 选择回归模型的准则准则R2 Sp Cp PC AIC计算公式RSS j /(n ? k j ) RSS j /[(n ? k j )(n ? k j ? 1)]2 RSS j ? 2k j? mRSS j (n ? k j ) /(n ? k j ) RSS j exp[2(k j ? 1) / n]18 1. R 2 准则 希尔(Theil)的 R 2 准则基于如下假设:所考虑的 2 2 ? E ( ? ) ? ? 模型中有一个是正确模型。对于正确模型, j , 2 2 ?2 对于不正确模型, 。因此 选择 最小的模型一 E(? ) ? ? ? ? , j 般就能选出正确模型。由于? ? 2最小化与R 2 最大化是一 回事,我们习惯上称该准则为 R 2 最大准则。这个准则的主要问题是,一个包括正确模型的所有 解释变量但同时也包括一些无关变量的模型也会给出 2 ?2 E (? ) ? ? ,在这种情况下,我们所选择的其实并非 j 正确模型。当备选模型包含大量无关变量时,选出正 确模型的概率较低。19 2. 基于预测的均方误差最小的三个准则 希尔的准则是基于回归的标准误差最小,下列三 个准则则是基于预测的均方误差(MSE)最小。这 三个准则是: 马娄斯(Mallows)的 C p准则 霍金(Hocking)的 S p 准则 阿美米亚(Amemiya)的PC准则 假设正确的方程有k个解释变量,我们考虑的方程 有 k1 (? k )个解释变量,问题是如何选择k1以及具体的 k1个解释变量的集合。在上述三个预测准则中,这是 ? )2 达到最小实现的,其中 Y f 通过使的均方误差 E (Yf ? Y f ? 是预测值。 是Y的未来值,而 Y f20 上述三个准则都是基于预测的均方误差最小,但在 估计预测的均方误差时采用的假设有所不同,因而形 成各自的计算公式,孰优孰劣,并无定论,在实践中 可根据所用软件提供的输出结果选用其中一个作为模 型选择的准则。具体做法是比较备选的几个模型的C p、 S p 或PC值,选其中最小的即可。在三个预测准则的情况下,我们感兴趣的是改善预 测的MSE,只要能改善,可以去掉某些变量,即便是 正确模型中包括它们也在所不惜。21 3. 赤池信息准则(AIC) 赤池信息准则(Akaike’s Information Criterion,AIC )是一个更一般的准则,它可以应用于任何一个可 用极大似然法估计的模型。对于我们这里的应用, AIC的计算公式为AIC ? e2( k ?1) / nRSS n与赤池信息准则类似的还有施瓦茨信息准则( Schwarz information criterion,SIC):SIC ? n( k ?1) / nRSS n上述两个准则与前述准则 一样,可用于模型选择, 其值也是越小越好。22 六. 检验误设定的RESET方法前面给出了选择解释变量的四条原则。可是,有时 这些原则不能提供足够的信息使研究人员确信其设 定是最恰当的,在这种情况下,可考虑使用一些更 正规的检验方法来比较不同估计方程的性质。这类 方法相当多,这里就不一一列出,仅介绍拉姆齐(J. B. Ramsey ) 的 回 归 设 定 误 差 检 验 法 ( RESET 法 , Regression Specification Error Test)。23 RESET检验法的思路 RESET检验法的思路是在要检验的回归方程中加 ? 2 ,Y ? 3和Y ? 4 等项作为解释变量,然后看结果是否有 进Y 显著改善。如有,则可判断原方程存在遗漏有关变 量的问题或其它的误设定问题。 直观地看,这些添加的项是任何可能的遗漏变量 或错误的函数形式的替身,如果这些替身能够通过F 检验, 表明它们改善了原方程的拟合状况,则我们有 理由说原方程存在误设定问题。? 2 ,Y ? 3和Y ? 4 等项形成多项式函数形式 另一方面, Y ,多项式是一种强有力的曲线拟合装置,因而如果 存在(函数形式方面的)误设定,则用这样一个装 置可以很好地代表它们。24 RESET检验法的步骤拉姆齐RESET检验的具体步骤是: (1) 用OLS法估计要检验的方程,得到? ?? ? X ?? ? X ? ?? Y i 0 1 1i 2 2i? 2 ,Y ? 3和Y ? 4 ,然 ?(i=1,2,…,n),计算 Y (2) 由上一步得到的值 Y i i i i 后用OLS法估计:?2 ? ? Y ?3 ? ? Y ?4 ? u Yi ? ? 0 ? ?1 X1i ? ? 2 X 2i ? ?3Y i 4 i 5 i i(3) 用F检验比较两个方程的拟合情况(类似于上一章中联合 假设检验采用的方法),如果两方程总体拟合情况显著不同, 则我们得出原方程可能存在误设定的结论。使用的检验统计 量为:25 ( RSS M ? RSS ) / M F? RSS /( n ? k ? 1)其中:RSSM为第一步中回归(有约束回归)的残差平方和, RSS 为第二步中回归(无约束回归)的残差平方和, M 为 约束条件的个数,这里是M=3。应该指出的是,拉姆齐 RESET 检验仅能检验误 设定的存在,而不能告诉我们到底是哪一类的误 设定,或者说,不能告诉我们正确的模型是什么。 但该方法毕竟能给出模型误设定的信号,以便我 们去进一步查找问题。另一方面,如果模型设定 正确, RESET 检验使我们能够排除误设定的存在, 转而去查找其它方面的问题。26 第二节 多重共线性应用 OLS 法的一个假设条件是;矩阵 X 的秩 =K+1&N 。 即自变量之间不存在严格的线性关系,观测值个数大于 待估计的参数的个数。这两条无论哪一条不满足,则 OLS估计值的计算无法进行,估计过程由于数学原因而 中断,就象分母为0一样。 这两种情况都很罕见。然而,自变量之间存在近似 的线性关系则是很可能的事。 当某些解释变量高度相关时,尽管估计过程不会中 断,但会产生严重的估计问题,我们称这种现象为多 重共线性。解释变量间存在严格线性相关关系时,称 为完全的多重共线性。27 一 定义 在实践中,若两个或多个解释变量高度线性相关,我 们就说模型中存在多重共线性。 二 后果 1. 不改变参数估计量的无偏性; 这是因为,尽管解释变量之间存在多重共线性,但 并不影响扰动项和解释变量观测值的性质,故仍有?1 ? ? E ( ? ) ? E ( X X ) X ?Y ?1? ? E ?( X ? X )?β?X ?( X β ? u )??1 ? ? β ? ( X X ) X ?E (u )事实上,对于不完全多重共线性,参数估计量仍 为BLUE。28 2. 但各共线变量的参数的OLS估计值方差很大,即 估计值精度很低。(BLUE表明在各线性无偏估计量 中方差最小,但不等于方差的值很小。)3 由于若干个X变量共变,它们各自对因变量的影 响无法 确定。4. 各共线变量系数估计量的t值低,使得犯第Ⅱ类 错误的可能性增加。 由于各共线变量的参数的OLS估计值方差大,因 而系数估计量的t值低,使得我们犯第Ⅱ类错误(接 受错误的原假设H0: β j=0)的可能性增加,容易将本 应保留在模型中的解释变量舍弃了。29 三 多重共线性的判别和检验 1.根据回归结果判别 判别是否存在多重共线性的最简单方法是分析回 归结果。 如果发现: 系数估计值的符号不对; 某些重要的解释变量t值低,而R2不低; 当一不太重要的解释变量被删除后,回归结果 显著变化。 则可能存在多重共线性。其中上述第二种现象是多 重共线性存在的典型迹象。 此方法简便易行,因而是实践中最常用的方法, 缺点是无 法确诊。30 2.使用相关矩阵检验 统计软件一般提供各解释变量两两之间的相关系数 矩 阵 , 如 发 现 某 些 相 关 系 数 高 ( 绝 对 值 高 于 0.8 或 0.90),则表明多重共线性存在。但即使解释变量两 两之间的相关系数都低,也不能排除存在多重共线性 的可能性。3.通过条件指数检验 条件指数(Condition index)或条件数Condition number)是X’X矩阵的最大和最小特征根之比的平方 根,条件指数高,表明存在多重共线性。至于什么程 度算高,也没有一个绝对的标准。通常认为大于10即 存在多重共线性,大于30表明存在严重多重共线性。 大多数统计软件提供此检验值。31 4. 使用VIF检验VIF 是 方 差 膨 胀 因 子 的 英 文 (Variance Inflation Factors) 缩写, 这是一种比较正规的检验方法。该方法 通过检查指定的解释变量能够被回归方程中其它全部 解释变量所解释的程度来检测多重共线性。 方程中每个解释变量有一个VIF,该VIF是关于多重 共线性使相应的系数估计值的方差增大了多少的一个 估计值。高VIF表明多重共线性增大了系数估计值的 方差,从而产生一个减小了的t值。 VIF检验的具体步骤如下:32 设原方程为: Y = ?0 + ?1X1 + ?2X2 + … + ?kXk + u我们需要计算K个不同的VIF,每个Xi一个。为指定 Xi计算VIF涉及以下三步: ( 1 ) Xi 对原方程中其它全部解释变量进行 OLS 回 归,例如,若i =1,则回归下面的方程: X1 = ?1 + ?2X2 + ?3X3 +… + ?kXk +v (2)计算方差膨胀因子(VIF):? )? VIF ( ? i1 2 (1 ? Ri )其中Ri2是第一步辅助回归的决定系数。33 (3)分析多重共线性的程度VIF越高, 多重共线性的影响越严重。 由于没有VIF临界值表,我们只能使用经验法则: ? ) ? 5 ,则存在严重多重共线性。 若 VIF ( ? i也有人建议用VIF&10作为存在严重多重共线性的标 准, 特别在解释变量多的情形应当如此。需要指出的是,所有VIF值都低,并不能排除严 重多重共线性的存在,这与使用相关系数矩阵检验 的情况相似。34 四 解决多重共线性的方法 思路:加入额外信息。 具体方法有以下几种:? ? ? ?增加数据 对模型施加某些约束条件 删除一个或几个共线变量 将模型适当变形1.增加数据 多重共线性实质上是数据问题,因此,增加数据 就有可能消除或减缓多重共线性,具体方法包括增 加观测值、利用不同的数据集或采用新的样本。35 例:需求函数Yt = β 1+β 2Xt+β 3Pt+ ut在时间序列数据中,收入(X)和价格(P)往往 是高度相关的,用时间序列数据估计往往会产生多 重共线性。然而,在横截面数据中,则不存在这个 问题,因为某个特定时点P为常数。如果取一横截面 样本(如从5000个家庭取得的数据),则可用来估 计 Yi = α 1+α 2Xi+ ui ? 2 作为一个约束条件(β 2 = 然后将得到的估计值 ? ? 2 )施加于时间序列数据的回归计算中,即估计 ?? 。 ? , ? 2 Xt =β 1+β 3Pt+ ut ,得到 ? Yt - ? ? 3 136 2.对模型施加某些约束条件 在存在多重共线性的模型中,依据经济理论施加 某些约束条件,将减小系数估计量的方差,如在 Cobb―Douglas 生产函数中加进规模效益不变的约 束,可解决资本和劳动的高度相关而引起的多重 共线性问题。3.删除一个或几个共线变量 这样做,实际上就是利用给定数据估计较少的参 数,从而降低对观测信息的需求,以解决多重共 线性问题。删除哪些变量,可根据假设检验的结 果确定。 应注意的是,这种做法可能会使得到的系数估计 量产生偏倚,因而需要权衡利弊。37 4.将模型适当变形例1.某商品的需求函数为:Q ? β 0 ? β 1 X ? β 2 P ? β 3 P* ? u其中:Q = 需求量, X = 收入, P = 该商品的价格, P* = 替代商品的价格 在实际数据中,P和P*往往呈同方向变动,它们之间高度 相关,模型存在多重共线性。如果我们仅要求在知道两种商品的相对价格变动时,对 需求量进行预测,则可将需求函数变为:P Q ? ?1 ?? 2X ?? 3( * ) ? v P就可以解决多重共线性问题。38 例2.有滞后变量的情形 Yt = β 1+β 2Xt+β 3 Xt-1 + ut一般而言,Xt和Xt 为:C1往往高度相关,将模型变换Yt = β 1+β 2(Xt - Xt C1)+β 3?Xt -1+ ut 其中β 3?=β3+β2经验表明:△Xt和Xt C1的相关程度要远远小于和Xt 和Xt C1的相关程度,因而这种变换有可能消除或减 缓多重共线性。39 5.主成分法 可将共线变量组合在一起形成一个综合指数( 变 量 ) ,用它来代表这组变量。构造综合指数的最常 用方法是主成分法。主成分法的计算相当复杂, 这里不做介绍。主成分的特点是,各主成分之间互不相关,并且, 用很少几个主成分就可以解释全部X变量的绝大部 分方差,因而在出现多重共线性时,可以用主成 分替代原有解释变量进行回归计算,然后再将所 得到的系数还原成原模型中的参数估计值。40 五. 处理多重共线性问题的原则 1. 多重共线性是普遍存在的,轻微的多重共线性 问题可不 采取措施。2. 严重的多重共线性问题,一般可根据经验或通过 分析回归结果发现。如影响系数的符号,重要的解 释变量t 值很低。要根据不同情况采取必要措施。3. 如果模型仅用于预测,则只要拟合好,可不处 理多重共线性问题,存在多重共线性的模型用于 预测时,往往不 影响预测结果。41 第三节 异方差性回顾我们应用OLS法所需假设条件,其中大部分 是有关扰动项的统计假设,它们是:(1)E(ut)=0, t=1,2,…,n. 扰动项均值为0 (2)Cov(ui,uj) = E(uiuj) =0, i≠j. 扰动项相互独立 (3)Var(ut) = E(ut? ) = ?2 , t=1,2,…,n. 常数方差 (4)ut ~N(0,?2). 正态性对于( 1 ),我们可论证其合理性。而第( 4 ) 条,也没有多大问题。大样本即可假定扰动项服从 正态分布。而对于( 2 ),( 3 )两条,则无法论证 其合理性。实际问题中,这两条不成立的情况比比 皆是。下面将讨论它们不成立的情况,即异方差性 和自相关的情形。42 一 异方差性及其后果1. 定义 若Var(ut) = ? 2= 常数的假设不成立,即 2 ? Var(ut) = t≠常数,则称扰动项具有异方差性。 2. 什么情况下可能发生异方差性问题? 解释变量取值变动幅度大时,常数方差的假设往 往难以成立。异方差性主要发生在横截面数据的情况, 时间序列问题中一般不会发生,除非时间跨度过大。43 例:Yi = α +β Xi+ ui 其中:Y=指定规模和组成的家庭每月消费支出 X=这样的家庭的每月可支配收入设X的N个观测值取自一个家庭可支配收入的横截 面样本。某些家庭接近于勉强维持生存的水平,另 一些家庭则有很高的收入。 不难设想,低收入家庭的消费支出不大可能离开他 们的均值E(Y)过远,太高无法支持,太低则消费将 处于维持生存的水平之下。因此,低收入家庭消费 支出额的波动应当较小,因而扰动项具有较小的方 差。而高收入家庭则没有这种限制,其扰动项可能 有大得多的方差。这就意味着异方差性。44 3.异方差性的后果(1)参数估计量不再具有最小方差的性质 异方差性不破坏OLS估计量的无偏性,但不再是 有效的。 事实上,异方差性的存在导致 OLS 估计量既不 是有效的,也不具有渐近有效性。(2)系数的显著性检验失去意义 ?1 2 ? ? ( X X ) ? 更为严重的是,在异方差性的情况下, 矩阵主对角元素不再是 OLS 估计量方差的无偏估计量, 从而导致系数的置信区间和假设检验结果不可信赖。45 二 异方差性的检验异方差性后果的严重性意味着我们在实践中必须了 解是否存在异方差性。 常用的检验方法有: 斯皮尔曼等级相关检验法(Spearman Rank Relation test) 戈德弗尔德―匡特检验法(Goldfeld Quandt test) 格里瑟检验法(Glesjer test) 帕克检验法(Park test) 怀特检验法 (White’s General Heteroscedasticity test) 布鲁奇-帕根检验法(Breusch-Pagan Test)46 1.斯皮尔曼等级相关检验法思路: 将异方差性与扰动项 u 和某个解释变量 X 之间的相 2 关程度挂钩(即 ? t 与 Xt 的大小有关),从而将对 异方差性的研究转化为对ut与Xt的相关程度的研究。 由于扰动项无法观测,因而用残差代替之,转化为 对et与Xt的相关程度的研究,若et与Xt高度相关,则可 推断异方差性存在。47 问题是,在此无法用常规相关系数来检验,因为et 与Xt的相关系数恒等于0:r?? ( X ? X )(e ? e ) ? ( X ? X ) ? (e ? e )22X e ? X ?e ? e? x ? ? ? ( X ? X ) ? (e ? e )t t t 2 2t?0因而改用Xt和et的等级相关系数检验et和Xt的相关 程度。48 等级相关系数的计算步骤(1)将两变量的相应观测值分别按升序(或降序)排序,所得到的序号即为等级;(2)计算两变量各观测值相应的等级之差dt ; (3)计算等级相关系数6? d 2 t r ? 1? n(n 2 ? 1)49 例:等级相关系数的计算 假设我们有Xt和et如下: Xt 25, 40, 52, 58, 65 et 1.6,-2.9,-10.7,C14.8, 5.7 我们有 et 1.6, 2.9, 10.7, 14.8, 5.7Xt的等级 1 2 3 4 5et的等级 1 2 4 5 3dt 0 0 -1 -1 2r = 1 C (6*6)/(5*24) = 1 - 0.3 = 0.750 计算出等级相关系数后,就可判断异方差性是否存 在。若相关系数绝对值高,则存在异方差性。 对于多个解释变量的情况,可分别计算et与各 解释变量的等级相关系数进行检验。51 2.戈德弗尔德――匡特检验法 基本思路:假定 ? t 2 随Yt的数值大小变动。 检验步骤: ( 1 )将数据分为三组:小 Yt 值组,中 Yt 值组,大 Yt 值组(数据项大致相等) (2)对小Yt值组估计模型,给出n1 ? k ? 1 (3)对大Yt值组估计模型,给出2 ?3 ? ? 2 e ?2 ?1 ? ?2 e ?n3 ? k ? 152 2 2 (4) H0: ?1 ? ? 32 2 2 2 ? ? ? H1: 1 (或 ) ? ? ? 3 1 3 2 ?3 ? 检验统计量为F0 = ~F(n3-k-1, n1-k-1) 2 ?1 ?若F0>Fc,则拒绝H0,存在异方差性。53 例:S=α +β Y + u设其中:S=储蓄2Y=收入? 1 =0.―60年, ?2 ? ? 1970―79年, 3 =0.9725F0 = 0.25=59.9 查表得: d.f.为(8,8)时,5% Fc=3.44∵F0>Fc 因而拒绝H0。结论:存在异方差性。54 3. 怀特检验(White’s General Heteroscedasticity Test)怀特提出的检验异方差性的方法在实践中用起来 很方便,下面用一个三变量线性模型扼要说明其检 验步骤。设模型如下:Yi ? ?0 ? ?1 X1i ? ?2 X 2i ? uiWhite检验步骤如下: (1)用OLS法估计(1)式,得到残差e i ; (2)进行如下辅助回归(1)e ? ? 0 ? ?1 X1i ? ? 2 X 2i ? ?3 X ? ? 4 X ? ?5 X1i X 2i ? vi2 i 2 3i 2 4i(2)即残差平方对所有原始变量、变量平方以及变 量交叉积回归,得到R2值;55 (3)进行假设检验 原假设 H0:不存在异方差性(即方程(2)全部 斜率系数均为零) 备择假设 H1:存在异方差性(即H0不成立) 怀特证明了下面的命题: 在 原假设 H0成立的情况下,从(2)式得到的R2 值与观测值数目(n)的乘积(n× R2)服从自由度为 k的?2分布,自由度 k 为(2)式中解释变量的个数。即 n?R2 ~ ? 2(k)因此,怀特检验的检验统计量就是n?R2 ,其抽样 分布为自由度为k的?2分布。 检验步骤类似于t检验和F检验。56 三 广义最小二乘法 1.消除异方差性的思路 基本思路:变换原模型,使经过变换后的模型具有 同方差性,然后再用OLS法进行估计。 对于模型 Yt = β 0+β 1X1t+…+β k Xkt+ ut (1)若扰动项满足 E(ut) = 0,E(uiuj) = 0, i≠j, 但 E(ut2) = σt2 ≠常数. 也就是说,该模型只有同方差性这一条件不满足,则 只要能将具有异方差性的扰动项的方差表示成如下形 式:Var (ut ) ? ? t ? ? ?2 22 tt ? 1, 2,...n57 其中 ? 2 为一未知常数, ? 2 t 表示一组已知数值, 则用λ t去除模型各项,得变换模型:Yt?0 X 1t X Kt ut ? ? ?1 ? ... ? ? K ? ?t ?t ?t ?t ?tVar ((2)由于?tut)?1?tVar (ut ) ? 22 2 2 ? ? ? ? t 2 ?t1所以变换后的扰动项的方差为常数,可以应用OLS法 进行估计,得到的参数估计量为 BLUE 。但这里得到 的 OLS 估计量是变模后模型( 2 )的 OLS 估计量。对 于原模型而言,它已不是OLS估计量,称为广义最小 二乘估计量(GLS估计量)。58 2. 广义最小二乘法(Generalized least squares)下面用矩阵形式的模型来推导出GLS估计量的一 般计算公式。 设GLS模型为 Y=Xβ +u (1 )满足 E(u)= 0,E(uu?)=?2Ω , X 非随机, X的秩=K+1<n, 其中Ω 为正定矩阵。59 根据矩阵代数知识可知,对于任一正定矩阵Ω , 存在着一个满秩(非退化,非奇异)矩阵P,使得? ? P P? ,?1 ?1??1? ( P )? P?1?1?1用P-1左乘原模型(1)(对原模型进行变换):P Y ?P X? ?P u令 Y* = P-1Y ,X* = P-1X,u* = P-1u,得到Y*= X*β+ u*(2)下面的问题是,模型(2)的扰动项u*是否 满足 OLS法的基本假设条件。60 我们有?1 ?1 ? ? E (u * u * ) ? E ( P uu ( P )?)? P E (uu ?)( P )? ? P (? ?)( P )?2 ?1 ? ? ? P ( P P )( P )? 2 ?1 ?1 ?1?1?1? ? ( P P)( P P)?2?1?1?? I261 这表明,模型(2)中的扰动项u*满足OLS法的基本 假设,可直接用OLS估计,估计量向量? ? ( X ? X ) ?1 X ? Y ? * * * *? ( X ?( P )?P X ) X ?( P )?P Y?1 ?1 ?1 ?1 ? ? ? (X ? X ) X ? Y ?1 ?1 ?1 ?1这就是广义最小二乘估计量(GLS估计量) ? 的 公式,该估计量是BLUE。 从上述证明过程可知,我们可将GLS法应用于Ω 为任意正定矩阵的情形。62? 如果只存在异方差性,则2 ??1 0 0......0 ? 2 0 ? 2 2? 2 0......0 E (uu ?) ? ? ? ? ? ? ........ ? 2 ? 0 0 0 ....... ? n ?? ? ? ? ? ? ?其中?2 t ? 0,t ? 1,2,......, n? ? ? ? P? ? ? ? ?63我们显然有??1 0 0......0 ? 0 ? 2 0......0 ? P?? ........ ? ? ?0 0 0.......? n P?1? 1 0 0......0 ? ? ?1 ? ? ? 1 0 0 ...... 0 ? ? ( P ?1 )? ?2 ?? ? ? ........ ? ? ?0 0 0....... 1 ? ? ?n ? ? ?? 1 2 0 0......0 ? ? ?1 ? ? ? 1 0......0 ? 2 ?0 ?2 ?? ? ? ? ........ ? ? ?0 0 0....... 1 2 ? ?n ? ???164 四 广义最小二乘法的应用 1.根据实际问题确定Ω 矩阵 应用 GLS 法的关键是确定 Ω 矩阵。对于仅存在异 方差性的实际问题,Ω 矩阵是一个对角矩阵,即2 ??1 0 0......0 ? ? ? 2 0 ? 2 0......0 ? ? ??? ? ........ ? ? 2 ? ? 0 0 0 ....... ? n ? ?2 ? 现在的问题是, t 的值为已知这一假设是否现实,也就是我们能否根据实际问题,提出有关扰动项方 差的某种合理的设想(即估计Ω 矩阵),使得? ?? ?2 t 22 t? t 为已知数值) (? 2 为未知常数,265 例1 Yt = β 1+β 2Xt+ ut t=1,2,…,n. 其中 Y=家庭消费支出 X=家庭可支配收入 我们在前面已分析过,高收入家庭有较大的扰动 项方差,因此不妨假定扰动项方差与可支配收入成 正比,即 Var(ut)=δ Xt , t=1,2,…,n. 式中δ 是一未知常数,由于Xt为已知,相当于 2 2 ? 而δ?相当于 ,因此 t? X 1 0 0......0 ? ?0 X ? 0 ...... 0 2 ? ? ?? ? ? ? ........ ? ? ?0 0 0........ X n ?,应用GLS法,即可得出β 的GLS估计量。66 2.格里瑟检验法(Glesjer test)在上例中我们假设扰动项方差与解释变量的取值成正 比,这种假设是否真正合理呢?根据经验和分析做出 的这种假设,虽然有一定道理,但未免显得过于武断, 这方面还可做一些比较细致的工作。 Glesjer检验法不仅可检验异方差性的存在,还可用 于提供有关异方差形式的进一步信息,对于确定 Ω 矩 阵很有用,下面我们扼要说明格里瑟检验法的思路和 步骤。67 格里瑟检验法的思路格里瑟检验法的思路是假定扰动项方差与解释变量 之间存在幂次关系,方法是用 et 对被认为与扰动项 方差有关的解释变量回归,确定 et 和该解释变量的 关系。由于与该解释变量之间关系的实际形式是未知 的,因此需要用该解释变量的不同幂次进行试验,选 择出最佳拟合形式。 具体步骤如下:68 (1)因变量Y对所有解释变量回归,计算残差et (t=1,2,…,n) (2) et 对所选择解释变量的各种幂次形式回归,如 et ? ? 0 ? ? 1 X 2 jt ? u tet ? ? 0 ? ? 1 X et ? ? 0 ? ? 1jt? utjtX? ut1 et ? ? 0 ? ? 1 ? ut X jt ................然后利用决定系数,选择拟合最佳的函数形式。 (3)对β 1进行显著性检验,若显著异于0,则表明存在 异方差性,否则再试其它形式。69 例2 Yt = β 1+β 2X1t+…+β k Xkt+ ut 假设我们根据经验知道扰动项方差与Xjt有关,并用 格里瑟法试验,得出:? t2 ? ? X jt则? X j1 0 0......0 ? ? ? ?0 ? X 0 ...... 0 j 2 ? ?? ? ? ........ ? ? ? ? ? ?0 0 0........ X jn ? ?70 3.加权最小二乘法对于仅存在异方差性的问题,其Ω 矩阵是一个对角矩阵, 2 即 ? ?1 ? ? ? ? ? ?2 2 ??? ? ? ? ? 2 ? ? ? n ? ? 在这种情况下应用广义最小二乘法,也就是在原模型两端 左乘矩阵 ? 1 ? ? ?1 ?P?1? ? ?? ? ? ? ?1? ? ?2 ? ? ...... ? 1 ? ?n ?变换原模型,再对变换后的模型应用普通最小二乘法进行估计。 71 这种作法实际上等价于在代数形式的原模型Yt = β 0+β 1X1 t+…+βkX k t+ u t的两端除以? t,得变换模型:?0 X 1t X Kt ut ? ? ?1 ??? ?K ? ?t ?t ?t ?t ?tYt相当于在回归中给因变量和解释变量的每个观测值 都赋予一个与相应扰动项的方差相联系的权 数 ( 1?t , t ? 1,2,..., n) ,然后再对这些变换后的数据 进行OLS回归,因而被称为加权最小二乘法(WLS法, Weighted Least Squares)。72 加权最小二乘法是广义最小二乘法的一个特例, 在Ω 矩阵为对角矩阵这种特殊情形下,我们既可以 直接应用矩阵形式的广义最小二乘估计量公式得到 GLS估计值,亦可避开矩阵运算,采用加权最小二乘 法得到其WLS估计值,两者结果完全相同,无论你称 之为GLS估计值还是WLS估计值,二者是一码事。例:Yi ? ?1 ? ?2 X i ? ui(1)其中:Y=R&D支出,X=销售额 采用美国 1988 年 18 个行业的数据估计上述方程, 结果如下(括号中数字为t值):73 ? ? 192.99 ? 0.0319 X Y i i (0.1948) (3.8434)R ? 0.47832这里是横截面数据,由于行业之间的差别,可能 存在异方差性。 假设 应用格里瑟法试验,得到异方差性形式为:? ? ?X i2 i将原模型(1)的两端除以 X i ,得Yi ui 1 ? ?1 ? ?2 X i ? Xi Xi Xi(2)74 用 OLS 法估计( 2 )式,结果如下(括号中数字为 t 值):? ? ? Y 1 i ? 0.0368 X i ? ? ? ?246.68 ? X ? Xi i ? ? (?0.647) (5.172)R 2 ? 0.6258与(1)式的结果比较,两个方程斜率系数的估 计值相差不大,但采用WLS法估计的比直接用OLS法 估计的系数更为显著,这表明OLS法高估了X系数的 标准差。75 第四节 自相关一 定义若Cov(ui , uj) = E(uiuj) =0, i≠j不成立,即线性回 归模型扰动项的方差 ― 协方差矩阵的非主对角线元 素不全为0,则称为扰动项自相关,或序列相关 (Serial Correlation)。二 自相关的原因及后果 1.原因 自相关主要发生在时间序列数据的情形,因而 亦称为序列相关,主要有以下两种原因:76 (1)冲击的延期影响(惯性) 在时间序列数据的情况下,随机冲击(扰动)的影 响往往持续不止一个时期。例如,地震、洪水、罢工 或战争等将在发生期的后续若干期中影响经济运行。微观经济中也与此类似,如一个工厂的产量,由于 某种外部偶然因素的影响(如某种原材料的供应出了 问题),该厂某周产量低于正常水平,那么,随后的 一周或几周中,由于这种影响的存在或延续,产量也 很可能低于正常水平(即扰动项为负)。 不难看出,观测的周期越长,这种延期影响的严 重性就越小,因此,年度数据比起季度数据来,序列 相关成为一个问题可能性要小。77 (2)误设定如果忽略了一个有关的解释变量,而该变量是 自相关的,则将使扰动项自相关,不正确的函数形 式也将导致同样后果。在这些情况下,解决的方法 是纠正误设定。本章后面将介绍的纠正自相关的方 法都不适用于这种情况的自相关。78 2.后果 自相关的后果与异方差性类似。 (1)在扰动项自相关的情况下,尽管OLS估计量 仍为无偏估计量,但不再具有最小方差的性质, 即不是BLUE。 (2)OLS估计量的标准误差不再是真实标准误差 的无偏估计量,使得在自相关的情况下,无法 再信赖回归参数的置信区间或假设检验的结果。79 三 自相关的检验 1.检验一阶自相关的德宾 ―沃森检验法( Durbin― Watson test) (1)一阶自相关 自相关的最简单模式为:ut ? ?ut ?1 ? ? tt ? 1, 2,..., n其中 ρ 称为自相关系数( -1≤ρ ≤1 ),这种扰动 项的自相关称为一阶自相关,即扰动项仅与其前一期 的值有关。 ρ &0 正自相关 ρ &0 负自相关 ρ =0 无自相关80 在一阶自相关模式中,假定ε t具有以下性质:E(ε t) = 0 , E(ε t? ) = ζ 2 = 常数, E(ε iε j)=0, i≠j, ε t服从正态分布。 在计量经济学中,具备上述性质的量称为白噪 声(White noise),表示为 ε t= White noise或ε t= 白噪声81 (2)德宾―沃森检验法(Durbin-Watson d test) 统计软件包和研究报告在提供回归结果时通常 都给出 DW (或 d )统计量的值,该统计量是从 OLS回归的残差中计算得来的,它被用于一阶自相 关的检验,计算公式为:DW ?? (et ?2nt n? et ?1 )2 t2?et ?182 DW 和一阶自相关系数 ρ 的估计值之间存在以下 近似关系(具体推导过程见书上P135-136): ? DW ≈ 2 - 2 ?由于 -1 ≤ρ ≤1,因而0 ≤ DW ≤4。不难看出,直观判断准则是,当DW统计量接近2时, 则无自相关,DW值离2越远,则自相关存在的可能性 越大。83 DW检验的缺陷我们当然期望有一张能够给出相应的n、k和 α 值 下各种 DW 临界值的表(就象 t 检验, F 检验一样), 使得我们可以按常规假设检验那样根据临界值作出 判断。 不幸的是, DW 统计量的分布依赖于解释变量的具 体观测值(即依赖于X矩阵)。因此不象t、F检验那 样,有一张能够给出DW临界值的表。为解决这一问题,德宾和沃森证明, DW 统计量 的真实分布位于两个极限分布之间,这两个分布分 别称为下分布和上分布,如下图所示:84 概率 密度下分布上分布0ABCDDW值每个分布的95%临界水平用A,B,C,D表示。85 现假设DW统计量的值位于 A的左边,则不管这 种情况下的DW 统计量服从何种分布(上,下或中 间),无自相关的原假设将被拒绝。 与此类似,若 DW 统计量的值位于 D 的右边,则 亦可拒绝无自相关的原假设。若DW统计量的值位于B和C之间,则可接受原假 设。而当 DW 统计量的值位于 A 和 B 之间或 C 和 D 之 间时,则无法得出结论。上述分析可以概括为:DW&A或DW&D B&DW&C A&DW&B或C&DW&D存在自相关 无自相关 无结论区86 德宾和沃森据此导出了一个下界dL和一个上界 du来检验自相关, dL和du仅依赖于观测值的数目 n、 解释变量k,以及显著性水平α ,而不依赖于解释变 量所取的值。(请参阅DW表, P252)无结论区的存在是DW法的最大缺陷。 实际的检验程序可用下面的示意图说明。87 正自相关 无结论区无自相关无结论区负自相关0dLdu24―du4―dL488 检验程序如下: (1) 用OLS法对原模型进行回归,得残差et (t=1,2,…,n)。 (2) 计算DW值(计算机程序给出DW值)。 (3) 用N,K和α 查表得dL,dU。 (4)判别 若DW<2 若 DW < dL, 存在自相关 若 dL < DW <dU, 无结论 若 dU < DW, 无自相关若DW&2,则令DW?= 4 - DW,按上述准则进行判。89 例:DW=3.5,则 DW?= 4 - 3.5 = 0.5查表(n=30, k=2, α =5%)得:dL =1.28 DW?=0.5 <1.28 结论:存在自相关。90 2.其它检验自相关的方法DW 检验法只能检验一阶自相关,并且,如果方 程中包括滞后因变量(如 Yt-1,Yt-2 等)时,用 DW 法 检验容易产生偏差。因此,在碰到较复杂的情形, 我们应采用一些其它检验自相关的方法。下面列出 几种方法及其适用环境。检验方法 适用环境 Durbin-Watson d检验法 一阶自相关,方程中无Y的滞后项Durbin’s h 检验法Box-Pierce检验法一阶自相关,方程中有Yt-1一般自相关(一阶、二阶、…、K阶)LM检验法一般自相关(一阶、二阶、…、K阶)91 *3. 高阶自相关的检验: LM检验法 为解决DW检验存在的缺陷,布鲁奇(T. S. Breusch)和戈弗雷(L.G.. Godfrey)在上世纪七十 年代末期提出了检验一般自相关的方法:布鲁奇-戈 弗雷法,由于该方法源自拉格朗日乘数原理,因此 通常被称为拉格朗日乘数法(LM法)。 考虑回归模型A : Yt ? ? X it ?i ? uti ?1kt ? 1, 2,......nB : ut ? ?1ut ?1 ? ?2ut ?2 ? ...... ? ? put ? p ? ? tA式中诸X也可以包括滞后因变量。? t ? 白噪声92 我们要检验的是:H 0 : ?1 ? ?2 ? ... ? ? p ? 0 , 即扰动项不存在任何阶数的自相关。 LM检验步骤如下: (1) 用OLS法估计A式,得到最小二乘残差; (2) 然后估计下面的方程:et ? ? X it ? i ? ? et ?i ?i ? ?ti ?1 i ?1kpt ? 1, 2,......n(3)计算常规F统计值,93 (3)检验是否所有 et ?i的系数都等于0。这里通常 2 不用F检验而用 ? 检验,因为LM检验是大样本检验 。检验统计量为 P ? F ,该统计量服从自由度为P 2 的 ? 分布,即P ? F ? ? ( P)2LM检验的缺点是,滞后长度P不能先验地确定,需 要反复试,可以考虑用赤池和施瓦茨信息准则来选 择滞后长度。94 四 消除自相关的方法1.一阶自相关 如果实际问题的自相关模式为一阶自相关,则只 要知道ρ ,就可以完全消除自相关,下面用双变量 模型来说明,但同样的原理适用于多个解释变量的 情形。 设 Yt = α +β Xt+ ut (1 )ut=ρ ut-1+εt其中ε t是白噪声,且ρ ≠0。 (1)式两端取一期滞后,得 Yt-1 = α +β Xt-1+ ut -1 (2 )95 (2)式两端乘以ρ ,得 ρ Yt-1 = α ρ +β ρ Xt-1 + ρ ut -1 (3)(1)-(3),得: Yt -ρ Yt-1 = α (1-ρ )+β (Xt-ρ Xt-1) + (ut -ρ ut -1) (4) (4)式中的扰动项为 ut -ρ utC1 =ε t,从而满足标准 假设条件。96 令Yt?= Yt -ρ Yt-1 Xt?= Xt-ρ Xt-1 α ?=α (1-ρ ),有 Yt? = α ?+β Xt?+ εt(5 )若ρ 为已知,我们就可用OLS法直接估计(5)式, 否则需要先估计ρ 。 在ρ 未知的情况下,通常用下列方法估计ρ : 科克伦―奥克特法 希尔德雷斯―卢法97 (1)科克伦―奥克特法(Cochrane―Orcutt) 科克伦―奥克特法是一个迭代过程,步骤如下: ① 估 计 原 模 型 ( ( 1 ) 式 ) , 计 算 OLS 残 差 et (t=1,2,…,n)。 ② et 对 et-1 回归,即估计 et=ρ et-1+ε t ,得到 ρ 的 估计值 ? ?③用? ? 产生?Yt ?1 Yt? ? Yt ? ??X t ?1 X t? ? X t ? ?然后估计 Yt? = α ?+β Xt?+ ε t ,得到α 和β 的 ? 。 ? 和? 估计值? ④ 重新计算残差,返回第②步。 ? ,直至收敛。 ? ,? ? 和? 此过程不断修改 ?98 (2)希尔德雷斯―卢法(Hildreth―lu) 此方法实际上是一种格点搜索法(Grid search), 即在ρ 的预先指定范围(如 -1至1)内指定格点之间 距离(如0.01),然后用这样产生的全部ρ 值 (-1.00,-0.99,…,1.00)产生Yt?= Yt -ρ Yt―1然后估计 Yt? = α ?+β Xt?+ εXt?= Xt-ρ Xt―1t? , 产生最小标准误差的ρ 值即作为ρ 的估计值 ? ? 即为原模型的系数估计值。 ? 值得到的 ? 用该 ? ?和 ? 99 上述两种方法中,目前用得多的是科克伦―奥克特 法。科克伦―奥克特法的优势在于,它不仅能用于 一阶自相关模式(AR(1)模式),也能用于高阶自相 关模式,如AR(2)模式:ut=ρ 1ut-1+ ρ 2ut-2 +εt以及AR(3)、 AR(4)等。计量经济软件提供了解决此 类问题的命令。100 2.一般自相关 对于一般自相关问题,我们可采用广义最小二乘法处 理。自相关意味着扰动项u的方差―协方差矩阵? E (u12 ) E (u1u2 ) ...... E (u1un ) ? ? ? 2 E (u2u1 ) E (u2 ) ...... E (u2un ) ? ? E (uu?) ? ? ? ................................. ? ? 2 ? ? E ( u u ) E ( u u ) ...... E ( u n 1 n 2 n )? ?中某些 E(uiuj)≠0, 即 E(uu?) = ζ2Ω, 其中Ω为正定矩阵,因而可应用GLS法。 GLS法 可用于任何类型的自相关。101 第五章 小结一、误设定 误设定包括函数形式的误设定和解释变量的误设定。我们 重点介绍了两种类型的误设定。 1、模型中忽略了有关的解释变量 其后果是使参数估计量产生偏倚,即OLS估计量不再是无偏 估计量。 2、模型中包括了无关的解释变量 其后果是增大了估计量的方差,但估计量仍无偏。在实际工作中,我们可用拉姆齐RESET检验法检验模型是否 误设定,但仍无法准确判断是何种类型的误设定。一般原则 是尽量不漏掉与因变量有关的解释变量尤其是理论上重要的 变量,判断一个变量是否应加进回归方程中,可依据本章介 绍的四项准则。102 二、多重共线性当解释变量之间存在着高度相关时,就会发生多重共线性。 多重共线性虽然不影响参数估计量的无偏性,但会造成参数 估计量的高方差、精度差和低 t 值,犯第Ⅱ类错误的可能性增 加.。 多重共线性可通过回归结果进行判断,可以通过解释变量的 相关系数矩阵检验,还可用条件指数检验。 解决多重共线性问题主要从以下两个方向进行: 1、减少要估计的参数,即利用给定的数据估计较少的参数。 2、改变数据,即增加信息。 这是一个要在实践中反复摸索的问题。103 三、异方差性若 Var(ut)= σ2 = 常数 的假设不成立,则称扰动项具有 异方差性。 异方差性主要发生在横截面数据或时间跨度很大的时间 序列数据的情形。 1、 异方差性的后果 (1)虽然OLS估计量仍是无偏的,但不再具有最小方差的 性质,即不再是有效的。 (2)系数的置信区间和显著性检验结果不可信赖。 2、 异方差性的检验 常用的检验方法有斯皮尔曼等级相关检验法、戈德弗尔德 - 夸特检验法和格里瑟检验法。建议采用前两种方法检验异 方差性的存在,用格里瑟检验法确定异方差性的形式。104 3、 广义最小二乘法(GLS法)GLS模型 Y=Xβ+μ 满足E(μ)=0,E(μμ’)=σ2Ω,X非随机 且Rank(X)=k+1&n,Ω为正定矩阵,则GLS估计量 GLS ?1 ?1 ? ? ? ( X ?? X ) ?1 X ?? Y 为BLUE。4、 用GLS法消除异方差性如果仅存在异方差性,则Ω矩阵可假设为一个对角矩阵, 2 即 ??1 ? 2 ? ? 2 &0,t=1,2,…,n ? ? t ? ? 2? ? ? ? ? ? ? ? ? 2 ?n ? ?问题转化为如何确定 ? 2 (t=1,2,…,n)的值,这需要 t 根据具体问题而定。在没有明确线索时,通常采用格里瑟 法通过实验确定之。105 四、自相关若cov(ui,uj) = E(μiμj) =0,i≠j 不成立,则我们说存在着扰动 项的自相关,自相关也称为序列相关。当我们应用时间序列数据时,往往会碰到自相关的问题。此 外,遗漏有关的解释变量也可能产生自相关的现象。自相关 的后果与异方差性的后果类似。最常用的自相关检验法是德宾-沃森检验法。DW法适用于一 阶自相关模式:且方程中不包括因变量的滞后项的情形。其它方法包括适用于方程中有Yt-1项的h检验法(检验一阶自 相关),以及检验一般自相关的Box-Pierce法和LM法。106ut=ρut-1+εt 一阶自相关的消除,通常采用科克伦-奥克 特法或希尔德雷斯-卢法估计自相关系数ρ,得 到其估计值后,对原模型进行变换,以消除扰 动项的自相关型,得到原模型参数的估计值。 一般自相关的消除,可采用GLS法处理。107
更多搜索:
All rights reserved Powered by
文档资料库内容来自网络,如有侵犯请联系客服。}

我要回帖

更多关于 ols模型是什么 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信