读书笔记——What are we weighting for翻译连载-散文精选网

这大概就是Friedberg and Wolfers用WLS估计离婚率回归的思路。相较于Wyoming，California在是否离婚的个人数据层面提供了更多的观察值，因此对州人口加权应该会得到更加准确的相关系数估计。然而，对于表一展示的细节发现，对人口加权损害了估计的准确性。
那么应该如何去解释Dickens（1990）的那篇优秀的文章的副标题“真的值得加权吗？”Dickens指出，在许多实践应用中，个体层面的误差项vij是独立的这种假设是错误的。相反的，个体层面的误差项在组内是彼此正相关的，因为他们有共同的不可观测的组层面的因素。在目前的说法下，个体等级误差项是聚类的。Dickens用一个error components model在个人层面的误差项的样本的例子进行说明：
其中每一个误差元素ci和uij是独立的和同分布的（彼此之间也是独立的），方差为σc^2和σu^2。
在这个情形下，组平均误差项vi的方差不是，而是：
如果σ c^2是非常可观的，样本的规模Ji在每个组中都非常的大（例如许多人生活在Wyoming，即使没有California那样多），组的平均误差的方差可能非常接近σc2，是同方差的。在那种情况下，OLS应用到等式（1）中接近于最优的线性无偏估计。相对比而言，如果用加权，就像等式（2），加权后的误差项的方差为，可能会有异方差。以上提供了一个解释，关于为什么组内样本规模有时会导致比OLS更不精准的估计。另一方面，如果σc2很小，组内样本规模Ji变化很大，在一些组中跟小，在样本组内加权可能会切实提高估计的准确性，是很好的处理。
所以实际应该做什么？幸运的是，正如Dickens指出的那样，异方差作为实证问题很容易处理。一种方法是用OLS估计方程（1），然后用OLS的残差去执行在计量经济学中介绍的标准异方差检验。举个例子，在这种情况下，如Wooldridge（2013，pp.276-8）描述的优化的Breusch-Pagan检验归结为将OLS应用与一个以残差平方和对组内样本容量的倒数1/Ji的简单回归。对于1/Ji的相关系数，t统计量的显著与否表明是否OLS残差显示了一个显著的异方差的证据。因此，以上检验对是否加权估计的必要性提供了一些指引。检验的一个显著的性质是估计的截距是与σc^2的一致估计，1/Ji的估计系数是σu^2的一致估计。以上这些能使得等式（4）有一个近似的方差结构，考虑到组的误差因素ci，能用于去制造一个更加精炼的加权，而不是像等式（2）中的简单的加权策略。
所以，我们首先推荐操作人员在这种情形下，不要去假设是异方差的存在与否是一个问题，而是在决定之前进行适合的诊断。我们会有两个额外的推荐。一个是无论是否进行加权估计，真实方差结构的不确定性意味着异方差可能在误差项中。因此我们推荐报告异方差稳健标准误估计。
报告加权和非加权的结果是一个很好的操作。用我们的离婚的例子，一方面稳健标准误估计对比哪个估计更准确是有意义的。但是有一个额外的担忧，在外生抽样和正确的指明y在等式（1）中的条件均值，OLS和WLS对于回归的相关系数是一致估计。另一方面，在内生抽样下或者错误的建模等式（例如对与异质性建模失败，将在第五部分进行讨论），OLS和WLS有不同的可能性限制。因此，正如DuMouchel和Duncan（1983）建议的，对照OLS和WLS估计能被用于一个错误等式和内生抽样的诊断。
实际上，我们用参数模型估计因果效应几乎总是设定错误的。因此，实际问题不是选择一个数据的真实生成过程的选择规范，而是是否是一个近似足够好的能接近无偏和一致的我们所感兴趣的因果效应的估计。当加权和不加权估计彼此冲突，这个可能是一个红旗，警告这个规范不够足够近似真实的条件均值。举个例子，Lee和Solon（2011）发现，当因变量用离婚率回归是不取对数，而是一个等级（正如Friedberg和Wolfers的研究），OLS和WLS估计是彼此间有巨大差异的。却不能指出哪里有错误，在线性模型等式下，但是确是一个有价值的警告信号，等式构成的问题值得进一步注意。
IV.较正内生样本
在因果效应研究中，加权的一个完全不同的动机是内生样本的准确性上达到一致估计。一个很好的例子来自一篇经典文献，Manski和Lerman（1977）关于基于选择抽样的文献。假设一个人研究通勤者选择交通工具的模式，例如在开车去上班还是乘坐公交车。一个人可能对如何确定解释变量特别感兴趣，例如公交车费和步行往返公交车站的距离，影响选择某种模式的概率，对于其他模式来说。给定一个随机的通勤者样本，大多数实证研究者会执行最大似然估计一个在交通模式上的二元选择probit或者logit模型。
但是假设样本的选取不是通勤者的随机样本，而是一个基于选择的样本。正如Manski和Lerman解释的，“在学习选择模式中，调查交通工具使用者比起去家中访问花费更少的方式是在车站和在停车场”Manski和Lerman表明，如果样本过度代表一个模式，没有充分代表其它相关的对于选择的总体分布，最大化常规的对数似然（一个错误的对数可能性，因为没有考虑内生抽样）通常导致不一致的参数估计。
然而如果用一个最大化准对数似然通过通勤者选择概率的倒数加权到每一个观察值对于传统的对数似然的贡献（用一个反向的“哈哈镜”使得抽样代表总体），将会得到一致的参数估计。
另一个例子是估计额外教育年限的收入回报。大多数劳动经济学家会用对数收入对教育年限的线性回归模型，控制其他变量，比如工作经验。虽然回归模型已经被OLS模型估计无数次了，研究者认识到教育年限的内生性，寻求设计工具变量估计回归。在任意情况下，如果回归被用全PSID估计，没有任何对低收入群体的过度抽样的较正，这个会导致回归参数的不一致。抽样会内生性，因为抽样标准、家庭收入与对数收入的回归的误差项相关。然而，一个估计策略，如果应用到一个适合的代表性样本，合适的加权将会达成一致性，会达成一致性估计。例如，如果教育变量是外生的，以至于OLS估计一个典型的样本是一致的。应用WLS到内生性选择样本（对每一个平方和的贡献加权，通过选择概率的倒数）也可以是一致估计。适用等式（2），但用Ji代表概率选择的倒数。同样的，如果用工具变量估计，可能需要通过选择概率的倒数的对工具变量的正交条件加权。
这些例子表明一个更加普遍的观点，伍德里奇（1999）为整个类别的M估计进行了分析。存在一个内生的抽样，估计忽略了内生抽样导致了不一致。但是如果通过选择概率的倒数加权标准函数最小化（平方和、绝对值和、对数似然的复数、正交条件下的距离函数等待），估计将变得一致。
Wooldridge（1999）一个重要的观点是，如果抽样概率外生而不是内生，对于一致性加权可能不是必须的，反而损害精确度。在这种情况的线性回归模型，正确的说明条件均值，样本可能外生，如果抽样概率是独立于回归方程的误差项。在这种情况下，如果抽样概率仅对解释变量有偏。更一般的，问题在于是否抽样是独立于依赖解释变量的因变量。
举个例子，假设一个估计线性回归模型，用一个过度抽样的州（如流动人口调查），但是这个模型解释变量中包括州虚拟变量。然后，如果模型是正确的，误差项与抽样标准不相关，加权是不必要的。如果误差项满足理想条件，OLS估计是最优的方法。用WLS代替OLS，当加权对于一致性不是必须的，会有什么代价吗？是的，会付出效率的代价。如果误差项是同方差的，加权会导致异方差，通常导致估计结果不准确。更普遍的，当误差项是异方差的，是否加权的对比将变得模糊。在第三部分，我们推荐用标准的诊断异方差作为寻找有效估计的一个引导。
当然，我们需要知道的是，在实践中，模型不是完美的。最优情况下，是一个近似的数据产生过程。微观经济学是基于不切实际的强假设的理论，对于现实经济指导有限，源自理论经济学家的不准确的引导如何实证研究。从这个角度，虽然不完美，近似的条件均值的真实模型，可能合理的希望OLS估计会更加接近无偏的和一致的对于解释变量的效用估计。WLS估计也是如此（缺乏完美的无偏和一致性），但是WLS可能是更加不准确。
最后，我们将提供什么建议？首先，如果抽样率变化内生性，一致性通过概率选择的倒数估计加权是需要的。第二，加权估计应该伴随稳健标准误。例如，在线性回归模型，由加权引起的异方差要求用White（1980）异方差稳健标准误。最后，当变量是抽样外生的，对于正确设定的模型，加权与否都是一致估计，但不加权估计更加精确。然而，犹如之前的部分的说明，我们推荐加权不加权的估计同时报告，因为对比可以作为一个有用的联合检验，防止模型错误设定或者误解了抽样过程。

读书笔记——What are we weighting for翻译连载

作者：半米阳光

相关文章

热门散文

最新文章

推荐文章