精确断点回归(RD)理论及评价
- 培训职业
- 2025-05-06 06:39:43
断点回归(RD)理论及评价
断点回归(RD)模型概述
断点回归是一种样本选择和数据生成的机制,用于构造局部随机试验,进行因果推断。其基本思想是存在一个连续变量,决定个体在某一临界点两侧接受政策干预的概率。由于该变量在临界点两侧连续,个体落入一侧的概率是随机的,形成准自然实验。断点回归通过靠近断点的样本值来估计处理效应,利用处理变量在某点处的断点,使得两侧接受处理的概率不同,影响结果。
精确断点回归(SRD)和模糊断点回归(FRD)是断点回归的两种类型。SRD中,断点x=c处,个体接受处理的概率从0跳跃到1;FRD中,接受处理的概率从a跳跃到b,其中0<1。
解决处理效应问题
为解决是否上大学对末来工资的影响问题,假设上大学完全取决于高考成绩是否超过500分。断点回归适用于此类问题,因为处理变量是连续变量的确定性函数。倾向得分匹配和双重差分模型不适用,因它们需要处理组与控制组有重叠,而本问题中处理组与控制组之间完全分离。
精确断点回归原理及数学基础
精确断点回归利用断点处的局部随机性估计处理效应。在断点附近,个体各方面差异不大,高考成绩微小差异仅由随机因素决定,导致接受大学教育概率的变化,形成局部平均处理效应。通过回归分析,估计处理效应,利用断点附近的数据估计在断点处的局部平均处理效应(LATE)。引入虚拟变量和互动项,允许斜率在断点两侧不同。使用OLS回归得到的系数为LATE的估计值。
考虑高次项与非参数回归
在精确断点回归中,引入高次项可解决遗漏变量偏差问题,而非参数回归则不依赖于函数形式,通过最小化均方误差选择最优带宽。局部线性回归适用于断点回归,通过加权最小二乘估计,优化权重以减少偏差和方差。
带宽选择与协变量
最优带宽通过最小化均方误差选择,以平衡偏差和方差。包含协变量可提高估计准确性,减少扰动项方差,但需注意协变量的内生性问题。使用特定核函数(如三角核或矩形核)进行加权平均。
内生分组问题与稳健性检验
内生分组可能导致断点回归失效,需要检验条件密度函数在断点处的连续性。稳健性检验包括不同核函数、带宽、协变量以及模型设定的检查。
断点回归的优点与局限性
断点回归在随机实验受限时很有用,其结果接近随机实验。优点包括适用于局部随机实验,缺点在于工具变量法的局限性、处理其他变量的困难、局部效应难以推广、非混淆假设的严格性。
多重随机标签