应答率越高，无应答误差一定越小吗？

调研家SurveyPlus

标签：问卷测试数据收集应答率

2021-08-27

问卷测试数据收集应答率

无应答误差指由于受访者不作答而导致的收集到的数据值与数据真实值之间的差异。以上个月的美国总统大选为例，那些迟到的邮寄选票起到了影响选举结果的关键作用：如果它们最终被视作无效票，获胜者可能是共和党候选人特朗普，而不是民主党候选人拜登了。一部分人是否提交成功了选票（即等同于是否作答）起到了改变选举结果的作用，这就是无应答可能导致的误差。

很多研究者或项目管理者在调查中都追求高应答率（点击阅读无应答和应答率的计算）。一些学术期刊在评审文章时，哪怕是在概率抽样的原则上妥协，都不愿在应答率上妥协。在没有成本限制的情况下，应答率高当然不是坏事。然而现实情况是，受访者越来越不愿意作答已经成为调查的普遍趋势。应答率的提高，尤其在接近临界值时，往往需要耗费巨大的成本。据统计，美国消费者态度调查（Survey of Consumer Attitudes，SCA）为了维持70%的应答率，在1979年平均只需要给每个受访者拨打4次电话，而在20年后则平均需要拨打8次电话（Curtin 2000）。时至今日，绝大多数人都会拒绝接听陌生的电话，提高应答率的成本更是可想而知。

所以问题来了，提高应答率的努力是否值得？我们采集数据的一个终极目标是获得准确的估值。我们真正担忧的是无应答导致的误差，而非无应答本身。所以当我们尽一切努力提高应答率时，我们的一个基本前提假设是应答率的提高可以减少无应答误差。但这个假设是否一定成立呢？

扑朔迷离：应答率与无应答误差相关吗？

100%的应答率是最完美的状况，如果一项调查的应答率是100%，那么它的无应答误差就是0。而当无应答发生，无应答误差的产生便有了可能。Peytchev（2013）在美国国家药物使用与健康调查（National Survey on Drug Use and Health）的数据中发现，在使用应答率作为自变量、滥用心理治疗处方药的比例作为因变量的回归分析中，因变量的70%的变动可以归因于自变量即应答率的变动。而且，在控制了应答率的影响后，年份对于滥用心理治疗处方药的影响作用不再显著了——这意味着药物滥用随年份增加仅仅是表面现象，应答率的变化改变了应答人员的结构，从而导致实际能观察到的滥用药物的比例上升了，但这并不代表研究总体中滥用药物的比例真正随时间发生了改变。

但另一部分人的研究结果却证明了低应答率并不会对数据结果产生影响。Keeter等人（2000）比较了两种不同的调查安排对数据结果的影响：一种调查安排是5天执行期，最后达到的应答率约为37%，另一种调查安排是2个月执行期，最后达到的应答率约为61%。两种调查安排使用的问卷内容相同，尽管应答率相差甚远，然而两种调查安排下有显著差别的变量却非常少。Curtin等人(2000)的研究也发现了类似的结果。他们使用消费者态度调查（SCA）从1970年到1996年近20年的211次调查的数据来探索应答率对调查结果的影响。消费者态度调查采用的是电访模式，每次随着电话联系次数的增加，应答率不断增加。假设每次调查访员联系的次数减少，数据的结果会不一样吗？基于这样一种的思路，Curtin等人依次比较了将需要拒访逆转的人从数据集中排除之后（应答率降低5-10个百分点）、将需要联系5次以上才能访问成功的人从数据集中排除之后（应答率降低25个百分点）、将需要联系2次以上的人从数据集中排除之后（应答率降低50个百分点）的一些关键变量的统计结果，发现无论是排除哪一部分人，对最终的统计结果均没有太大的影响。

应答率不是决定无应答误差的唯一因素

事实上，应答率并不是决定无应答误差的唯一因素。评估无应答误差的常用公式由两部分组成，一部分是无应答率（ms/ns），另一部分是应答者与无应答者在估测变量（通常为一项研究所关注的因变量）上的差异（ _ ）。举例来说，如果一项调查的应答率是70%，应答者与无应答者在估测变量上的差异是100，那么无应答误差为30（即30%*100）；另一项调查的应答率是40%，应答者与无应答者在估测变量上的差异为20，那么无应答误差为12（60%*20）。尽管后一项调查的应答率更低，但是它的无应答误差并没有更高，反而更低。

Goves和Peytcheva（2008）的研究很好的总结了应答率和无应答误差之间的关系。在对59项调查中959项变量的meta-analysis分析中，他们发现无论是高应答率还是低应答率，都可能导致高的无应答误差，也可能导致低的无应答误差。应答率和无应答误差之间并没有必然的联系（如下图所示）。而且，无应答误差的变化大多数是变量层面的，而非调查项目层面的。

所以，仅仅凭借应答率的高低来判断数据的好坏并不合理。举个实际的例子，如果我们希望了解全部成年人使用社交媒体的习惯和偏好，即便应答率不断提高，但如果作答的全是年轻人，那我们了解到的情况肯定还是有很大的偏差，因为年轻人和中老年人使用社交媒体的习惯和偏好肯定是不一样的。相反，如果年轻人和中老年人在使用社交媒体的习惯和偏少上没有太大差异，那么，即便因为没有访问到老年人而导致应答率偏低，对数据结果也不会有太大影响。

总结

应答率因为简单、可操行强，经常被当作评估数据质量好坏的关键指标。然而，综合本章全部的讨论，应答率并不是影响无应答误差的唯一因素。应答者与无应答者在估测变量上的差异也会对无应答误差产生影响。因此当我们在评估一项调查的数据的好坏时，并不能简单地仅仅靠应答率的高低来做出判断。另外，从成本的角度考虑，如果我们努力提高应答率却不能增加答题人群的多样性，这样的努力很有可能会徒劳无功。

回到文章开头关于美国总统选举的例子，为什么邮寄选票会对选举的结果产生颠覆性的影响？因为邮寄选票的大多是支持民主党的选民，他们与那些去投票点按时完成投票的选民（支持共和党的选民更偏好去投票点投票）在选举态度上有本质区别，因此如果他们的选票没有成功提交，选举结果就会产生很大的误差。如果这些邮寄选票的选民在选举态度上是完全随机的，那么无论他们的选票是否提交或者是否计数，对选举结果都不会有影响。

【参考文献】

Curtin, Richard, Stanley Presser, and Eleanor Singer. 2000. “The effects of response rate changes on the index of consumer sentiment.” Public Opinion Quarterly 64 (4): 413–28.

Groves, Robert M. and Emilia Peytcheva. 2008. “The impact of nonresponse rates on nonresponse bias: A meta-analysis.” Public Opinion Quarterly 72 (2): 167–89.

Keeter, Scott, Carolyn Miller, Andrew Kohut, Robert Groves, and Stanley Presser. 2000. “Consequences of Reducing Nonresponse in a Large National Telephone Survey.” Public Opinion Quarterly 64:125–48.

Peytchev, Andy. 2013. “Consequences of Survey Nonresponse.” The ANNALS of the American Academy of Political and Social Science 645: 88-111.