专业人士都在用的调研平台

多变量探索性分析

调研家SurveyPlus
2022-03-22

探索两个变量间的因果关系是非常有用的,但就从我们的日常生活经验来看,现实生活中的关系可远比这复杂多了,通常多个变量间都会存在因果关系。所以,我们下面探索多变量的分析方法。

例如,你观察到广告投入和销售量之间存在着相关关系——随着广告投入的增加,销售量也上升。但请记住,即使广告投入和销售量之间不存在任何因果关系,也可能会看到两者相关,这种相关关系是虚假的。原因可能是存在着一个外生变量或混杂变量,如竞争者的活跃程度,或者是存在着中间变量或调节变量。为了研究这个问题,我们需要学习多变量分析。请记住我们之前所提到的,双变量相关也称为零秩相关,三个变量相关也称为一秩相关,四个变量相关也称为二秩相关,以此类推。

1.偏相关

正如我们在之前提到过的,偏相关系数是皮尔逊积矩相关系数(PMCC)的一类延伸。当可能存在超过两个变量存在相关关系时,我们就使用偏相关系数进行检验。对于三个变量来说,偏相关系数是通过数学方法“控制”第三个变量来计算两个变量间的相关关系(见图15-2)o为了使用偏相关计算,变量必须是可计量变量(定距变量或定比变量),必须是线性关系,必须是正态分布,必须方差齐性。偏相关计算会排除第三个变量的影响,比较偏相关系数和两个变量间的相关系数,可以告诉我们第三个变量究竟对两个变量间的相关关系有什么影响。如果两者间的差值很小,则第三个变量的影响很小;如果两者间的差值较大,则第三个变量确实影响到了两个变量间的关系。

2.多元回归

多元回归是多元变量探索性分析中经常用到的方法之一,它以两个或更多的变量充当自变量,以另一个变量充当因变量。要求是,因变量须是可计量变量,自变量可能是可计量变量,也可能是可分类变量,如果是可分类变量,那么这种回归我们称为逻辑回归(logisticregression)o多元线性回归可以允许我们基于多个自变量的变化预测因变量的变化,还可以计算出每个自变量对因变量的影响程度。多元线性回归的基本原理和二元回归/线性回归一样,我们就不再赘述了。

使用多元线性回归有一系列条件:样本不能太小(100);自变量不能高度相关(一种成为多重共线性的现象);不存在奇点(singularity,也就是自变量不能是其他自变量的组成变量);采取合适的手段处理离散值(移除等);检査变量值的分布情况,它们是否符合线性关系、正态分布和方差齐性。

存在着包括标准多元线性回归、等级多元线性回归和逐级多元线性回归等多种多元线性回归方式,本文不予以阐述。

3.方差分析

方差分析(analysisofvariance,AN0VA)用于分析一个可计量的因变量结果和一个可分组的自变量结果间是否相关,例如,由于社会阶层或性别产生的收入差异,或者由于城市不同而导致的不同犯罪率问题。方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。

相关推荐

随时随地获取 调研家 观点

关注公众号

调研家,专业人士
都在用的调研平台

关注调研家公众号

随时随地了解问卷编辑、数据数据、数据分析干货分享

调研家,专业人士
都在用的调研平台

获取定制解决方案

《调研家服务协议》
已有账户 马上登录

提交成功

感谢您的申请,我们将在24小时内与您联系

知道了

调研家将为您提供

一对一专业服务,根据您的项目情况,为您定制专属解决方案

专业服务助您事半功倍
样本需求
项目定制
  • 请选择您的需求

  • 提交成功

    感谢您的申请,我们将在24小时内与您联系

    广东省深圳市南山区登良路汉京国际大厦20楼FG单元

    0755-21615848

    contact@surveyplus.cn

    微信扫码关注
    调研家公众号