Currently set to Index
Currently set to Follow

描述性研究与相关性研究的区别

在学术论著的创新性判断中,发现新事物的存在通常具有最强的创新性,其次是揭示新事物的影响因素相关性。如果没有存在,就谈不上相关性。相关性包括因果关系和噪声关系。因果关系(causal relationship指的是原因与结果之间的关系。噪声关系(noise relationship包括非因果关系的其他影响关系。揭示“存在”问题的研究是描述性研究(descriptive research。揭示“相关”问题的研究是相关性研究(correlation research。当然,相关性研究也可以用来揭示新事物的“存在”。这两种研究类型代表两种不同的试验研究方法,是在无法进行理论模型推导计算时所必须采用的科研方法。本文论述描述性研究与相关性研究之间的区别。

以天文学为例,发现行星的存在与研究行星运动轨迹受哪些因素影响,属于两种不同创新性类型的研究问题。再以医学为例,研究某种致病原因对发病结果的影响,与研究性别(视为噪声因子)与是否发病之间的关联,属于两种不同相关性类型的研究问题。在描述性研究中,所有参数均称为特征参数,不存在自变量(又称因子)因变量(又称响应)之间的划分,因为描述性研究只需展示事物或其某种分布的存在,而不关心因果关系或影响关系。然而,在相关性研究中,必须划分因子和响应,将能够干预改变的因子称为控制因子(例如发动机功率),而将不能干预改变的因子称为噪声因子(或称非控制因子,例如环境大气温度)。相关性研究包括无噪声因子和有噪声因子两种。

如果没有噪声因子存在,当控制因子的取值发生改变时,响应参数将获得一个确定的取值。比如,当踩下车辆的油门后,车子会加速行驶。然而,当噪声因子存在时,响应参数的取值就不再是确定的数值,而是呈现出一条概率密度分布函数或直方图形式。例如,在某个固定的车辆油门开度下,由于道路上随机变化的横风风速的影响,车辆会呈现横向微偏,这些微偏值也是随机变化的,可能会呈现出一条正态分布曲线的形式。这条正态分布曲线具有两个特征量,一个称为均值,另一个称为偏差(散度)。当噪声因子存在时,如果控制因子的某个取值给出一组均值和偏差,而另一个取值给出另一组均值和偏差,而且如果这两个偏差不相等,那就构成一个稳健性问题,又称抗扰性或鲁棒性问题。稳健性问题的核心任务是找到优化的控制因子取值,使得均值最优(最大、最小或达到目标值)、散度最小——这构成一个双目标优化问题。

如果描述性研究中的特征参数没有被赋予时间维度,即所有参数的取值均发生在同一时间,这种研究称为横断面研究(cross-sectional study,例如研究全国人口普查的职业、年龄等分布特征。当描述性研究中的特征参数被赋予时间维度时,称为时间序列研究(time series study纵向研究(longitudinal study,例如研究流行病发病率随年份变化的趋势。

无噪声因子的相关性研究(又称控制性研究)需要在具有严格控制条件的实验室中进行,例如改变药物剂量,观察经过严格筛选分组后的受试者的生理反应。有噪声因子的相关性研究(又称控制加噪声研究)可以在不具备严格控制条件的实验室中进行(例如改变药物剂量,观察具有不同的年龄、性别、体重、病史的受试者的生理反应),或者可以使用描述性研究数据,因为描述性研究数据中可能包括控制因子和噪声因子,而时间就可以是一个典型的噪声因子。当然,描述性研究数据中也可能不包括任何相关性内容,比如展示某个地区的性别比例和受教育程度的分布数据。

描述性研究的目的是揭示新事物存在。相关性研究的目的是揭示因果关系和噪声关系,当然也可以用来揭示新事物存在。描述性研究的数据是可以用来进行相关性研究的,只是这种数据中存在大量的噪声因子,处理起来难度较大。从产生有价值的新发现角度评价,描述性研究和相关性研究都有其各自的难度。从收集数据的难易程度评价,描述性研究(尤其是横断面研究)是最容易产生试验数据的,而无噪声因子的相关性研究(控制性研究)是最难产生试验数据的。

因子之间的相互作用是指响应参数随一个因子的变化趋势受到另一个因子的取值的影响。例如,当发动机进气量随转速变化的规律受到海拔高度的影响,则称转速与海拔高度之间存在相互作用。揭示相互作用是系统工程研究的核心任务,也是研究复杂性影响所必须具备的内容。响应曲面方法最擅长高效处理因子相互作用。因此,它是用于相关性研究的最有效工具之一。

在相关性研究中,当因子的个数多于两个时,尤其当因子的水平值较多时,使用全析因试验设计(又称参变量扫值法)就很不方便,因为试验数据点太多。这时,就需要使用部分析因设计方法完成试验设计,以便高效收集数据。由于描述性研究的数据无法事先针对因子进行控制或设计,这种数据在特征参数的水平值数量上呈现出随机特征或不确定特征,可以视为一种特殊的、各因子具有不同水平值数量的拉丁超立方设计(又称空间填充设计)。

综上所述,描述性研究和相关性研究在数据特征上可以具有共同点和重叠部分(即关于噪声因子的部分),而在研究目的上则是完全不同的。

Researchers Poll

您更倾向于以下哪种方式来提升科研诚信?