百科狗-知识改变命运!
--

差异统计分析 怎样做?

乐乐1年前 (2023-12-22)阅读数 7#综合百科
文章标签变量方差

差异分析 1、均值描述—Means过程

2、t检验

3、方差分析

均值描述——Means过程

定义:Means过程是SPSS计算各种基本描述 统计量的过程。Means过程其实就是按照用户指 定条件,对样本进行分组计算均数和标准差,如 按性别计算各组的均数和标准差。

Means过程的计算公式为:

研究问题 比较不同性别同学的数学成绩平均值和方 差。数据如表所示。

数学成绩表

性 别 数 学

Male

Female

99

88

79

54

59

56

89

23

79

89

99

t检验就是检验统计量为t的假设检验。 用于检验两个变量之间的差异。

假设检验的一般步骤: ? 根据实际问题提出原假设H0与备择假设 H1。 ? 选择统计量t作为检验统计量,并在H0成立的条件下确定t的 分布。 ? 选择显著性水平 ,并根据统计量t的分布查表确定临界值及 H0的拒绝域。 ? 根据样本值计算统计量的值,并将其与临界值作比较。 ? 下结论:若统计量的值落入拒绝域内,就拒绝H0;否则,不 拒绝H0。

显著性水平: 0.05——显著 0.001——非常显著 0.0001——极其显著

t检验的类型

单样本t检验——样本均值与总体均值的比较 ? 独立两样本t检验——独立两样本均值比较 ? 配对样本t检验——配对设计的差数均值与总体均 值0的比较

单样本t检验 统计学上的定义和计算公式

定义:SPSS单样本T检验是检验某个变量 的总体均值和某指定值之间是否存在显著差异。 统计的前提是样本总体服从正态分布。也就是 说单样本本身无法比较,进行的是其均数与已 知总体均数间的比较。

单样本T检验的零假设为H0总 体均值和指定检验值之间不存在 显著差异。采用T检验方法,按照 下面公式计算T统计量:

SPSS中实现过程

分析——比较均值——单样本T检验

SPSS中实现过程

研究问题 分析某班级学生的高考数学成绩和全国的 平均成绩70之间是否存在显著性差异。数据如 表所示。

数学成绩表 性 别 Male 99 79 59 数 学 89 79 89 99

Female

88

54

56

23

单尾检验与双尾检验

在平均数的检验中,研究者的兴趣往往在于比较不同平均数的差距,而提出两个 平均数大于、小于与不等于几种不同形式的研究假设,形成有特定方向的检验或无 方向性的检验两种不同模式。当研究者只关心单一一个方向的比较关系时(例如男生 的数学成绩X1优于女生X2),平均数的检验仅有一个拒绝区,需使用单尾检验(onetailed test),范例如下: 分别是男生与女生数学成绩的平均数

当研究者并无特定方向的设定(例如男生的智商与女生的智商有所不同),假设检验在 两个极端的情况皆有可能发生,而必须设定两个拒绝区,此时即需使用双尾检验(twotailed test)。如:

单尾检

学 54 50 89 67 79 78 56 89 89 56

图4-6 “Independent-Samples T Test”对话框

图4-7 “Define Groups”对话框

结果和讨论

两配对样本T检验 统计学上的定义和计算公式

定义:两配对样本T检验是根据样本数据对样本来自的两配对 总体的均值是否有显著性差异进行推断。一般用于同一研究对象 (或两配对对象)分别给予两种不同处理的效果比较,以及同一研 究对象(或两配对对象)处理前后的效果比较。前者推断两种效果 有无差别,后者推断某种处理是否有效。 两配对样本T检验的前提要求如下: ? 两个样本应是配对的。在应用领域中,主要的配对资料包 括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首 先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改 变。 ? 样本来自的两个总体应服从正态分布。

原理 1、配对样本t检验是配对设计的样本差数的均值同总体均值0比较的t 检验。 2、配对样本t检验是针对配对数据的t检验。其检验方法是首先求出 每对样本的差值,然后比较样本差值的均值和总体均值0之间的关 系。 如果两组数据没有差别,那么其样本差值的均值应该在0附近波动。 否则为两组数据是有差别的。这种方法的本质就是在对配对样本的 差值同总体均值0做单样本t检验。

两配对样本T检验的零假设H0为两总体均 值之间不存在显著差异。

◆注意 单样本t检验和独立两样本t检验样本内部 数据的顺序是可以任意调换。而配对样本t 检验的样本必须是一一对应的。样本内数 据的顺序不能随意交换顺序。

SPSS将自动计算T值,由于该统计量服从 n?1个自由度的T分布,SPSS将根据T分布表给 出t值对应的相伴概率值。 如果相伴概率值小于或等于用户设想的显著性 水平?,则拒绝H0,认为两总体均值之间存在 显著差异。 相反,相伴概率大于显著性水平?,则不拒绝 H0,可以认为两总体均值之间不存在显著差异。

SPSS中实现过程

分析——比较均值——配对样本T检验

方差分析

多个独立样本的差异显著性检验,通常可以使用方 差分析方法。

油菜品种差异性分析 P164

不同教学方式是否给学生成绩造成了显著影响; 不同地区的考生成绩是否有显著的差异等。

方差分析基本概念

方差分析是R.A.Fister发明的,用于两个及两个以上样 本均数差别的显著性检验。方差分析方法在不同领域的各个 分析研究中都得到了广泛的应用。从方差入手的研究方法有 助于找到事物的内在规律性。 由于各种因素的影响,研究所得的数据呈现波动状而有 所不同。造成波动的原因可分成两类: 一类是不可控的随机因素的影响,这是人为

第3/7页

为很难控制的 一类影响因素,称为随机变量; 另一类是研究中人为施加的可控因素对结果的影响,称 为控制变量。

方差分析可以用来判断样本数据之间的差 异到底是由以上哪种因素造成的。

随机变量

差异统计分析 怎样做?

随机误差

不可控

控制变量

系统误差

有固定的大小和方向(正或负), 重复测定时重复出现,可以校正 或消除。

方差分析的目的主要有以下: 1、通过数据分析找出对该事物有显著影 响的因素; 2、研究各因素之间的交互作用是否对该 事物造成影响。

◆注意:方差分析的适用条件 ? 1、样本来自的总体服从正态分布。 ? 2、样本方差必须是齐次的。

3、各样本之间相互独立。 方差分析的类型

单因素方差分析

单因素方差分析是指只单独考虑一个因素A对指标X的影响。 此时其他因素都不变或者控制在一定的范围之内。考虑因素A 有k个水平,在每次水平下做ni次试验。

在方差分析中,代表变异大小,并用来进行变异分解的 指标是离均差平方和。总的变异平方和记为SST,被分解为 两项:第一项是各组的离均差平方和之和,代表组内变异 (即随机变量引起的变异),称为组内平方和SSW(Within Groups);第二项是按样本含量大小加权的各组均数与总均 数的差值平方之和,代表组间变异(由控制变量引起的变 异),称为组间平方和或者处理平方和SSB(Between Groups)。

总变异 = 随机变异 + 处理因素导致的变异 总变异 = 组内变异 + 组间变异

这样,我们可采用一定的方法来比较组内变异和组间变 异的大小,如果后者远远大于前者,则说明处理因素的影响 确实存在,如果两者相差无几,则说明影响不存在,这就是 方差分析的基本思想。

计算公式

SST=SSW+SSB

其中,k为水平数;ni为第i个水平 下的样本容量。可见,组间样本离 差平方和是各水平组均值和总体均 值离差的平方和,反映了控制变量 的影响。 组内离差平方和是每个数据与本水 平组平均值离差的平方和,反映了 数据抽样误差的大小程度。

F统计量是平均组间平方 和与平均组内平方和的 比(组间变异与误差变 异的比值)。

从F值计算公式可以看出,如果控制变量 的不同水平对观察变量有显著影响,那么观察 变量的组间离差平方和必然大,F值也就比较 大;相反,如果控制变量的不同水平没有对观 察变量造成显著影响,那么,组内离差平方和 影响就会比较大,F值就比较小。

SPSS中实现过程

分析——比较均值——单因素ANOVA

SPSS中实现过程

研究问题

人 名 hxh yaju yu shizg hah s watet jess wish 2_new1 2_new2 2_new3 2_new4 2_new5 2_new6 2_new7 2_new8 2_new9 数 学 99.00 88.00 99.00 89.00 94.00

第4/7页

90.00 79.00 56.00 89.00 99.00 70.00 89.00 55.00 50.00 67.00 67.00 56.00 56.00 组 别 0 0 0 0 0 0 2 2 2 2 2 2 1 1 1 1 1 1

三组学生的数学成绩

实现步骤

在菜单中选择“One-Way ANOVA”命令

“One-Way ANOVA”对话框

“One-Way ANOVA:Contrasts”对话框

“One-Way ANOVA:Options”对话框

“One-Way ANOVA:Post Hoc Multiple Comparisons” 对话框

结果和讨论

(1)首先是单因素方差分析的前提检验 结果,也就是Homogeneity of variance test——方差齐次性检验

(2)输出的结果文件中第2个表格如下所示。

(3)输出的结果文件中第3个表格如下所示。

(4)输出的结果文件中第4个表格如下所示。

(5)输出结果的最后部分是各组观察变 量均值的折线图,如图5-6所示。

事后比较方法的选择 LSD法实际上是t检验的变形,只是在变异和自由度的计算上利用了整个样本

信息,而不仅仅是所比较两组的信息。因此它敏感度是最高,在比较时仍然 存在放大α水准(一类错误)问题,但换言之就是总的二类错误非常的小, 要是LSD都没有检验出差别,那恐怕真的没有差别。 SNK法运用的最广泛的,它采用Student Range分布进行所有各组均值间的 配对比较。该方法保证在H0真正成立时总的α水准等于实际设定值,即控制 了一类错误。 张文彤 P268

多因素方差分析 统计学上的定义和计算公式

多因素方差分析用来研究两个或两个以上控制 变量是否对观测变量产生显著影响。 多因素方差分析不仅能够分析多个因素对观测 变量的独立影响,更能够分析多个控制因素的 交互作用能否对观测变量的分布产生显著影响, 进而最终找到利于观测变量的最优组合。

多因素方差分析不仅需要分析多个控制变量独 立作用对观察变量的影响,还要分析多个控制变量 交互作用对观察变量的影响,及其他随机变量对结 果的影响。因此,它需要将观察变量总的离差平方 和分解为3个部分: ? 多个控制变量单独作用引起的平方和; 多个控制变量交互作用引起的离差平方和; 其他随机因素引起的离差平方和。

以上F统计量服从F分布。SPSS将自动计算 F值,并根据F分布表给出相应的相伴概率值。

SPSS中实现过程

分析——常规线性模型——单变量

SPSS中实现过程

表5-2

研究问题

三组不同性别学生的数学成绩

人 名 hxh yaju yu shizg hah s watet jess wish 2_new1 2_new2 2_new3 2_new4 2_new5 2_new6 2_new7 2_new8 2_new9 数 学 99.00 88.00 99.00 89.00 94.00 90.00 79.00 56.00 89.00 99.00 70.00 89.00 55.00 50.00 67.00 67.00 56.00 56.00 组 别 0 0 0 0 0 0 2 2 2 2 2 2 1 1 1 1 1 1 性 别 male female male male female male male female male male female male female male female male female male

实现步骤

图5

第5/7页

-7 在菜单中选择 “Univariate”命令

图5-8 “Univariate”对话框(一)

图5-9 “Univariate: Options”对话框(一)

图5-10 “Univariate: Post Hoc Multiple Comparisons for Observed Means”对话框

图5-11 “Univariate:Model”对话框

图5-12 “Univariate:Profile Plots”对话框

图5-13 “Univariate:Contrasts”对话框

结果和讨论

(1)SPSS输出结果文件中的第一部分如 下两表所示。

(2)输出的结果文件中第二部分如下表 所示。

(3)输出的结果文件中第三部分如下表 所示。

(4)输出的结果文件中第四部分如下表 所示。

(5)输出的结果文件中第五部分如下表所 示。

(6)输出的结果文件中第六部分如下表所 示。

(7) 输出结果的最后部分是控制变量之 间是否有交互影响的图形。

协方差分析 统计学上的定义和计算公式

定义:协方差分析是将那些很难控制的因素作为协变量, 在排除协变量影响的条件下,分析控制变量对观察变量的影 响,从而更加准确地对控制因素进行评价。 利用协方差分析就可以完成这样的功能。协方差将那些 很难控制的随机变量作为协变量,在分析中将其排除,然后 再分析控制变量对观察变量的影响,从而实现对控制变量效 果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间 互相独立,且与控制变量之间也没有交互影响。

前面单因素方差分析和多因素方差分析中的控 制变量都是一些定性变量。而协方差分析中则即包 含了定性变量(控制变量),又包含了定量变量 (协变量)。

以上F统计量服从F分布。SPSS将自动计算F值,并根据F 分布表给出相应的相伴概率值。 如果F控制变量的相伴概率小于或等于显著性水平,则控 制变量的不同水平对观察变量产生显著的影响;如果F协变量 的相伴概率小于或等于显著性水平,则协变量的不同水平对 观察变量产生显著的影响。

5.4.2 SPSS中实现过程

分析——常规线性模型——单变量

5.4.2 SPSS中实现过程

表5-3

人 名 hxh yaju yu shizg hah s watet jess wish 2_new1 2_new2 2_new3 2_new4 2_new5 2_new6 2_new7 2_new8 2_new9

研究问题

三组学生的数学成绩

数 学 99.00 88.00 99.00 89.00 94.00 90.00 79.00 56.00 89.00 99.00 70.00 89.00 55.00 50.00 67.00 67.00 56.00 56.00 入学成绩 98.00 89.00 80.00 78.00 78.00 89.00 87.00 76.00 56.00 76.00 89.00 89.00 99.00 89.00 88.00 98.00 78.00 89.00 组 别 0 0 0 0 0 0 2 2 2 2 2 2 1 1 1 1 1 1

实现步骤

图5-15 在菜单中选择“Univariate”命令

图5-16 “Univariate”对话框(二)

5.4.3 结果和讨论

小 结

方差分析用于两个及两个以上样本均值差异的显著性检验。方差分析 的基本思想是:通过分析研究中不同变量的变异对总变异的贡献

第6/7页

大小, 确定控制变量对研究变量影响力的大小。通过方差分析,分析不同水平 的控制变量是否对结果产生了显著影响。如果控制变量的不同水平能够 对结果产生显著影响,那么它和随机变量共同作用,必将使结果有显著 变化。 单因素方差分析所解决的是一个因素下的多个不同水平之间的相关 问题;多因素方差分析的控制变量在两个或两个以上,其主要用于分析 多个控制变量的作用、多个控制变量的交互作用以及其他随机变量是否 对结果产生了显著影响;协方差分析将那些很难控制的因素作为协变量, 在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更 准确地对控制因素进行评价。 单因素方差分析主要用“Analysis”的“Compare Means”菜单下的 “One—Way ANOVA”子菜单实现;多因素方差分析和协方差分析都是在 “Analysis”下“General Linear Model”菜单下的“Univariate”子菜单 实现的。

什么是T检验法和Q检验法

方差分析,用来观察某一变量在另一变量的不同水平上,是否有显著差异。

例如,学员的"心理适应情况"在"不同性别间"(或者不同汉语水平上)有没有显著差别。

具体的操作是这样的:

点击分析…比较均值…单因素ANOVA

选择因变量和因子

点击右侧对比,弹出对话框,选择多项式…线性。

继续,点击右侧两两比较,选择LSD,SNK,Tamhane's T2,然后点击继续。

再点击右侧选项,选择描述性,方差同质性检验,均值图。 点击继续。

回到对话框,点击确定。

出现以下结果:

因为选择数据的时候,因子为性别,只有男女两个水平,因此显示了"没有执行"在此之后"的检验"。不过,这仍然得到了结果,看单因素方差分析表,可以看到,显著性为0.580,说明组间差别不显著。

---------------------------------------------------

重新从"分析"开始,尝试把因子改为"汉语水平",重复以上步骤,可以得到以下结果。

看"方差齐性检验表",显著性<0.05,说明方差不齐,也就是不相等,这时候看Tamhane检验的结果。(当然,如果显著性>0.05,说明方差齐,这时候看LSD和SNK的结果)。

Tamhane是各个水平两两比较的结果,可以看到不同水平间的差异显著性。

Q检验法

Q检验法又叫做舍弃商法,是迪克森(W.J.Dixon)在1951年专为分析化学中少量观测次数(nQ表,则舍去可疑值,否则应予保留。

F检验法

F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差S2,以确定他们的精密度是否有显著性差异。至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行t 检验。

样本标准偏差的平方,即:

两组数据就能得到两个S?值,

由表中f大和f小(f为自由度n-1),查得F表,

然后计算的F值与查表得到的F表值比较,如果

F

F ≥ F表 表明两组数据存在显著差异。

T检验法

T检验法,亦称student t检验(Student's t test),主要用于样本含量较小(例如n

鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com

免责声明:我们致力于保护作者版权,注重分享,当前被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!邮箱:344225443@qq.com)

图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,本着为中国教育事业出一份力,发布内容不收取任何费用也不接任何广告!)