差异统计分析 怎样做?
差异分析 1、均值描述—Means过程
2、t检验
3、方差分析
均值描述——Means过程
定义:Means过程是SPSS计算各种基本描述 统计量的过程。Means过程其实就是按照用户指 定条件,对样本进行分组计算均数和标准差,如 按性别计算各组的均数和标准差。
Means过程的计算公式为:
研究问题 比较不同性别同学的数学成绩平均值和方 差。数据如表所示。
数学成绩表
性 别 数 学
Male
Female
99
88
79
54
59
56
89
23
79
89
99
t检验就是检验统计量为t的假设检验。 用于检验两个变量之间的差异。
假设检验的一般步骤: ? 根据实际问题提出原假设H0与备择假设 H1。 ? 选择统计量t作为检验统计量,并在H0成立的条件下确定t的 分布。 ? 选择显著性水平 ,并根据统计量t的分布查表确定临界值及 H0的拒绝域。 ? 根据样本值计算统计量的值,并将其与临界值作比较。 ? 下结论:若统计量的值落入拒绝域内,就拒绝H0;否则,不 拒绝H0。
显著性水平: 0.05——显著 0.001——非常显著 0.0001——极其显著
t检验的类型
单样本t检验——样本均值与总体均值的比较 ? 独立两样本t检验——独立两样本均值比较 ? 配对样本t检验——配对设计的差数均值与总体均 值0的比较单样本t检验 统计学上的定义和计算公式
定义:SPSS单样本T检验是检验某个变量 的总体均值和某指定值之间是否存在显著差异。 统计的前提是样本总体服从正态分布。也就是 说单样本本身无法比较,进行的是其均数与已 知总体均数间的比较。
单样本T检验的零假设为H0总 体均值和指定检验值之间不存在 显著差异。采用T检验方法,按照 下面公式计算T统计量:
SPSS中实现过程
分析——比较均值——单样本T检验
SPSS中实现过程
研究问题 分析某班级学生的高考数学成绩和全国的 平均成绩70之间是否存在显著性差异。数据如 表所示。数学成绩表 性 别 Male 99 79 59 数 学 89 79 89 99
Female
88
54
56
23
单尾检验与双尾检验
在平均数的检验中,研究者的兴趣往往在于比较不同平均数的差距,而提出两个 平均数大于、小于与不等于几种不同形式的研究假设,形成有特定方向的检验或无 方向性的检验两种不同模式。当研究者只关心单一一个方向的比较关系时(例如男生 的数学成绩X1优于女生X2),平均数的检验仅有一个拒绝区,需使用单尾检验(onetailed test),范例如下: 分别是男生与女生数学成绩的平均数
当研究者并无特定方向的设定(例如男生的智商与女生的智商有所不同),假设检验在 两个极端的情况皆有可能发生,而必须设定两个拒绝区,此时即需使用双尾检验(twotailed test)。如:
单尾检
学 54 50 89 67 79 78 56 89 89 56
图4-6 “Independent-Samples T Test”对话框
图4-7 “Define Groups”对话框
结果和讨论
两配对样本T检验 统计学上的定义和计算公式
定义:两配对样本T检验是根据样本数据对样本来自的两配对 总体的均值是否有显著性差异进行推断。一般用于同一研究对象 (或两配对对象)分别给予两种不同处理的效果比较,以及同一研 究对象(或两配对对象)处理前后的效果比较。前者推断两种效果 有无差别,后者推断某种处理是否有效。 两配对样本T检验的前提要求如下: ? 两个样本应是配对的。在应用领域中,主要的配对资料包 括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首 先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改 变。 ? 样本来自的两个总体应服从正态分布。
原理 1、配对样本t检验是配对设计的样本差数的均值同总体均值0比较的t 检验。 2、配对样本t检验是针对配对数据的t检验。其检验方法是首先求出 每对样本的差值,然后比较样本差值的均值和总体均值0之间的关 系。 如果两组数据没有差别,那么其样本差值的均值应该在0附近波动。 否则为两组数据是有差别的。这种方法的本质就是在对配对样本的 差值同总体均值0做单样本t检验。两配对样本T检验的零假设H0为两总体均 值之间不存在显著差异。
◆注意 单样本t检验和独立两样本t检验样本内部 数据的顺序是可以任意调换。而配对样本t 检验的样本必须是一一对应的。样本内数 据的顺序不能随意交换顺序。
SPSS将自动计算T值,由于该统计量服从 n?1个自由度的T分布,SPSS将根据T分布表给 出t值对应的相伴概率值。 如果相伴概率值小于或等于用户设想的显著性 水平?,则拒绝H0,认为两总体均值之间存在 显著差异。 相反,相伴概率大于显著性水平?,则不拒绝 H0,可以认为两总体均值之间不存在显著差异。
SPSS中实现过程
分析——比较均值——配对样本T检验
方差分析
多个独立样本的差异显著性检验,通常可以使用方 差分析方法。
油菜品种差异性分析 P164不同教学方式是否给学生成绩造成了显著影响; 不同地区的考生成绩是否有显著的差异等。
方差分析基本概念
方差分析是R.A.Fister发明的,用于两个及两个以上样 本均数差别的显著性检验。方差分析方法在不同领域的各个 分析研究中都得到了广泛的应用。从方差入手的研究方法有 助于找到事物的内在规律性。 由于各种因素的影响,研究所得的数据呈现波动状而有 所不同。造成波动的原因可分成两类: 一类是不可控的随机因素的影响,这是人为
第3/7页
为很难控制的 一类影响因素,称为随机变量; 另一类是研究中人为施加的可控因素对结果的影响,称 为控制变量。
方差分析可以用来判断样本数据之间的差 异到底是由以上哪种因素造成的。
随机变量
随机误差
不可控
控制变量
系统误差
有固定的大小和方向(正或负), 重复测定时重复出现,可以校正 或消除。
方差分析的目的主要有以下: 1、通过数据分析找出对该事物有显著影 响的因素; 2、研究各因素之间的交互作用是否对该 事物造成影响。
◆注意:方差分析的适用条件 ? 1、样本来自的总体服从正态分布。 ? 2、样本方差必须是齐次的。
3、各样本之间相互独立。 方差分析的类型单因素方差分析
单因素方差分析是指只单独考虑一个因素A对指标X的影响。 此时其他因素都不变或者控制在一定的范围之内。考虑因素A 有k个水平,在每次水平下做ni次试验。
在方差分析中,代表变异大小,并用来进行变异分解的 指标是离均差平方和。总的变异平方和记为SST,被分解为 两项:第一项是各组的离均差平方和之和,代表组内变异 (即随机变量引起的变异),称为组内平方和SSW(Within Groups);第二项是按样本含量大小加权的各组均数与总均 数的差值平方之和,代表组间变异(由控制变量引起的变 异),称为组间平方和或者处理平方和SSB(Between Groups)。
总变异 = 随机变异 + 处理因素导致的变异 总变异 = 组内变异 + 组间变异
这样,我们可采用一定的方法来比较组内变异和组间变 异的大小,如果后者远远大于前者,则说明处理因素的影响 确实存在,如果两者相差无几,则说明影响不存在,这就是 方差分析的基本思想。
计算公式
SST=SSW+SSB
其中,k为水平数;ni为第i个水平 下的样本容量。可见,组间样本离 差平方和是各水平组均值和总体均 值离差的平方和,反映了控制变量 的影响。 组内离差平方和是每个数据与本水 平组平均值离差的平方和,反映了 数据抽样误差的大小程度。
F统计量是平均组间平方 和与平均组内平方和的 比(组间变异与误差变 异的比值)。
从F值计算公式可以看出,如果控制变量 的不同水平对观察变量有显著影响,那么观察 变量的组间离差平方和必然大,F值也就比较 大;相反,如果控制变量的不同水平没有对观 察变量造成显著影响,那么,组内离差平方和 影响就会比较大,F值就比较小。
SPSS中实现过程
分析——比较均值——单因素ANOVA
SPSS中实现过程
研究问题人 名 hxh yaju yu shizg hah s watet jess wish 2_new1 2_new2 2_new3 2_new4 2_new5 2_new6 2_new7 2_new8 2_new9 数 学 99.00 88.00 99.00 89.00 94.00
第4/7页
90.00 79.00 56.00 89.00 99.00 70.00 89.00 55.00 50.00 67.00 67.00 56.00 56.00 组 别 0 0 0 0 0 0 2 2 2 2 2 2 1 1 1 1 1 1
三组学生的数学成绩
实现步骤
在菜单中选择“One-Way ANOVA”命令
“One-Way ANOVA”对话框
“One-Way ANOVA:Contrasts”对话框
“One-Way ANOVA:Options”对话框
“One-Way ANOVA:Post Hoc Multiple Comparisons” 对话框
结果和讨论
(1)首先是单因素方差分析的前提检验 结果,也就是Homogeneity of variance test——方差齐次性检验
(2)输出的结果文件中第2个表格如下所示。
(3)输出的结果文件中第3个表格如下所示。
(4)输出的结果文件中第4个表格如下所示。
(5)输出结果的最后部分是各组观察变 量均值的折线图,如图5-6所示。
事后比较方法的选择 LSD法实际上是t检验的变形,只是在变异和自由度的计算上利用了整个样本
信息,而不仅仅是所比较两组的信息。因此它敏感度是最高,在比较时仍然 存在放大α水准(一类错误)问题,但换言之就是总的二类错误非常的小, 要是LSD都没有检验出差别,那恐怕真的没有差别。 SNK法运用的最广泛的,它采用Student Range分布进行所有各组均值间的 配对比较。该方法保证在H0真正成立时总的α水准等于实际设定值,即控制 了一类错误。 张文彤 P268
多因素方差分析 统计学上的定义和计算公式
多因素方差分析用来研究两个或两个以上控制 变量是否对观测变量产生显著影响。 多因素方差分析不仅能够分析多个因素对观测 变量的独立影响,更能够分析多个控制因素的 交互作用能否对观测变量的分布产生显著影响, 进而最终找到利于观测变量的最优组合。
多因素方差分析不仅需要分析多个控制变量独 立作用对观察变量的影响,还要分析多个控制变量 交互作用对观察变量的影响,及其他随机变量对结 果的影响。因此,它需要将观察变量总的离差平方 和分解为3个部分: ? 多个控制变量单独作用引起的平方和; 多个控制变量交互作用引起的离差平方和; 其他随机因素引起的离差平方和。
以上F统计量服从F分布。SPSS将自动计算 F值,并根据F分布表给出相应的相伴概率值。
SPSS中实现过程
分析——常规线性模型——单变量
SPSS中实现过程
表5-2
研究问题
三组不同性别学生的数学成绩
人 名 hxh yaju yu shizg hah s watet jess wish 2_new1 2_new2 2_new3 2_new4 2_new5 2_new6 2_new7 2_new8 2_new9 数 学 99.00 88.00 99.00 89.00 94.00 90.00 79.00 56.00 89.00 99.00 70.00 89.00 55.00 50.00 67.00 67.00 56.00 56.00 组 别 0 0 0 0 0 0 2 2 2 2 2 2 1 1 1 1 1 1 性 别 male female male male female male male female male male female male female male female male female male
实现步骤
图5
第5/7页
-7 在菜单中选择 “Univariate”命令
图5-8 “Univariate”对话框(一)
图5-9 “Univariate: Options”对话框(一)
图5-10 “Univariate: Post Hoc Multiple Comparisons for Observed Means”对话框
图5-11 “Univariate:Model”对话框
图5-12 “Univariate:Profile Plots”对话框
图5-13 “Univariate:Contrasts”对话框
结果和讨论
(1)SPSS输出结果文件中的第一部分如 下两表所示。
(2)输出的结果文件中第二部分如下表 所示。
(3)输出的结果文件中第三部分如下表 所示。
(4)输出的结果文件中第四部分如下表 所示。
(5)输出的结果文件中第五部分如下表所 示。
(6)输出的结果文件中第六部分如下表所 示。
(7) 输出结果的最后部分是控制变量之 间是否有交互影响的图形。
协方差分析 统计学上的定义和计算公式
定义:协方差分析是将那些很难控制的因素作为协变量, 在排除协变量影响的条件下,分析控制变量对观察变量的影 响,从而更加准确地对控制因素进行评价。 利用协方差分析就可以完成这样的功能。协方差将那些 很难控制的随机变量作为协变量,在分析中将其排除,然后 再分析控制变量对观察变量的影响,从而实现对控制变量效 果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间 互相独立,且与控制变量之间也没有交互影响。
前面单因素方差分析和多因素方差分析中的控 制变量都是一些定性变量。而协方差分析中则即包 含了定性变量(控制变量),又包含了定量变量 (协变量)。
以上F统计量服从F分布。SPSS将自动计算F值,并根据F 分布表给出相应的相伴概率值。 如果F控制变量的相伴概率小于或等于显著性水平,则控 制变量的不同水平对观察变量产生显著的影响;如果F协变量 的相伴概率小于或等于显著性水平,则协变量的不同水平对 观察变量产生显著的影响。
5.4.2 SPSS中实现过程
分析——常规线性模型——单变量
5.4.2 SPSS中实现过程
表5-3
人 名 hxh yaju yu shizg hah s watet jess wish 2_new1 2_new2 2_new3 2_new4 2_new5 2_new6 2_new7 2_new8 2_new9
研究问题
三组学生的数学成绩
数 学 99.00 88.00 99.00 89.00 94.00 90.00 79.00 56.00 89.00 99.00 70.00 89.00 55.00 50.00 67.00 67.00 56.00 56.00 入学成绩 98.00 89.00 80.00 78.00 78.00 89.00 87.00 76.00 56.00 76.00 89.00 89.00 99.00 89.00 88.00 98.00 78.00 89.00 组 别 0 0 0 0 0 0 2 2 2 2 2 2 1 1 1 1 1 1
实现步骤
图5-15 在菜单中选择“Univariate”命令
图5-16 “Univariate”对话框(二)
5.4.3 结果和讨论
小 结
方差分析用于两个及两个以上样本均值差异的显著性检验。方差分析 的基本思想是:通过分析研究中不同变量的变异对总变异的贡献
第6/7页
大小, 确定控制变量对研究变量影响力的大小。通过方差分析,分析不同水平 的控制变量是否对结果产生了显著影响。如果控制变量的不同水平能够 对结果产生显著影响,那么它和随机变量共同作用,必将使结果有显著 变化。 单因素方差分析所解决的是一个因素下的多个不同水平之间的相关 问题;多因素方差分析的控制变量在两个或两个以上,其主要用于分析 多个控制变量的作用、多个控制变量的交互作用以及其他随机变量是否 对结果产生了显著影响;协方差分析将那些很难控制的因素作为协变量, 在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更 准确地对控制因素进行评价。 单因素方差分析主要用“Analysis”的“Compare Means”菜单下的 “One—Way ANOVA”子菜单实现;多因素方差分析和协方差分析都是在 “Analysis”下“General Linear Model”菜单下的“Univariate”子菜单 实现的。
什么是T检验法和Q检验法
方差分析,用来观察某一变量在另一变量的不同水平上,是否有显著差异。
例如,学员的"心理适应情况"在"不同性别间"(或者不同汉语水平上)有没有显著差别。
具体的操作是这样的:
点击分析…比较均值…单因素ANOVA
选择因变量和因子
点击右侧对比,弹出对话框,选择多项式…线性。
继续,点击右侧两两比较,选择LSD,SNK,Tamhane's T2,然后点击继续。
再点击右侧选项,选择描述性,方差同质性检验,均值图。 点击继续。
回到对话框,点击确定。
出现以下结果:
因为选择数据的时候,因子为性别,只有男女两个水平,因此显示了"没有执行"在此之后"的检验"。不过,这仍然得到了结果,看单因素方差分析表,可以看到,显著性为0.580,说明组间差别不显著。
---------------------------------------------------
重新从"分析"开始,尝试把因子改为"汉语水平",重复以上步骤,可以得到以下结果。
看"方差齐性检验表",显著性<0.05,说明方差不齐,也就是不相等,这时候看Tamhane检验的结果。(当然,如果显著性>0.05,说明方差齐,这时候看LSD和SNK的结果)。
Tamhane是各个水平两两比较的结果,可以看到不同水平间的差异显著性。
Q检验法
Q检验法又叫做舍弃商法,是迪克森(W.J.Dixon)在1951年专为分析化学中少量观测次数(nQ表,则舍去可疑值,否则应予保留。
F检验法
F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差S2,以确定他们的精密度是否有显著性差异。至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行t 检验。
样本标准偏差的平方,即:
两组数据就能得到两个S?值,
由表中f大和f小(f为自由度n-1),查得F表,
然后计算的F值与查表得到的F表值比较,如果
F
F ≥ F表 表明两组数据存在显著差异。
T检验法
T检验法,亦称student t检验(Student's t test),主要用于样本含量较小(例如n
鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com
图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!