丁香实验_LOGO
登录
提问
我要登录
|免费注册
点赞
收藏
wx-share
分享

SPSS 数据分析,掌握这 6 大模块就够了

丁香园

7647

SPSS 全称为「社会科学统计软件包」,是 IBM 公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称。

图中我们看到 SPSS 有 23 个方法模块,虽然我们不能每个模块都能用到,但作为一个科研工作者,其中的某些功能是必须要掌握的。

图一:SPSS 的 23 个模块

下面列出几个典型的例子供大家在做数据中作为参考:

图二:医学中 SPSS 用到的模块

一、描述性研究

图三:SPSS描述性研究

描述性分析主要是对数据进行基础性描述,主要用于描述变量的基本特征。描述性分析对于数据分析来说是一项基础性的工作,目的要于熟悉数据源,把握数据的整体性分布情况。

SPSS 中的描述性分析过程可以生成相关的描述性统计量,如均值、方差、标准差、全距、峰度和偏度等,同时描述性分析过程还能将原始数据转换为标准Z分值并作为变量储存。

基本输出的统计量主要有以下几个方面:

(一) 表示集中趋势的统计量:均值,中位数,众数,百分位数;

(二)表示离中趋势的统计量:方差与标准差,均值标准误差,极差或范围,最大值,最小值,变异系数;

(三)表示分布形态的统计量:偏度,峰度;

(四)其他相关统计量:Z 标准化得分(注:Z 标准化得分是某一数据与平均数的距离以标准差为单位的测量值,在统计分析中起着十分重要的作用)。

具体实际操作如下:

1.打开数据源,如下图所示:

2.在菜单栏中依次选择「分析-描述统计-描述」命令,得到结果如下图:

3.点击对话框中的「选项」:

4.因为现在是属于熟悉 SPSS 的阶段,可尝试全部勾选:

5.返回到描述性对话框,勾选左下方的「将标准化得分另存为变量」,最后按「确定」,得到结果如下图:

6.返回数据源表,可看到已生成 Z 标准化得分:

其中,标准化得分大于零,说明原数据比平均分高;若标准化得分小于零,说明原数据比平均分小。如第一个数值为 -3.08124,则说明,该学生该科得分比整个平均分要低大约 3 个标准差。

二、T 检验

图四:SPSS 中 T 检验

(1)单样本 T 检验

单样本 T 检验的目的是利用来自总体的样本数据,推断该总体的均值是否与制定的检验值之间存在显著性差异。它是对总体均值的假设检验。

SPSS软件操作流程:

1.Analyze > Compare Means > One-Sample T Test

2.在打开的 one-sample T Testp 窗口中,检验变量(Test Variable)选择血红蛋白 x, 检验值(Test Value)中输入 14.02, 点击 OK。输出结果。

(2)独立样本 T 检验

独立样本 T 检验是用于两个独立样本均值的比较。两个样本必须独立且服从正态分布。

按照Analyze>Compare Means>Independent-Sample T Test操作打开Independent-Samples T Test窗口。

2.检验变量中选择 PreWeight, 检验值为 group(0 1)。点击 OK,输出结果。

注意:Levene's test 用于确定方差齐性,注意根据该结果判断哪一行数据为最终结论。如果分组在 3 组或 3 组以上的均值比较可以应用单因素 ANOVA。

三、方差分析

图五:SPSS 的方差分析

1.首先打开 SPSS,其次点击「变量视图」:

2.给变量命名:

3.点击数据视图,再点击「肝」一列变量,导入数据,点击「组别」这组变量,输入对应的浓度(不同浓度代表不同组别):

4.点击「变量视图」,点击组别这一组的「值」,给各组命名,然后点击方形图标:

5.在弹出的对话框中,点击「值」,输入刚才组别变量中写的那些浓度值一个,其次点击「标签」给其命名:

6.等到所有添加后,依照样板数据,输入不同组的名字和浓度:

7.点击「分析」,再点击「比较均值」,在下拉菜单中点击「单因素 ANOVA」

8.在新的对话框中,依据样板数据,添加「因变量列表」,添加「因子」,然后选择分析方式:

9.勾选上需要的比较方法,点击继续:

10.最后,分析结果就出来了:

四、线性回归

图六:SPSS 线性回归

在回归分析中,只有一个自变量的回归分析,称为一元回归;多于一个自变量的回归分析,称为多元回归。在做线性回归分析之前需要先做散点图,如果散点图不呈现线性关系,则不能做线性回归。

(1)问题与数据

某地方病研究所调查了 8 名正常儿童的尿肌酐含量(mmol/24h),请估计尿肌酐含量(Y)对其年龄(X)的直线回归方程。

(2)SPSS操作

1.数据录入 SPSS:

2.做散点图,判断是否为线性关系:

3.将自变量年龄(X)放入 X 轴;将因变量尿肌酐含量(Y)放入 Y 轴;其它默认选项后,点击确定:

4.从图上判断变量之间大致呈线性关系,可以继续做回归:

5.将年龄放入自变量,尿肌酐含量放入因变量,点击确定:

6.结果分析:

(3)结果解读

① R 方(0.778)是回归方程的决定系数,表示Y变异的 77.8% 可以由X的变异来解释。

②对回归方程进行方差分析:F=20.968,P=0.004。可以认为年龄和尿肌酐含量有直线关系。

③对回归系数进行 T 检验:Constant(回归方程的截距)与0之间的差别有统计学意义(t=5.595,P=0.001),斜率与0之间的差别有统计学意义(t=4.579,P=0.004)。

因此,建立回归方程为=1.662+0.139X,X 为儿童年龄,Y 为尿肌酐含量。题图来源:丁香通

提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
扫码领资料
反馈
TOP
打开小程序