spss数据分析教程

电脑 2023-03-19 12:48:25 0

淘宝搜：【天降红包222】领超级红包，京东搜：【天降红包222】
淘宝互助，淘宝双11微信互助群关注公众号【淘姐妹】

图2.1 变量视窗三、试验内容与步骤

1．创建一个数据文件数据文件的创建分成三个步骤：

（1）

选择菜单【文件】→【新建】→【数据】新建一个数据文件，进入数

据编辑窗口。窗口顶部标题为“PASW Statistics 数据编辑器”。

（2）（3）

单击左下角【变量视窗】标签进入变量视图界面，根据试验的设计定变量定义完成以后，单击【数据视窗】标签进入数据视窗界面，将每

义每个变量类型。

个具体的变量值录入数据库单元格内。 2．读取外部数据

当前版本的SPSS 可以很容易地读取Excel 数据，步骤如下：（1）

按【文件】→【打开】→【数据】的顺序使用菜单命令调出

打开数据对话框，在文件类型下拉列表中选择数据文件,如图2.2 所示。

图

2.2 Open File 对话框

（2）选择要打开的Excel 文件，单击“打开”按钮，调出打开Excel 数据源

对话框，如图2.3 所示。对话框中各选项的意义如下：工作表下拉列表：选择被读取数据所在的Excel 工作表。

范围输入框：用于限制被读取数据在Excel 工作表中的位置。

图2.3 Open Excel Data Source 对话框

3．数据编辑

在SPSS 中，对数据进行基本编辑操作的功能集中在Edit 和Data 菜单中。 4．SPSS 数据的保存

SPSS 数据录入并编辑整理完成以后应及时保存，以防数据丢失。保存数据文件可以通过【文件】→【保存】或者【文件】→【另存为】菜单方式来执行。在数据保存对话框（如图2.5 所示）中根据不同要求进行SPSS 数据保存。

图

2.5 SPSS 数据的保存

5. 数据整理

在SPSS 中，数据整理的功能主要集中在【数据】和【转换】两个主菜单下。（1）数据排序（Sort Case）

对数据按照某一个或多个变量的大小排序将有利于对数据的总体浏览，基本操作说明如下：

?选择菜单【数据】→【排列个案】，打开对话框，如图2.7 所示。（2）抽样（Select Case）

在统计分析中，有时不需要对所有的观测进行分析，而可能只对某些特定的对象有兴趣。利用SPSS 的Select Case 命令可以实现这种样本筛选的功能。以SPSS 安装配套数据文件【【淘密令】】.sav 为例，选择年龄大于10 的观测，基本操作说明

图2.7 排列个案对话框如下：

?打开数据文件【【淘密令】】.sav，选择【数据】→【选择个案】命令，打开对话框，如

图2.8

图

2.8 选择个案对话框

?指定抽样的方式：【全部个案】不进行筛选；【如果条件满足】按指定条件进行筛选。

本例设置：产品数量>150，如图2.9 所示；

图2.9 选择个案对话框设置完成以后，点击continue，进入下一步。

?确定未被选择的观测的处理方法，这里选择默认选项【过滤掉未选定的个案】。 ?单击ok 进行筛选，结果如图2.10

图2.10 选择个案的结果

（3）增加个案的数据合并（【合并文件】→【添加个案】）

将新数据文件中的观测合并到原数据文件中，在SPSS 中实现数据文件纵向合并的方法如下：

选择菜单【数据】→【合并文件】→【添加个案】，如图2.11，选择需要追加的数据文件，单击打开按钮，弹出【【淘密令】】对话框，如图2.12。

spss19安装教程详解

SPSS应用软件试验指导手册

2．两个总体均值之差的区间估计

例题：The Wall Street Journal（1994,7 ）声称在制造业中，参加工会的妇女比未参加工会的妇女的报酬要多2.5 美元。想通过统计方法，对这个观点是否正确给出检验。

假设抽取了7位女性工会会员与8位非工会会员女性报酬数据。要求对制造业中参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差进行区间估计，预设的置信度为95％。

? 打开SPSS，按如下图示格式输入原始数据，建立数据文件：“工会会员工资差别.spss”。这里，“会员”表示是否为工会会员的变量，y 表示是工会会员，n表示非工会会员，“报酬”表示女性员工报酬变量，单位：千美元。

? 计算两总体均值之差的区间估计，采用“独立样本T 检验”方法。选择菜单“ 【分析】→【比较均值】→独立样本T检验”，打开对话框。

? 变量选择

（1）从源变量清单中将“报酬”变量移入检验变量框中。表示要求该变量的均值的区间估计。

（2）从源变量清单中将“group”变量移入分组变量框中。表示总体的分类变量。

图3.3 独立样本T检验对话框

? 定义分组单击定义组按钮，打开【【淘密令】】对话框。在Group1 中输入1，在Group2 中输入2（1表示非工会会员,2 表示工会会员）。完成后单击“继续”

SPSS应用软件试验指导手册

按钮回到主窗口。

图3.4 define groups设置窗口

? 计算结果单击上图中“OK”按钮，输出结果如下图所示。（1）Group Statistics（分组统计量）表

分别给出不同总体下的样本容量、均值、标准差和平均标准误。从该表中可以看出，参加工会的妇女平均报酬为19.925，不参加工会的妇女平均报酬为20.1429。

表3.2 分组统计量

Group Statistics

报酬

会员 1.00 2.00 N 8 7 Mean 19.9250 20.1429 Std. 【【微信】】 .46522 .52236 Std. Error Mean .16448 .19743 （2）Independent Sample Test （独立样本T 检验）表

Levene’【【微信】】nce，为方差检验，在E【【微信】】（原假设：方差相等）下，F=0.623，因为其P-值大于显著性水平，即：Sig.=0.444>0.05，说明不能拒绝方差相等的原假设，接受两个总体方差是相等的假设。因此参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差95％的区间估计为[0.76842,0.33271]。

T-test for E【【微信】】为检验总体均值是否相等的t 检验，由于在本例中，其P-值大于显著性水平，即：Sig.=0.408>0.05，因此不应该拒绝原假设，也就是说参加工会的妇女跟未参加工会的妇女的报酬没有显著差异。本次抽样推断结论不支持The Wall Street Journal（1994,7 ）提出的“参加工会的妇女比未参加工会的妇女的报酬要多2.5 美元”观点，即参加工会的妇女不比未参加工会的妇女的报酬多。

SPSS应用软件试验指导手册

表3.3 独立样本T检验结果 Independent Samples Test

Levene'【【微信】】nces F

报酬

-.855 13 -.848 12.187

Sig.

t-test for E【【微信】】

Std. Error Differenc

.25485 .25697

95% 【【微信】】 the Difference Lower -.76842 -.77679

Upper .33271 .34108

Sig. Mean (2-tailed) Difference

.408 .413

-.21786 -.21786

E【【微信】】 .623 .444 assumed E【【微信】】 not assumed

3．单个总体均值的假设检验（单样本T检验）

例子：某种品牌的沐浴肥皂制造程序的设计规格中要求每批平均生产120 块肥皂，高于或低于该数量均被认为是不合理的，在由10 批产品所组成的一个样本中，每批肥皂的产量数据见下表，在0.05 的显著水平下，检验该样本结果能否说明制造过程运行良好？

? 判断检验类型该例属于“大样本、总体标准差σ未知。假设形式为：

H0：μ＝μ

0，

H1 :μ≠μ0

? 软件实现程序打开已知数据文件，然后选择菜单“【分析】→【比较均值】→单样本T检验”，打开One-【【淘密令】】对话框。从源变量清单中将“产品数量”向右移入“Test 【【微信】】”框中。

图3.5 one-sample T test窗口

SPSS应用软件试验指导手册

在“Test Value” 框里输入一个指定值（即假设检验值，本例中假设为120），T 检验过程将对每个检验变量分别检验它们的平均值与这个指定数值相等的假设。

? “One-【【淘密令】】”窗口中“OK”按钮，输出结果如下表所示。

（1）“One-Sample Statistics”（单个样本的统计量）表分别给出样本的容量、均值、标准差和平均标准误。本例中，产品数量均值为118.9000。

表3.4 单样本统计量

One-Sample Statistics

产品数量 N 10 Mean 118.9000 Std. 【【微信】】 4.93176 Std. Error Mean 1.55956 （2）“One-Sample Test”（单个样本的检验）表表中的t 表示所计算的T 检验统计量的数值，本例中为－0.705。表中的“df”，表示自由度，本例中为9。表中的“Sig”（双尾T 检验），表示统计量的P-值，并与双尾T检验的显著性的大小进行比较：Sig.=0.498>0.05，说明这批样本的平均产量与120 无显著差异。表中的“Mean Difference”，表示均值差，即样本均值与检验值120 之差，本例中为－1.1000。表中的“95％ Confidence Internal of the Difference”，样本均值与检验值偏差的95%置信区间为（－4.628，2.428），置信区间包括数值0，说明样本数量与120 无显著差异，符合要求。

表3.5 单样本T检验结果 One-Sample Test

Test Value=120 95% 【【微信】】 the Difference 产品数量

t -.705 df 9 Sig. (2-tailed) .498 Mean Difference -1.10000 Lower -4.6280 Upper 2.4280 4．两独立样本的假设检验（两独立样本T检验）

? 打开SPSS，按如下图示格式输入原始数据，建立数据文件：“工会会员工资

SPSS应用软件试验指导手册

差别.sav”。这里，“会员”表示是否为工会会员的变量，y 表示是工会会员，n表示非工会会员，“报酬”表示女性员工报酬变量，单位：千美元。

? 计算两总体均值之差的区间估计，采用“独立样本T 检验”方法。选择菜单“ 【分析】→【比较均值】→【独立样本T检验】”。

（1）从源变量清单中将“报酬”变量移入检验变量框中。表示要求该变量的均值的检验。

（2）从源变量清单中将“会员”变量移入分组变量框中。表示总体的分类变量。

图3.6 sample T test 窗口

? 定义分组单击Grouping 【【微信】】框下面的【【淘密令】】按钮，打开【【淘密令】】对话框。在Group1 中输入1，在Group2 中输入2（1表示非工会会员,2 表示工会会员）。完成后单击“继续”按钮返回主窗口。

图3.7 define groups对话框