统计学实验
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

二、SPSS简介

SPSS是软件“Statistical Package for the Social Sciences”英文名称的缩写,即“社会科学统计软件包”。SPSS 公司于2000年正式将英文全称更改为“Statistical Product and Service Solutions”,意为“统计产品与服务解决方案”。

(一)SPSS的两个基本窗口

1. SPSS的数据编辑窗口

正常启动SPSS for windows后屏幕显示如图1-2-1所示。

图1-2-1 SPSS数据编辑窗口

SPSS数据编辑窗口的标题为SPSS Data Editor,它是SPSS的主程序窗口。数据编辑窗口是对分析对象——SPSS数据文件进行录入、修改、管理等基本操作的窗口。SPSS数据文件均以.sav作为文件扩展名存储在磁盘上。

数据编辑窗口包括几个部分:窗口主菜单、工具栏、数据编辑区、系统状态显示区。SPSS数据编辑窗口左下边包括Data View和Variable View两个视区,分别定义变量的值(即数据)和变量(名称、类型等),我们将在后面具体说明它们的内容。

(1)数据编辑窗口的窗口主菜单基本功能。

File:文件管理菜单,有关文件的调入、存储、显示和打印等。

Edit:编辑菜单,有关文本内容的选择、拷贝、剪贴、寻找和替换等。

View:SPSS用户界面基本状态设置等菜单。

Data:数据管理菜单,有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等。

Transform:数据转换处理菜单,有关数值的计算、重新赋值、缺失值替代等。

Analyze:统计分析菜单,有关一系列统计方法的应用。

Graphs:作图菜单,有关统计图的制作。

Utilities:用户选项菜单,有关命令解释、字体选择、文件信息、定义输出标题、窗口设计等。

Windows:窗口管理菜单,有关窗口的排列、选择、显示等。

Help:求助菜单,有关帮助文件的调用、查寻、显示等。

点击菜单选项即可激活菜单,这时弹出下拉式子菜单,用户可根据自己的需求再点击子菜单的选项,完成特定的功能。

(2)工具栏。以图形按钮组成的工具栏将常用的SPSS功能列示出来,用户可以直接点击工具栏上的某个按钮完成其相应的功能,使得操作更加快捷和方便。当鼠标停留在工具栏按钮上时,系统会自动提示相应按钮的功能。

(3)数据编辑区。在数据编辑区,用户按照电子表格的形式录入、修改、编辑和管理待分析的数据。

(4)系统状态显示区。数据编辑窗口的系统状态显示区用来显示系统的当前运行状态。当系统等待用户操作时,会出现“SPSS processor is ready”的提示信息。

数据编辑窗口的特点:①数据编辑窗口是在系统启动过程中自动打开的窗口,在SPSS运行过程中只能打开一个数据编辑窗口。②SPSS中的各种统计分析功能都是针对该窗口中的数据进行的。③关闭数据编辑窗口意味着退出并关闭SPSS软件系统。

2. SPSS的输出窗口

SPSS输出窗口的窗口名为SPSS Viewer,它是显示和管理SPSS统计分析结果报表及图形的窗口,如图1-2-2所示。

图1-2-2 SPSS的输出窗口

出现在该输出窗口中的内容均以“. spo”作为文件扩展名存储在磁盘上。

输出窗口包括几个部分:窗口主菜单、工具栏、分析结果显示区、状态显示区。

输出窗口的窗口主菜单中:一部分功能菜单,如Statistics、Graphs、Utilities、Windows、Help的功能与数据编辑窗口中的相同,是针对数据编辑窗口中的分析数据的;还有一部分功能菜单,如view、Insert、Format则是输出窗口的专用菜单;其余的功能菜单,如file、Edit则是数据编辑窗口和输出窗口共用的。这样设置菜单的目的是为了方便用户操作。

需要说明的是,虽然SPSS中有些窗口的主菜单名有重名的情况,但是它们的子菜单功能却是随不同的当前窗口而不同的,其服务的对象也是不同的。因此,在使用时,用户应注意哪个窗口是当前窗口。

输出窗口的工具栏除保留了数据编辑窗口中的某些图形按钮外,还增添了自己特有的功能按钮。

分析结果显示区是显示统计分析结果的地方。区域分成左右两个部分。左边以类似于Windows资源管理器的树形结构形式,显示已有的分析结果的索引;右边显示的是各个分析结果的详细内容。左右两边的内容以两个红色的右箭头为标记一一对应起来。用户可以对该区域中的内容进行增、删、改等编辑管理操作。

输出窗口的状态显示区与数据编辑窗口的状态区的区别是多了一个红色的“! ”标记。该标记表示当前的输出窗口为主输出窗口。主输出窗口就是下一次分析结果将输出到的那个窗口。

输出窗口的特点:①输出窗口是在用户进行第一次统计分析时被系统自动打开的。②在SPSS运行过程中用户还可以创建若干个新输出窗口。菜单选项为:File—new/open—output,用户可以将同一批分析数据的不同分析结果指定输出到不同的输出窗口中,这样就可以将不同输出窗口中的内容以不同的文件名分别存放到磁盘上。③不同的输出窗口之间可以相互自由切换,可以利用主菜单中的window功能菜单切换。主出窗口的状态栏上有一个红色的“! ”标记,而其他输出窗口的状态栏上则没有这个标记。如果用户希望将以下的统计分析结果输出到某个输出窗口中,需要按动工具栏上的“! ”图形按钮来指定某输出窗口为主输出窗口。

(二)SPSS数据文件的建立

SPSS数据编辑窗口中的每行为一个个案(Case),或称观察单位,每一列为一个变量,每个变量都有一个名称。可以通过点击数据编辑窗口下方的Variable View来定义、编辑变量。点击数据编辑窗口下方的Variable View,出现变量视图,如图1-2-3。

图1-2-3 变量视图

变量视图中各个栏目的意义及用法为:

1.变量名(Name)

SPSS中变量名的定名规则与其他软件大同小异,具体而言,有如下规定:

(1)变量名的第一个字符必须为字母,后面可跟任意字母、数字、句点或 #、@、$等符号。

(2)变量名不能以句点结尾。

(3)应避免最后一个字符为下划线“_”。

(4)变量名的长度一般不超过8个字符。

(5)空格和特殊字符不能用于变量名。

(6)关键词ALL、NE、EQ、TO、LE、BY、GE、AND、NOT、WITH等不能用作变量名。

若不定义变量名,系统将依次默认为“var00001”“var00002”等。

2.变量类型(Type)

单击Type后的按钮,将弹出“Variable Type”对话框,如图1-2-4所示。该对话框列出了8种可选的基本变量类型。只要单击要定义的变量类型的标签或标签前面的单选项,就可以定义或修改变量的类型。

图1-2-4 选择变量类型

现对8种变量类型分述如下:

(1)Numeric:数值型。同时定义数值的宽度(Width),即整数部分 +小数点 +小数部分的位数,默认为8位;定义小数位数(Decimal Places),默认为2位。数值型也是SPSS中默认的变量类型,也就是说,在第一次定义某个变量时,SPSS会自动将该变量设置为数值型变量,而不需要打开变量类型对话框专门进行设置。

(2)Comma:加显逗号的数值型。即整数部分每3位数加一个逗号,其余定义方式同数值型。

(3)Dot:3位加点数值型。无论数值大小,均以整数形式显示,每3位加一小点(但不是小数点),可定义小数位置,但都显示为0,且小数点用逗号表示。如1.2345显示为“12.345,00”(实际是12345E-4).

(4)Scientific notation:科学记数型。同时定义数值宽度(Width)和小数位数(Decimal Places),在数据管理窗口中以指数形式显示。如 定义数值宽度为9,小数位数为2,则345.678显示为3.46E +02。

(5)Date:日期型。用户可从系统提供的日期显示形式中选择自己需要的。如选择mm/dd/yy形式,则1995年6月25日显示为06/25/95。图1-2-5是日期型变量定义对话框,框中列出了各种日期或时间格式,用户只需要用鼠标进行选择就行了。

(6)Dollar:货币型。用户可从系统提供的日期显示形式中选择自己需要的,并定义数值宽度和小数位数,显示形式为数值前有$。图1-2-6是货币型变量定义对话框,框中列出了多种固有的格式,用户只要用鼠标进行选择就行了。

如果列表框中没有满意的数据格式,可以自己设置。设置的方法与数值型变量大致相同,即在“Width”(宽度)窗口和“Decimal”(小数位)窗口中输入数字。但“Width”窗口中的数字必须比“Decimal”窗口中的数字大2,否则会出错。

图1-2-5 日期型变量定义对话框

图1-2-6 货币型变量定义对话框

(7)Custom currency:自定义型。它是数值型数据表示方式的一种。用户可以自定义不超过5种(即CCA、CCB、CCC、CCD、CCE)的表示方式。

(8)String:字符型。用户可定义字符长度(Characters)以便输入字符。

3.变量宽度(Width)

它是指变量的最大显示宽度。一般默认的最大显示宽度为8位。

4.保留小数位(Decimal)

它是指变量保留的小数位数。只有数值型、货币型和自定义型可以定义小数位数,一般默认为2位。

5.变量标签(Label)

数据处理过程中,变量名越简单越好,特别是在变量较多的情况下。此时,对每一个变量含义的解释就显得非常重要,需要给它们“贴上标签”,以便识别。系统默认与变量名相同的变量标签。若要给变量重新标记,只需在相应单元格内修改即可。在数据窗口,若变量标签与变量名不同的话,当光标移至某变量名处,会同时显示变量标签。此外,输出结果中,原变量名由变量标签取代表示。

6.变量值标签(Values)

当光标移至某个变量的变量值标签单元格时,该单元格右方会显示一灰色按钮,单击该按钮,弹出Value Labels(变量值标签)对话框(见图1-2-7)。对话框中,Value对应的上面的条框填入变量水平的赋值,Value对应的下面的条框填入变量值标签。两个条框填入内容后,单击Add键后,下面大框内显示变量值及其标签。如定义“1 = 男,2 = 女”。若需修改或取消变量值标签,在下面大框内选定修改对象后,直接单击Remove键取消。

图1-2-7 Value Labels对话框

7.缺失值(Missing)

当光标移至某个变量的缺失值单元格时,该单元格右方会显示一灰色按钮,单击该按钮,弹出Missing Values(缺失值)对话框(图1-2-8)。

图1-2-8 Missing Values对话框

(1)No missing values:缺失值用系统缺失值圆点“.”表示。

(2)Discrete missing values:此项选择最多可定义3个不同数值为缺失数据。例如,在框内填入0,则变量中凡是0的数据均被视为缺失数据。

(3)Range plus one discrete missing value:设定缺失数据的范围。

图1-2-9 填写Missing Values对话框

如图1-2-9框中的取值,表示变量中凡是1~5的数据及数值8均被视为缺失数据。

8.数据列宽(Columns)

表示显示数据的列宽,系统默认8个字符宽。

9.对齐方式(Align)

有左、中、右三种数据对齐方式。

10.度量类型(Measure)

按度量精度将变量分为定量变量(Scale)、等级变量(Ordinal)和定性变量(Nominal),该选项只用于统计制图时坐标轴变量的区分以及SPSS决策树模块的变量定义。

完成变量定义后,单击数据编辑窗口下方的Data View,即可以像在Excel中一样输入数据。

例1-1 某班50名学生统计学考试成绩如表1-2-1所示,试在SPSS中建立考试成绩数据文件。

表1-2-1 某班50名学生统计学考试成绩

解:建立考试成绩数据文件的步骤为:

第一步,激活数据管理窗口。

第二步,点击数据编辑窗口下方的Variable View,出现图1-2-10所示页面。

图1-2-10 SPSS Data Editor

第三步,在第一行中定义第一个变量。在Name下方输入考试成绩,单击Type,出现图1-2-11所示页面。

图1-2-11 定义变量

第四步,将宽度(Width)8改为3,小数(Decimals)位数2改为0,如图1-2-12所示。

图1-2-12 改变变量的类型

第五步,单击数据编辑窗口下方的Data View,录入数据,建立考试成绩数据文件如图1-2-13所示。

图1-2-13 考试成绩数据文件

第六步,保存该数据文件为“考试成绩.sav”。