spss中如何处理极端值、错误值
spss中录入数据以后,第一步不是去分析数据,而是要检验数据是不是有录入错误的,是不是有不合常理的数据,今天我们要做一个描述性统计,进而查看哪些数据是不合理的。下面是具体的步骤:
操作方法
- 01
先准备好数据,然后打开描述性统计对话框,如图所示,执行菜单:analyse--descriptive statistic--descriptive
- 02
将你要检验的变量放入variables对话框,点击箭头可以添加或者删除变量
- 03
勾选如图所示的选项,他的意思是输出Z分数,并作为一个变量列出来。因为检查数据有效性的时候会用到Z分数
- 04
点击options按钮,设置需要输出的描述性统计量,我们需要的统计量主要是最大值和最小值,所以,你看到下面第二幅图,勾选最大值和最小值
- 05
点击continue按钮,点击ok,开始处理数据,并输出处理结果
- 06
我们看到有一个表格,输出了最大值和最小值,根据这个值我们可以判断,这个变量中的数据是不是超出了合理的范围,比如,这个变量的意思是身高,你的数据的最大值为5米,这时侯你就可以想到,有数据录入错误了。
- 07
接下来切换到数据视图中,我们看到生成了一个新的变量,他是x8这个变量的Z分数,我们知道,如果数据是正太分布的,那么数据应当分布在正负三个标准差之内,因此,从图中我们看到,Z分数大于3或小于-3的数据就是错误的数据
赞 (0)