如何使用SPSS进行二阶聚类
在使用SPSS进行数据分析时经常需要对数据进行聚类。而二阶聚类法可以基于类别变量和连续变量进行聚类,可以自动确定最终的分类个数,可以处理大型数据集。下面介绍其操作方法。
操作方法
- 01
打开SPSS软件,在自带的sample文件夹中打开案例文件car-sales.sav。 案例文件中采用种类、价格等10个变量对记录进行聚类。
- 02
在软件界面中依次点击分析、分类、二阶聚类,打开二阶聚类分析界面。
- 03
将类别型变量“种类”点选进分类变量框中,将“价格”、“引擎型号”等9个连续型变量点选入连续变量框内; 在下方的距离测量中勾选“对数似然(L)”,作为聚类变量相似度的测量形式;在聚类准则中勾选“施瓦兹贝叶斯准则(BIC)”,作为聚类个数的判断依据。
- 04
点击右上角的“选项”按钮,在弹出的二阶聚类选项对话框中将上一步9个连续型变量点选入右侧的待标准化计数(T)选框中。,目的是对9个变量自动进行标准化处理,统一测量尺度。
- 05
点击“继续”返回上一界面,点击“输出”按钮,在弹出的二阶聚类输出对话框中勾选“透视表”,这样最后的结果会出现在结果查看器中;勾选“图表和表”,这样输出的结果会出现在模型查看器中;勾选“创建聚类成员变量”,可以得到聚类的最终结果。
- 06
点击“确定”稍等片刻之后可以看到结果。呈现形式为BIC自动聚类表和聚类分布表,可以看到最终聚类个数。
- 07
点击左侧的“模型摘要图”可以打开模型浏览器,可以看到聚类质量、聚类大小等图表形式结果。
赞 (0)