题目:
下表所示数据共有4个观测指标, ,
,
,
分别是花萼长、花萼宽、花瓣长和花瓣宽,样本容量为30,共分为3类,分别是刚毛鸢尾花、变色鸢尾花和弗吉尼亚鸢尾花,每类分别抽取了10个样品。
另有3个待判样品,其指标值分别为(51,35,14,3),(58,28,51,24),(58,26,40,12)。
(1)使用SPSS软件,建立Fisher判别函数,提出相应的判别准则,对3个待判样品进行判别归类。用预测分类结果表和交叉验证表检查该判别函数的错判率。
(2)使用SPSS软件,建立贝叶斯判别函数,提出相应的判别准则,并对3个待判样品进行判别归类。
编号(no) |
花萼长( |
花萼宽( |
花瓣长( |
花瓣宽( |
原始类(group) |
1 |
50 |
33 |
14 |
2 |
1 |
2 |
46 |
36 |
10 |
2 |
1 |
3 |
48 |
31 |
16 |
2 |
1 |
4 |
49 |
36 |
14 |
1 |
1 |
5 |
44 |
32 |
13 |
2 |
1 |
6 |
51 |
38 |
16 |
2 |
1 |
7 |
50 |
30 |
16 |
2 |
1 |
8 |
51 |
38 |
19 |
4 |
1 |
9 |
49 |
30 |
14 |
2 |
1 |
10 |
50 |
36 |
14 |
2 |
1 |
11 |
57 |
28 |
45 |
13 |
2 |
12 |
63 |
33 |
47 |
16 |
2 |
13 |
70 |
32 |
47 |
14 |
2 |
14 |
58 |
26 |
40 |
12 |
2 |
15 |
50 |
23 |
33 |
10 |
2 |
16 |
58 |
27 |
41 |
10 |
2 |
17 |
60 |
29 |
45 |
15 |
2 |
18 |
62 |
22 |
45 |
15 |
2 |
19 |
61 |
30 |
46 |
14 |
2 |
20 |
56 |
25 |
39 |
11 |
2 |
21 |
67 |
31 |
56 |
24 |
3 |
22 |
89 |
31 |
51 |
23 |
3 |
23 |
65 |
30 |
52 |
20 |
3 |
24 |
58 |
27 |
51 |
19 |
3 |
25 |
49 |
25 |
45 |
17 |
3 |
26 |
63 |
25 |
50 |
19 |
3 |
27 |
63 |
27 |
49 |
18 |
3 |
28 |
64 |
28 |
56 |
21 |
3 |
29 |
58 |
37 |
51 |
19 |
3 |
30 |
64 |
28 |
56 |
22 |
3 |
打开spss软件:
1、首先在变量视图一栏的名称上写上这些标题
写上之后,后面的类型什么的都自动出来了。这时候打开数据视图就可以看见下表这样:
2、由于我们的表格里面的数都是整数,所以需要把“小数”那一栏的2改为0。然后再把表格里的数据一列一列复制进来,
到这一步,我们就把表里的数据导入到spss里面了。接下来就是开始分析
3、点击分析——回归——多项logistic回归。因变量为类别,其他为协变量
4、接着点击statistics(统计)
5、点击保存然后确定
这时候可能结果出现的是100%,
6、我们改进一下,以80%为训练组,20%为测试组
这是修改之前的,接下来把编号9,10,19,20,29,30去掉,当作测试组。下面是修改之后的
7、执行和前面一样的步骤,分析——回归——多项回归
可能因为数据集太小了,咱们的正确率还是百分之百,哈哈哈,就不纠结这个了。。
先到这吧,最近也没有时间弄这个