数理统计-作业四

时间:2022-06-16 18:00:20 浏览量:

 1.用主成分分析方法探讨城市工业主体结构。表 1 是某市工业部门 13 个行业 8项指标的数据。

 表 表 1

 某市工业部门 3 13 个行业 8 8 项指标的数据

  年末固定资产净值 (万元)

 职工人数 (人)

 工业总产值 (万元)

 全员劳动产率 (元/人年)

 百元固定原资产值实现产值 (元)

 资金利税率 (%)

 标准燃料消费量 (吨)

 能源利用效果 (万元/吨)

 1(冶金) 9

 1091 19272 82.000 16.100 197435 0.172 2(电力) 49

  0313 34.200 7.100 592077 0.003 3(煤炭) 6735 21

  36.100 8.200 726396 0.003 4(化学) 49454 36241 8

 .100 25.900 348226 0.985 5(机械)

 5 2

 3.200 12.600 139572 0.628 6(建材) 122

 1 6382 62.500 8.700 145818 0.066 7(森工) 2372 6572 8103 12329 184.400 22.200 20921 0.152 8(食品) 11

 35 23804 370.400 41.000 65486 0.263 9(纺织) 17111 239

 6 221.500 21.500 63806 0.276 10(缝纫) 12

  5586 330.400 29.500 1840 0.437 11(皮革) 2

  10870 184.200 12.000 8913 0.274 12(造纸) 5251 6

 75 146.400 27.500 78796 0.151 13(文教艺术用品) 14341

  4691 94.600 17.800 6354 1.574

 1)试用主成分分析方法确定 8 项指标的样本主成分(综合变量);若要求损失信息不超过 15%,应取几个主成分;并对这几个主成分进行解释; 2)利用主成分得分对 13 个行业进行排序和分类。

 解:先将给出的的数据导入到 Spass 软件

 对导入的数据进行因子分析得到

 KMO 與 Bartlett 檢定 Kaiser-Meyer-Olkin 測量取樣適當性。

 .463 Bartlett 的球形檢定 大約 卡方 96.957 df 28 顯著性 .000 首先进行 KMO 检验和巴特利球体检验,KMO 检验系数=0.96957>0.5 P 值<0.05,所以能进行因子分析。

  說明的變異數總計 元件 起始特徵值 擷取平方和載入 循環平方和載入 總計 變異的 % 累加 % 總計 變異的 % 累加 % 總計 變異的 % 累加 % 1 3.105 38.811 38.811 3.105 38.811 38.811 3.032 37.903 37.903 2 2.897 36.218 75.029 2.897 36.218 75.029 2.970 37.127 75.029 3 0.930 11.628 86.657 0.930 11.628 86.657 0.930 11.628 86.657 4 0.642 8.027 94.684

  5 0.304 3.801 98.485

  6 0.087 1.082 99.567

  7 0.032 0.402 99.969

  8 0.002 0.031 100.000

  擷取方法:主體元件分析。

 循环平方和载入,累加达到85%,所以取三个指标,即累加达到86.657%

  旋轉元件矩陣 a a

  元件 1 2 3 年末固定资产净值 .975 -.084 .108 职工人数 .965 -.093 .044 工业总产值 .989 .090 .093 全员劳动产率 .121 .822 .204 百元固定原资产值实现产值 -.169 .906 -.181 资金利税率 -.088 .931 .021 标准燃料消费量 -.020 -.700 -.289 能源利用效果 .141 .139 .961 擷取方法:主體元件分析。

  轉軸方法:具有 Kaiser 正規化的最大變異法。

 a. 在 4 疊代中收斂循環。

 由旋转矩阵分析可知,八个指标分为三类 第一类:年末固定资产净值,职工人数,工业总产值 第二类:全员劳动产率,百元固定原资产值实现产值,资金利税率,标准燃料消费量 第三类:能源利用效果

 (2)对原始数据进行归一化处理,计算相应的得分,结果如下:

  最后的结果如上表最后一列所示,根据数值的正负号分成两类,利用主成分得分对13个行业进行排序和分类如下:

 第一类:1(冶金) 4(化学) 5(机械) 8(食品) 13(文教) 第二类:9(纺织) 6(建材)7(森工)10(缝纫)11(皮革)12(造纸)2(电力) 3(煤炭)

 2. 下表是某年美国 50 州每 10 万人中各种类型犯罪的犯罪率数据,分析找出主要的犯罪类型 、列出主成分与原始变量的线性关系式,分析解释主成分及其特征,排序说明每州主要的犯罪类型。

 州名 杀人罪 强奸罪 抢劫罪 斗殴罪 偷盗罪 汽车犯罪 ALABAMA 14.2 25.2 96.8 278.3 3017.4 280.7 ALASKA 10.8 51.6 96.8 284 4701.5 753.3 ARIZONA 9.5 34.2 138.2 312.3 6813.5 439.5 ARKANSAS 8.8 27.6 83.2 203.4 2834.7 183.4 CALIFORNIA 11.5 49.4 287 358 5639.2 663.5 COLORADO 6.3 42 170.7 292.9 5838.4 477.1 CONNECTICUT 4.2 16.8 129.5 131.8 3966.7 593.2 DELAWARE 6 24.9 157 194.2 5361 467 FLORIDA 10.2 39.6 187.9 449.1 5700.4 351.4 GEORGIA 11.7 31.1 140.5 256.5 3521.3 297.9 HAWAII 7.2 25.5 128 64.1 5831.9 489.4 IDAHO 5.5 19.4 39.6 172.5 3650.4 237.6 ILLINOIS 9.9 21.8 211.3 209 3913.5 528.6 INDIANA 7.4 26.5 123.2 153.5 3584.9 377.4 IOWA 2.3 10.6 41.2 89.8 3497.6 219.9 KANSAS 6.6 22 100.7 180.5 4009.7 244.3 KENTUCKY 10.1 19.1 81.1 123.3 2534.3 245.4 LOUISIANA 15.5 30.9 142.9 335.5 3635.4 337.7 MAINE 2.4 13.5 38.7 170 3603.8 246.9 MARYLAND 8 34.8 292.1 358.9 4577.7 428.5 MASSACHUSETTS 3.1 20.8 169.1 231.6 3843.5 1140.1 MICHIGAN 9.3 38.9 261.9 274.6 4681.7 545.5 MINNESOTA 2.7 19.5 85.9 85.8 3694 343.1 MISSISSIPPI 14.3 19.6 65.7 189.1 2155.5 144.4 MISSOURI 9.6 28.3 189 233.5 3742.5 378.4 MONTANA 5.4 16.7 39.2 156.8 3578.1 309.2 NEBRASKA 3.9 18.1 64.7 112.7 3076.1 249.1 NEVADA 15.8 49.1 323.1 355 6665.7 559.2 NEW HAMPSHIRE 3.2 10.7 23.2 76 3385.6 293.4 NEW JERSEY 5.6 21 180.4 185.1 4210.3 511.5 NEW MEXICO 8.8 39.1 109.6 343.4 4427.3 259.5 NEW YORK 10.7 29.4 472.6 319.1 4510 745.8 NORTH AROLINA 10.6 17 61.3 318.3 3191.9 192.1 NORTH DAKOTA 0.9 9 13.3 43.8 2289.1 144.7 OHIO 7.8 27.3 190.5 181.1 3912.8 400.4 OKLAHOMA 8.6 29.2 73.8 205 3516.3 326.8 OREGON 4.9 39.9 124.1 286.9 5142.5 388.9 PENNSYLVANIA 5.6 19 130.3 128 2501.6 333.2 RHODE ISLAND 3.6 10.5 86.5 201 4333.6 791.4 SOUTH CAROLINA 11.9 33 105.9 485.3 3956 245.1 SOUTH DAKOTA 2 13.5 17.9 155.7 2274.9 147.5 TENNESSEE 10.1 29.7 145.8 203.9 3036.2 314 TEXAS 13.3 33.8 152.4 208.2 4591.8 397.6 UTAH 3.5 20.3 68.8 147.3 4176.2 334.5

 VERMONT 1.4 15.9 30.8 101.2 3549.2 265.2 VIRGINIA 9 23.3 92.1 165.7 3507.4 226.7 WASHINGTON 4.3 39.6 106.2 224.8 4992.5 360.3 WEST VIRGINIA 6 13.2 42.2 90.9 1939.1 163.3 WISCONSIN 2.8 12.9 52.2 63.7 3461.1 220.7 WYOMING 5.4 21.9 39.7 173.9 3583.8 282 解:将上表中各项数据导入到 SPSS,进行因子分析。

 KMO 检验和巴特利球体检验,KMO 检验系数=0.763>0.5 P 值<0.05,所以能进行因子分析。

 元件矩陣 a a

  元件 1 2 3 杀人罪 .666 -.619 .279 强奸罪 .885 -.156 -.261 抢劫罪 .822 .185 .369 斗殴罪 .833 -.321 -.079 偷盗罪 .764 .344 -.471 汽车犯罪 .580 .694 .290 擷取方法:主體元件分析。

 a. 擷取 3 個元件。

 分析元件矩阵可以知道主要的犯罪类型为:强奸罪,抢劫罪,斗殴罪。

 主成分与原始变量的线性关系式:

 F 1 = 0.666X 1 +0.885X 2 +0.822X 3 +0.833X 4 +0.764X 5 +0.580X 6

 F2= -0.619X 1 -0.156X 2 +0.185X 3 -0.321X 4 +0.344X 5 +0.694X 6

 F3=0.279X 1 -0.261X 2 +0.369X 3 -0.079X 4 -0.471X 5 +0.290X 6

  循环平方和累加三项后达 87.62%达到要求,分析主成分分为三类。

  旋轉元件矩陣 a a

  元件 1 2 3 杀人罪 .948 .058 .060 强奸罪 .593 .699 .190 抢劫罪 .505 .235 .732 斗殴罪 .732 .494 .150 偷盗罪 .097 .888 .356 汽车犯罪 -.033 .251 .915

 擷取方法:主體元件分析。

 轉軸方法:具有 Kaiser 正規化的最大變異法。

 a

  分为三类,第一类:杀人罪,偷盗罪 第二类:强奸罪,斗殴罪 第三类:抢劫罪,汽车犯罪

  (3)经过归一化处理,并与相应的系数相乘,得到如下结果:

 3.采用因子分析法对美国 50 州的六种犯罪率数据进行分析,找出公共因子(假定 2 个),列出六种犯罪与公共因子的关系式,推导公共因子与六种犯罪的关系式,计算因子得分与综合得分,并对各州犯罪率按综合得分排序解释。

 解:对于第二题采用因子分析法得出以下结论:

 X 1 =0.805C 1 +0.036C 2

 X 2 =0744C 1 +0.478C 2

 X 3 =0.472C 1 +0.633C 2

 X 4 =0.789C 1 +0.324C 2

 X 5 =0.345C 1 +0.633C 2

 X 6 =0.026C 1 +0.803C 2

 C 1 =0.805X 1 +0.744X 2 +0.472X 3 +0.789X 4 +0.345X 5 +0.026X 6

 C 2 =0.036X 1 +0.478X 2 +0.633X 3 +0.324X 4 +0.663X 5 +0.803X 6

 4. 某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。下表是抽查欧洲某汽车市场 7 个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。

 品牌 价格 发动机 功率 轴距 宽 长 轴距 燃料容量 燃料效率 A 21500 1.8 140 101.2 67.3 172.4 2.639 13.2 28 A 28400 3.2 225 108.1 70.3 192.9 3.517 17.2 25 A 42000 3.5 210 114.6 71.4 196.6 3.850 18.0 22 B 23990 1.8 150 102.6 68.2 178.0 2.998 16.4 27 B 33950 2.8 200 108.7 76.1 192.0 3.561 18.5 22 B 62000 4.2 310 113.0 74.0 198.2 3.902 23.7 21 C 26990 2.5 170 107.3 68.4 176.0 3.179 16.6 26 C 33400 2.8 193 107.3 68.5 176.0 3.197 16.6 24 C 38900 2.8 193 111.4 70.9 188.0 3.472 18.5 25 D 21975 3.1 175 109.0 72.7 194.6 3.368 17.5 25 D 25300 3.8 240 109.0 72.7 196.2 3.543 17.5 23 D 31965 3.8 205 113.8 74.7 206.8 3.778 18.5 24 D 27885 3.8 205 112.2 73.5 200.0 3.591 17.5 25 E 39895 4.6 275 115.3 74.5 207.2 3.978 18.5 22 E 39665 4.6 275 108.0 75.5 200.6 3.843 19.0 22 E 31010 3.0 200 107.4 70.3 194.8 3.770 18.0 22 E 46225 5.7 255 117.5 77.0 201.2 5.572 30.0 15 F 13260 2.2 115 104.1 67.9 180.9 2.676 14.3 27 F 16535 3.1 170 107.0 69.4 190.4 3.051 15.0 25 F 18890 3.1 175 107.5 72.5 200.9 3.330 16.6 25 F 19390 3.4 180 110.5 72.7 197.9 3.340 17.0 27 F 24340 3.8 200 101.1 74.1 193.2 3.500 16.8 25 F 45705 5.7 345 104.5 73.6 179.7 3.210 19.1 22 F 13960 1.8 120 97.1 66.7 174.3 2.398 13.2 33 F 9235 1.0 55 93.1 62.6 149.4 1.895 10.3 45 F 18890 3.4 180 110.5 73.0 200.0 3.389 17.0 27 G 19840 2.5 163 103.7 69.7 190.9 2.967 15.9 24 G 24495 2.5 168 106.0 69.2 193.0 3.332 16.0 24 G 22245 2.7 200 113.0 74.4 209.1 3.452 17.0 26 G 16480 2.0 132 108.0 71.0 186.0 2.911 16.0 27 G 28340 3.5 253 113.0 74.4 207.7 3.564 17.0 23

 G 29185 3.5 253 113.0 74.4 197.8 3.567 17.0 23

 解:将上述数据输入到 SPSS 软件,用因子分析法找出其简化的指标系统。

  因子 1 由价格、发动机、功率和燃料容量相关性较大,主要表征发动机及其相关性能。

 因子 2 有轴距 1、轴距 2、宽、长、燃料效率表征车的物理特征以及燃料的化学性质。

 5.根据某年我国 31 个省市自治区的 6 项主要经济指标数据,进行因子分析,找出公因子并进行适当的解释,计算各地区的因子得分并进行排序。

 地区 人均GDP 财政收入 固定资产投资 年末总人口居民消费水平 社会消费品零售总额北

 京 50467 11171514 3296.4 1581 16770 3275.2天

 津 41163 4170479 1820.5 1075 10564 1356.8河

 北 16962 6205340 5470.2 6898 4945 3397.4山

 西 14123 5833752 2255.7 3375 4843 1613.4内蒙古 20053 3433774 3363.2 2397 5800 1595.3辽

 宁 21788 8176718 5689.6 4271 6929 3434.6吉

 林 15720 2452045 2594.3 2723 5710 1675.8黑龙江 16195 3868440 2236.0 3823 5141 1997.7上

 海 57695 15760742 3900.0 1815 20944 3360.4江

 苏 28814 16566820 10069.2 7550 8302 6623.2浙

 江 31874 12982044 7590.2 4980 11161 5325.3安

 徽 10055 4280265 3533.6 6110 4441 2029.4福

 建 21471 5411707 2981.8 3558 7826 2704.2江

 西 10798 3055214 2683.6 4339 4173 1428.0山

 东 23794 13562526 11111.4 9309 7025 7122.5河

 南 13313 6791715 5904.7 9392 4632 3880.5湖

 北 13296 4760823 3343.5 5693 5533 3412.0湖

 南 11950 4779274 3175.5 6342 5498 2834.2广

 东 28332 21794608 7973.4 9304 10829 9118.1广

 西 10296 3425788 2198.7 4719 4330 1600.8海

 南 12654 818139 423.9 836 4736 308.3重

 庆 12457 3177165 2407.4 2808 5417 1403.6四

 川 10546 6075850 4412.9 8169 4501 3421.6贵

 州 5787 2268157 1197.4 3757 3499 689.8云

 南 8970 3799702 2208.6 4483 4075 1188.9西

 藏 10430 145607 231.1 281 2915 89.7陕

 西 12138 3624805 2480.7 3735 3972 1522.0甘

 肃 8757 1412152 1022.6 2606 3810 717.5青

 海 11762 422437 408.5 548 4229 180.1宁

 夏 11847 613570 498.7 604 5112 199.0新

 疆 15000 2194628 1567.1 2050 4206 727.6

 解:31 个省市自治区的 6 项主要经济指标数据,进行因子分析。

 KMO 检验和巴特利球体检验,KMO 检验系数=0.763>0.5 P 值<0.05,所以能进行因子分析。

 分析结果如下图所示:

 因子 1 主要由财政收入、固定资产投资、年末人口数及社会消费品零售总额。主要表征宏观的经济指标; 因子 2 由人均 GDP 和居民消费水平,主要表征微观的指标回归到居民层面生活水平。

 地区的因子得分并进行排序:

 广东 江苏 山东 上海 浙江 北京 河南 辽宁 河北 四川 福建 天津 湖北 湖南 安徽 内蒙古

  5.12 4.38 4.32 4.14 3.74 3.35 2.53 2.45 2.28 2.10 1.88 1.87 1.83 1.75 1.52 1.39

  黑龙江 山西 吉林 广西 江西 陕西 重庆 云南 新疆 贵州 甘肃 海南 宁夏 青海 西藏

 1.35 1.32 1.19 1.16 1.13 1.13 1.10 1.06 0.77 0.63 0.55 0.39 0.36 0.28 0.10

 6.以第 5 题数据为例,采用分层聚类法分析聚类过程,并对结果详细解释。

 解:对于第五题给出的数据进行聚类分析

 表(1)

  表(2)

 表(3)

  表(4)

 结果分析如下 表(1)、表(2)、表(3)、表(4)

 显示共31个省市自治区进入聚类分析采用相关系数测量技术,先显示各变量间的相关系数这对于后面选择典型变量是十分有用的然后显示类间平均链锁法的合并进程即第一步7与22 被合并它们之间的相关系数最大为202098.45 第二步21 与30 合并其间相关系数为212741.530

 第三步20 与25 合并其间相关系数为290480.620 第四步14 与第三步合并其间相关系数为373585.330 第五步4 与8合并其间相关系数为437582.580 第六步21 与29 合并其间相关系数为573991.825 第七步28 与31 合并

 第八步17 与18合并 第九步14 与27合并 。。。。。。。。。。。。。。。。具体结果看树状图.

 图(4) 显示按类间平均链锁法变量合并过程的冰柱图如上所示

 7.以第 5 题数据为例,采用 K 均值聚类法计算聚类中心,将每个省级单元归入相应类别。

 解:将第五题做 K 均值聚类法计算。

 首先 将数据输入到 spss 软件,设置相关分析。得出以下结论:

 表(1)

 表(2)

 表(3)

 表(4)

 表(5)

 数据输出如上图所示,表(1)

 到表(3)

 显示首先系统根据要求的按4 类聚合确定初始聚类的各变量中心点未经K-means 算法叠代其类别间距离并非最优经叠代运算后类别间各变量中心值得到修正。

 表4 ,表5显示对聚类结果的类别间距离进行方差分析方差分析表明类别间距离差异的概率值均人均GDP ,财政收入,固定资产投资,居民消费水平,社会消费品零售总额均<0.001,年末总人口=0.004在0.001——0.005之间 即聚类效果好,这样原有31个省市自治区聚合成4 类第一类含原有10 类第二类含原有5 类第三类含原有1 类第四类含原有15 类具体结果系统以变量名QCL_1 存于原始数据文件中如下图所示:

 北

 京 天

 津 河

 北 山

 西 内蒙古 辽

 宁 吉

 林 黑龙江 上

 海 江

 苏 浙

 江 安

 徽 福

 建 江

 西 山

 东 河

 南 湖

 北 湖

 南 广

 东 广

 西 海

 南 重

 庆 四

 川 贵

 州 云

 南 西

 藏 陕

 西 甘

 肃 青

 海 宁

 夏 新

 疆 2 1 1 1 4 1 4 4 2 2 2 1 1 4 2 1 1

 4 4 4

 贵

 州 云

 南 西

 藏 陕

 西 甘

 肃 青

 海 宁

 夏 新

 疆

 4 4 4 4 4 4 4 4

 在原始数据文件中我们可清楚地看到聚类结果参照各项指标将每个省级单元归入相应类别:

 第一类:天津,河北,山西,辽宁,安徽,福建,河南,湖北,湖南。

 第二类:北京,上海,江苏,浙江,山东。

 第三类:广东 第四类:内蒙古,吉林,黑龙江,江西,广西,海南,重庆,贵州,云南,西藏,陕西,甘肃,青海,宁夏,新疆。

 8 某体育训练项目采用 6 个指标(x1-x6)评价运动员的竞技水平,分成两个级别,数据记录如下表。

 No Level x1 x2 x3 x4 x5 x6 1 1 3.6 4.3 82.3 70 90 18.52 2 1 3.3 4.1 87.5 80 100 18.48 3 1 3.3 4.2 87.7 85 115 18.56 4 1 3.2 4.1 88.6 75 100 19.1 5 1 3.1 4.4 90 95 120 20.14 6 1 3.2 4.9 89.1 85 105 19.44 7 1 3.3 4.2 89 75 85 19.17 8 1 3.5 4.5 84.2 80 100 18.8 9 1 3.7 4.6 82.1 70 85 17.68 10 1 3.4 4.4 90.2 75 100 19.14 11 1 3.6 4.3 82.1 70 90 18.1 12 1 3.6 4.5 82 55 70 17.4 13 1 3.6 4.2 82.2 70 90 18.12 14 1 3.4 4.2 85.4 85 100 18.66 15 1 3.3 4.3 90.1 80 100 19.86 16 1 3.1 4.2 89 85 100 20 17 1 3.1 4.2 90.2 85 115 20.8 18 1 3.6 4.2 82 65 80 17.2 19 1 3.7 4.4 81 80 95 17 20 1 3.3 4.3 90 80 110 19.8 21 1 3.8 4.1 80 60 80 16.89 22 1 3.7 4.3 83.9 85 100 18.76 23 1 3.5 4.2 85.4 85 100 18.7

 24 1 3.4 4.1 86.7 85 110 18.5 25 1 3.3 4.1 88.1 75 85 18.96 26 1 3.7 4.1 84.1 70 95 18.7 27 1 3.6 4.3 82 70 90 18.4 28 1 3.2 4.2 89.2 85 115 19.88 29 2 3.4 4 103 95 110 24.8 30 2 3.3 4.5 118 90 120 25.7 31 2 3.1 4.5 105 85 110 25.1 32 2 3.8 4.1 104.5 80 100 24.98 33 2 3 4.2 112 95 125 25.35 34 2 3.9 3.7 98.2 85 90 21.8 35 2 3.5 4.1 98.7 90 120 22.78 36 2 3.1 3.9 98.2 60 90 21.98 37 2 3.3 3.9 109 100 120 25.3 38 2 3.1 4 98.4 95 115 25.2 39 2 3.1 3.9 95.3 90 110 21.42 40 2 3.6 4.3 93.6 75 85 20.84 41 2 3.1 3.9 95.8 80 105 21.8 42 2 3 3.9 93.8 85 90 21.08 43 2 3.4 3.9 96.3 110 120 21.98 44 2 3.6 3.8 98.6 85 120 22.36 45 2 3.3 4 97.4 85 100 22.34 46 2 3.3 4.4 112 75 110 25.1 47 2 3.5 4.1 107.7 88 110 25.1 48 2 3.4 4.2 92.1 80 120 22.16 49 2 3.6 4.1 99.5 85 120 23.1

 50 2 3.1 4.4 116 75 110 25.3 51 2 3.1 4 102.7 80 110 24.68 52 2 3.6 4.1 115 85 115 23.7 53 2 3.5 4.3 97.8 75 100 24.1 分别采用距离判别法、Fisher 判别法和逐步判别法,试建立一个合理的判别标准,然后利用这一标准对未知类别的新运动员进行分类。

 解:(1)Fisher 判别法 群組平均值的等式檢定

 Wilks" Lambda (λ) F df1 df2 顯著性 X1 .967 1.751 1 51 .192 X2 .801 12.647 1 51 .001 X3 .321 107.974 1 51 .000 X4 .844 9.462 1 51 .003 X5 .796 13.079 1 51 .001 X6 .228 172.766 1 51 .000

  變數已輸入/ / 已移除 a,b,c,d

 步驟 已輸入 Wilks" Lambda (λ) 統計資料 df1 df2 df3 確切 F 統計資料 df1 df2 顯著性 1 X6 .228 1 1 51.000 172.766 1 51.000 .000 聯合組內矩陣

 X1 X2 X3 X4 X5 X6 相關 X1 1.000 -.064 -.317 -.301 -.386 -.386 X2 -.064 1.000 .337 -.109 .070 .326 X3 -.317 .337 1.000 .243 .454 .806 X4 -.301 -.109 .243 1.000 .738 .355 X5 -.386 .070 .454 .738 1.000 .546 X6 -.386 .326 .806 .355 .546 1.000

 2 X2 .174 2 1 51.000 118.467 2 50.000 .000 3 X5 .158 3 1 51.000 86.800 3 49.000 .000 在每一個步驟中,輸入最小化整體 Wilks" Lambda 的變數。

 a. 步驟的數目上限為 12。

 b. 要輸入的局部 F 下限為 3.84。

 c. 要移除的局部 F 上限為 2.71。

 d. F 層次、容差或 VIN 不足,無法進行進一步計算。

 Wilks" Lambda (λ) 步驟 變數數目 Lambda (λ) df1 df2 df3 確切 F 統計資料 df1 df2 顯著性 1 1 .228 1 1 51 172.766 1 51.000 .000 2 2 .174 2 1 51 118.467 2 50.000 .000 3 3 .158 3 1 51 86.800 3 49.000 .000

  分類函數係數

  LEVEL 1 2 X2 97.943 84.673 X5 .321 .168 X6 4.372 8.499 常數 -267.004 -282.903 費雪 (Fisher) 線性區別函數

 9. 某品牌家电在两个城市销售,其中 A 城市有 6 个商场、B 城市有 8 个商场销售,下表是各商场一年的销售量,试分析该品牌家电在这两个城市的销售量是否有显著差异?(a=0.05)

 商场序号 A 城 商场序号 B 城 1 545 1 560 2 489 2 551 3 505 3 535 4 585 4 479 5 539 5 476 6 449 6 545

  7 602

  8 495

 解:将数据输入到 R 软件,并进行显著性分析有: > sale<-data.frame(Y=c(545,489,505,585,539,449, + + + 560,551,535,479,476,545,602,495),X=factor(rep(1:2,c(6,8)))) > sale.aov<-aov(Y~X,data=sale) > summary(sale.aov)

  Df Sum Sq Mean Sq F value Pr(>F) X

 1

 470

  470

  0.226

 0.643 Residuals

  12

 24943

 2079

  分析结论可知,X 因素的 P 值为 0.643>>0.05 即影响不显著的

 10.某项录用考试有面试和笔试两部分,抽取由 8 名考生组成的样本,其中成绩如下表,计算秩相关系数并进行显著性检验。(a=0.05)

 考生 面试成绩(分)

 笔试成绩(分)

 1 78 77 2 74 83 3 97 88 4 60 65 5 86 78 6 81 86 7 62 64 8 91 93 解:将数输入到 R 软件,面试成绩记为 X,笔试成绩记为 Y:

 > score<-data.frame( + X=c(78,74,97,60,86,81,62,91), + Y= c(77,83,88,65,78,86,64,93) + ) > lm.sol<-lm(Y ~ X, data=score) > summary(lm.sol)

 Call: lm(formula = Y ~ X, data = score)

 Residuals:

 Min

  1Q Median

  3Q

 Max

 -6.435 -3.713 -1.483

 5.058

 7.002

  Coefficients:

 Estimate Std. Error t value Pr(>|t|)

 (Intercept)

 23.9733

 12.4768

  1.921

 0.10306

 X

  0.7030

  0.1568

  4.484

 0.00418 ** --- Signif. codes:

 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 5.422 on 6 degrees of freedom Multiple R-squared:

 0.7701,

 Adjusted R-squared:

 0.7318

 F-statistic:

 20.1 on 1 and 6 DF,

 p-value: 0.004176 分析计算结果有:

 1)回归系数 X=0.00418<0.01 所以显著性好 2)回归方程 P 值=0.004176<0.01 所以显著性好 综上考生面试和笔试两部分成绩显著。

 秩相关系数

相关热词搜索: 作业 数理 统计