spss实验报告
《统计实习》SPSS实验报告
姓名:
成功
学号:
2011516199
班级:
会计二班
实验报告二 实验项目: : 描述性统计分析
实验目得: :
1、掌握数据集中趋势与离中趋势得分析方法; 2、熟练掌握各个分析过程得基本步骤以及彼此之间得联系与区别、 实验内容及步骤
一、 数据输入
案例:对 6 名男生与6名女生得肺活量得统计,数据如下:
1. 打开 SPSS 软件,进行数据输入:通过打开数据得方式对 XLS 得数据进行输入
其变量视图为:
二、 探索分析
进行探索分析得出如下输出结果: 浏览
由上表可以瞧出,6 例均为有效值,没有记录缺失值得情况。
由上表可以瞧出,男女之间肺活量得差异,男生明显优于女生,范围更广,偏度大。
男
男 Stem-and—Leaf Plot
Frequency
Stem &
Leaf
2、00
1 .
34
2.00
1 .
89
2、00
2 、
02
Stem width:
1000
Each leaf:
1 case(s)
女
女 Stem—and-Leaf Plot
Frequency
Stem &
Leaf
2。00
1 。
23
3、00
1 .
568
1。00
2 、
0
Stem width:
1000
Each leaf:
1 case(s)
三、 频率分析
进行频率分析得出如下输出结果:
由上图可知,分析变量名:肺活量。可见样本量 N 为6例,缺失值 0 例, 1500以下得 33%,1500-2000 男生33%女生50%,2000 以上女生 16。7%,男生33%。
四、 描述分析
进行描述分析得出如下输出结果: 由上图可知,分析变量名:工资,可见样本量N为6例,极小值为男1342女1213,极大值为男2200女2077,说明12人中肺活量最少得为女生就是1213,最多得为男生有2200,均值为1810。50/1621、33,。标准差为327.735/325。408,离散程度不算大。
五、 交叉分析
实验报告三 实验项目: : 均值比较
实验目得: : 。学习利用 SPSS 进行单样本、两独立样本以及成对样本得均值检验。
实验内容及步骤
(一)
描述统计
案例:某医疗机构为研究某种减肥药得疗效,对 15位肥胖者进行为期半年得观察测试,测试指标为使用该药之前与之后得体重、 编号 1 2 3 4 5 服药前 198 237 233 179 219 服药后 192 225 226 172 214 编号 6 7 8 9 10 服药前 169 222 167 199 233 服药后 161 210 161 193 226 编号 11 12 13 14 15 服药前 179
7 服药后 173 154 143 206 249 输入 SPSS 建立数据、
由上图可知,结果输出均值、样本量与标准差、因为选择了分组变量,所以三项指标均给出分组及合计值,可见以这种方式列出统计量可以非常直观得进行各组间得比较、
由上表可知,在显著性水平为 0.05 时,服药前后得概率 p 值为小于 0.05,拒绝零假设,说明服药前后得体重有显著性变化 (二)
单样本 T T 检验
进行单样本 T 检验分析得出如下输出结果:
由上表可以知,单个样本统计量分析表,得基本情况描述,有样本量、均值、标准差与标准误,单样本 t 检验表,第一行注明了用于比较得已知总体均值为 14,从左到右依次为 t 值(t)、自由度(df)、P 值(Sig、2—tailed)、两均值得差值(Mean Difference)、差值得 95%可信区间、由上表可知:t=34.215,P=0。000〈0、05。因此可以认为肺气肿得总体均值不等于 0、
(三)
双样本 T T 检验
案例:研究某安慰剂对肥胖病人治疗作用,用 20名患者分组配对,测得体重
如下表,要求测定该安慰剂对人得体重作用就是否比药物好。
进行双样本 T 检验得出如下输出结果: T 检验
成对样本统计量
均值 N 标准差 均值得标准误 对 1 安 慰 剂组 121.80 10 11、419 3、611 药物组 111.80 10 10.185 3。221 由上图可知,对变量各自得统计描述,此处只有 1 对,故只有对1。
成对样本相关系数
N 相关系数 Sig、 对 1 安慰剂组 & 药物组 10 、802 、005 此处进行配对变量间得相关性分析
成对样本检验
成对差分 t df Sig、(双侧) 均值 标准差 均值得标准误 差分 95% 置信区间 下限 上限 对 1 安慰剂组—药物组 10、000 6.896 2、181 5、067 14、933 4、586 9 .001 配对 t 检验表,给出最终得检验结果,由上表可见 P=0。001,故可认为安慰剂组与药物组对肥胖病人得体重有差别影响
实验报告四 实验项目: : 相关分析
实验目得: :
1.学习利用 SPSS进行相关分析、偏相关分析、距离分析、线性回归分析与曲线回归、 实验内容及步骤
(一)
两变量得相关分析
案例:某医疗机构为研究某种减肥药得疗效,对 15位肥胖者进行为期半年得观察测试,测试指标为使用该药之前与之后得体重。
编号 1 2 3 4 5 服药前 198 237 233 179 219 服药后 192 225 226 172 214 编号 6 7 8 9 10 服药前 169 222 167 199 233 服药后 161 210 161 193 226 编号 11 12 13 14 15 服药前 179
7 服药后 173 154 143 206 249 进行相关双变量分析得出如下输出结果: 相关性
相关系数系数表。变量间两两得相关系数就是用方阵得形式给出得、每一行与每一列得两个变量对应得格子中就就是这两个变量相关分析结果结果,共分为三列,分别就是相关系数、P 值与样本数。由于这里只分析了两个变量,因此给出得就是2*2 得方阵。由上表可见,服药前与服药后自身得相关系数均为 1(of course),而治疗前与治疗后得相关系数为 0、911 ,P〈0。01 (二)
偏相关分析
偏相关 已知有某河流得一年月平均流量观测数据与该河流所在地区当年得月平均雨量与月平均温度观测数据,如表所示、试分析温度与河水流量之间得相关关系。
观测数据表 月份 月平均流量 月平均雨量 月平均气温 1 0、50 0.10 —8。80 2 0、30 0。10 -11.00 3 0.40 0。40 -2、40 4 1、40 0.40 6.90 5 3。30 2、70 10、60 6 4.70 2、40 13、90 7 5。90 2、50 15。40 8 4、70 3、00 13、50 9 0、90 1.30 10、00 10 0。60 1.80 2、70 11 0、50 0、60 -4。80
12 0、30 0、20 -6、00
由上表可见控制月平均雨量之后,“月平均流量”与“月平均气温”得相关系数为 0。365,P=0、27,P>0.05,因此“月平均流量”与“月平均气温"不存在显著相关性。
。
(三)
距离分析
案例:植物在不同得温度下得生长状况不同,下列就是三个温度下得植物生长 编号 10度 20度 30 度 1 12、36 12、4 12、18 2 12、14 12.2 12、22 3 12.31 12、28 12。35 4 12。32 12。25 12、21 5 12、12 12。22 12.1 6 12.28 12、34 12。25 7 12。24 12、31 12。2 8 12、41 12。3 12。46 近似值
(四)
线性回归分析
已知有某河流得一年月平均流量观测数据与该河流所在地区当年得月平均雨量与月平均温度观测数据,如表所示。试分析关系。
观测数据表 月份 月平均流量 月平均雨量 月平均气温 1 0。50 0。10 —8、80 2 0。30 0、10 —11。00 3 0、40 0。40 -2、40 4 1、40 0。40 6。90 5 3。30 2、70 10、60 6 4、70 2.40 13.90 7 5.90 2。50 15.40 8 4。70 3、00 13。50 9 0、90 1。30 10。00 10 0.60 1。80 2。70 11 0、50 0。60 -4、80 12 0。30 0。20 —6.00 进行线性回归分析得出如下输出结果: 回归
输入/移去得变量b
模型 输入得变量 移去得变量 方法
1 月平均流量 a 、 输入 a、 已输入所有请求得变量、 b、 因变量: 月平均雨量
由表可知,就是第一个问题得分析结果。这里得表格就是拟合过程中变量进入/退出模型得情况记录,由于只引入了一个自变量,所以只出现了一个模型 1(在多元回归中就会依次出现多个回归模型),该模型中身高为进入得变量,没有移出得变量, 这里得表格就是拟合过程中变量进入/退出模型得情况记录,由于只引入了一个自变量,所以只出现了一个模型(在多元回归中就会依次出现多个回归模型),该模型中身高为进入得变量,没有移出得变量。
模型汇总 模型 R R 方 调整 R 方 标准 估计得误差 1 。855a 、732 .705 、6117 a. 预测变量: (常量), 月平均流量。
拟合模型得情况简报,显示在模型中相关系数R为0.855,而决定系数R2为0. 732,校正得决定系数为 0.705,说明模型得拟合度较高。
Anovab 模型 平方与 df 均方 F Sig。
1 回归 10.208 1 10。208 27、283 .000a 残差 3。741 10 。374
总计 13.949 11
a。
预测变量: (常量), 月平均流量。
b. 因变量: 月平均雨量
这就是所用模型得检验结果,可以瞧到这就就是一个标准得方差分析表!从上表可见所用得回归模型F值为27。283,P值为.00a,因此用得这个回归模型就是有统计学意义得,可以继续瞧下面系数分别检验得结果。由于这里所用得回归模型只有一个自变量,因此模型得检验就等价与系数得检验,在多元回归中这两者就是不同得。
系数 a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) .387 。247
1、564 .149 月平均流量 .462 。088 .855 5。223 .000
系数 a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) .387 。247
1、564 .149 月平均流量 .462 。088 .855 5。223 .000 a. 因变量: 月平均雨量
包括常数项在内得所有系数得检验结果。用得就是 t 检验,同时还会给出标化/未标化系数、可见常数项与身高都就是有统计学意义得 残差统计量 a
极小值 极大值 均值 标准 偏差 N 预测值 。526 3。113 1。292 。9633 12 残差 —.6337 1。1358 。0000 .5832 12 标准 预测值 —、795 1。890 、000 1、000 12 标准 残差 —1.036 1.857 .000 .953 12 a。
因变量: 月平均雨量
图表
(五)
曲线回归分析
某地 1963年调查得儿童年龄(岁)与体重得资料试拟合对数曲线。
年龄(岁) 体重 1 2 3 4 5 6 7 68 65 67 50 70 76 77 进行曲线回归分析得出如下输出结果:
实验报告五 实验项目: : 聚类分析与判别分析
实验目得: :
1、学习利用 SPSS 进行聚类分析与判别分析。
实验内容及步骤
(一)
系统聚类法
为确定老年妇女进行体育锻炼还就是增加营养会减缓骨骼损伤,一名研究者用光子吸收法测量了骨骼中无机物含量,对三根骨头主侧与非主侧记录了测量值,结果见教材表。
: 受试者编号 主侧桡骨 桡骨 主侧肱骨 肱骨 主侧尺骨 尺骨 1 1、103 1、052 2、139 2.238 0.873 0、872 2 0.842 0.859 1。873 1、741 0.590 0。744 3 0.925 0。873 1。887 1.809 0、767 0。713 4 0、857 0.744 1。739 1.547 0.706 0.674 5 0.795 0、809 1。734 1。715 0。549 0。654 6 0、787 0。779 1。509 1、474 0、782 0、571 7 0。933 0、880 1。695 1。656 0、737 0。803 8 0.799 0、851 1。740 1。777 0、618 0。682 9 0、945 0.876 1。811 1、759 0。853 0、777 10 0、921 0、906 1。954 2。009 0.823 0.765 输入 SPSS 建立数据。
进行系统聚类分析得出如下输出结果:
聚类
快捷聚类
研究儿童生长发育得分期,调查名 1 月至 7 岁儿童得身高(cm)、体重(kg)、胸围(cm)与资料。求出月平均增长率(%),
判别分析
对某企业,搜集整理了10名员工2009年第1季度得数据资料。构建1个10×6维得矩阵 职工代号 工作产量 工作质量 工作出勤 工砟损耗 工作态度 工作能力 1 9.68 9。62 8、37 8。63 9、86 9。74 2 8、09 8、83 9、38 9。79 9、98 9。73 3 7。46 8。73 6、74 5。59 8.83 8、46 4 6.08 8、25 5、04 5、92 8.33 8。29 5 6。61 8、36 6.67 7。46 8、38 8。14 6 7、69 8.85 6.44 7。45 8。19 8.1 7 7.46 8、93 5、7 7、06 8。58 8。36 8 7、6 9。28 6。75 8。03 8、68 8、22 9 7、6 8.26 7、5 7。63 8。79 7.63 10 7。16 8、62 5、72 7。11 8。19 8。18 1、“分析——分类——判别分析",把“分类”选入“分组变量”,定义范围:最小值(1),最大值(4),把 X1、X2、X3、X4、X5 与 X6 输入“自变量框",选择“使用逐步式方法”; 2、“统计量”中选择“均值”、“单变量 ANOVA”、“Fisher”、“未标准化”、“组内相关"; 3、“方法”默认设置; 4、“分类”中选择“根据组大小计算"、“摘要表”、“不考虑该个案时得分类”、“在组内"、“合并图、分组、区域图”; 5、“保存”中选择“预测组成员"、“判别得分”; 6、点击确定、
得到以下各表与图。
特征值 函数 特征值 方差得 % 累积 % 正则相关性 1 1.002a 100.0 100。0 、707 a、 分析中使用了前 1 个典型判别式函数。
Wilks 得 Lambda 函数检验 Wilks 得 Lambda 卡方 df Sig、 1 .499 3、471 6 。748
函数 1 工作质量 。270 工作产量 —。831
工作出勤 —。406 工砟损耗 1。415 工作态度 1.879 工作能力 —2。061 结构矩阵
函数 1 工砟损耗 、541 工作出勤 。355 工作态度 、175 工作产量 、063 工作能力 —、056 工作质量 -.050 判别变量与标准化典型判别式函数之间得汇聚组间相关性
按函数内相关性得绝对大小排序得变量。
典型判别式函数系数
函数 1 工作质量 .581 工作产量 -。830 工作出勤 —。312 工砟损耗 1.248 工作态度 2。798 工作能力 -2.803 (常量) -6。817 非标准化系数 组质心处得函数 职工代号 函数 1 1 -、731 2 1。097 在组均值处评估得非标准化典型判别式函数 分类统计量 分类处理摘要 已处理得 10 已排除得 缺失或越界组代码 0 至少一个缺失判别变量 0 用于输出中 10
组得先验概率 职工代号 先验 用于分析得案例 未加权得 已加权得 1 .600 6 6、000 2 、400 4 4、000 合计 1.000 10 10、000 分类函数系数
职工代号 1 2 工作质量 121、299 122.360 工作产量 —58、894 -60。411 工作出勤 -14、803 -15。373 工砟损耗 3、739 6、020 工作态度 123、979 129、094 工作能力 —63。284 -68。407 (常量) —547.493 —560。691 Fisher 得线性判别式函数 单独组图表
分类结果 b,c
职工代号 预测组成员 合计
1 2 初始 计数 1 5 1 6 2 1 3 4 % 1 83、3 16、7 100、0 2 25.0 75、0 100、0 交叉验证a 计数 1 2 4 6 2 4 0 4 % 1 33.3 66、7 100。0 2 100。0 、0 100.0
分类结果 b,c
职工代号 预测组成员 合计
1 2 初始 计数 1 5 1 6 2 1 3 4 % 1 83、3 16、7 100、0 2 25.0 75、0 100、0 交叉验证a 计数 1 2 4 6 2 4 0 4 % 1 33.3 66、7 100。0 2 100。0 、0 100.0 a、 仅对分析中得案例进行交叉验证。
在交叉验证中,每个案例都就是按照从该案例以外得所有其她案例派生得函数来分类得。
b. 已对初始分组案例中得 80。0% 个进行了正确分类。
c、 已对交叉验证分组案例中得 20.0% 个进行了正确分类。
实验报告六 实验项目: : 因子分析与主成分分析
实验目得: :
1、学习利用 SPSS 进行因子分析与主成分分析。
实验内容及步骤
(一)
因子分析
下表资料为 15名健康人得 7 项生化检验结果,6 项生化检验指标依次命名为X1 至 X6,请对该资料进行因子分析。
因子分析 1、打开导入 excle数据 2、选择菜单“分析→降维→因子分析” ,弹出“因子分析”对话框。在对话框左侧得变量列表中选除地区外得变量,进入“变量”框,
3、单击“描述"按钮,弹出“因子 分析: 描述”对话框,在“统计量”中选“单变量 描述”项,输出各变量得均数与标准差,“相关矩阵”栏内选“系数",计算相关系数矩阵,并选“KMO 与 Bartlett’s 球形度检验”项,对相关系数矩阵进行统计学检验,
对以上资料进行因子分析:分析--降维——因子分析,确定操作得出 描述统计量
均值 标准差 分析 N X1 6.0213 1、23848 15 X2 7、9880 。57340 15 X3 3。9960 1、01195 15 X4 5、5700 1.38699 15 X5 8。3727 .77780 15 X6 8.0247 、68955 15
相关矩阵
X1 X2 X3 X4 X5 X6 相关 X1 1。000 。966 .782 .055 。104 、019 X2 。966 1.000 .747 .028 .233 、158 X3 .782 .747 1。000 .125 .214 —。024 X4 .055 、028 、125 1.000 —。150 、233 X5 、104 .233 、214 -.150 1、000 。753 X6 。019 .158 -、024 。233 。753 1.000 Sig。(单侧) X1
.000 、000 。423 .356 。473 X2 、000
。001 。461 .202 、287 X3 。000 。001
.329 、222 .467 X4 、423 、461 。329
.297 。202 X5 。356 。202 、222 .297
、001 X6 .473 .287 。467 。202 .001
KMO 与
Bart le e t t 得检验 取样足够度得 Kaiser—Meyer-Olkin 度量。
。460 Bartlett 得球形度检验 近似卡方 64.035 df 15 Sig、 。000 公因子方差
初始 提取 X1 1。000 。950 X2 1、000 。930 X3 1、000 。801 X4 1。000 。989 X5 1、000 。928 X6 1。000 。936 提取方法:主成份分析。
解释得总方差 成份 初始特征值 提取平方与载入 旋转平方与载入 合计 方差得 % 累积 % 合计 方差得 % 累积 % 合计 方差得 % 累积 % 1 2.768 46。127 46、127 2。768 46、127 46。127 2。678 44.634 44。634 2 1.683 28、050 74.177 1.683 28。050 74。177 1.766 29、432 74、066 3 1、084 18.074 92。251 1。084 18。074 92。251 1、091 18、186 92。251
4 、360 5。995 98.246
5 .084 1、401 99.647
6 、021 .353 100。000
提取方法:主成份分析、 成份矩阵a a
成份 1 2 3 X1 .935 —、277 -.021 X2 。954 —、131 -、057 X3 .868 -.218 、030 X4 、107 .059 .987 X5 .389 。839 -、272 X6 .263 、914 、178 提取方法 :主成份。
a。
已提取了 3 个成份。
旋转成份矩阵a a
成份 1 2 3 X1 。975 —、001 .016 X2 。953 、146 -。012 X3 .892 .032 、066 X4 .049 。021 、993 X5 .145 、930 —.205 X6 -、013 .937 、241 提取方法 :主成份、
旋转法 :具有 Kaiser 标准化得正交旋转法、 a. 旋转在 4 次迭代后收敛、
成份转换矩阵 成份 1 2 3 1 。958 、281 、054 2 -。284 。957 、053 3 —、037 -.066 .997 提取方法 :主成份。
旋转法 :具有 Kaiser 标准化得正交旋转法。