卫生统计学考试复习资料:统计修改

时间:2022-06-23 18:15:10 浏览量:

 一、 多重线性回归 1、绘制散点图:

 脂联素空腹血糖瘦素 病程体重指数体重指数病程瘦素空腹血糖脂联素

  散点图提示瘦素、体重指数与脂联素存在线性关系 2、正态性检验:K-S 值=0.100,P=0.200>0.10,认为 Y 值(脂联素)服从正态分布 Tests of Normality.100 30 .200* .960 30 .319 脂联素Statistic df Sig. Statistic df Sig.Kolmogorov -SmirnovaShapiro-WilkThis is a lower bound of the true significance.*. Lilliefors Significance Correctiona.

 3、方差齐性检验:P>0.10,方差齐性。(可用残差图检验正态性和方差齐性)

 综上可知,资料满足线性,样本中各个体之间相互独立,因变量服从正态分布,方差齐性,故可进行多重线性回归分析。

 4、构建多重线性回归方程:Ý=b0+b1X1+b2X2+b3X3+b4X4 5、回归方程的假设检验 建立假设检验,确立检验水准: H0:β1=β2=β3=β4=0 H1:β1,β2,β3,β4 不全为 0 α=0.05 方差分析结果如下:

 ANOVAb1773.346 4 443.336 17.000 .000 a651.955 25 26.0782425.301 29RegressionResidualTotalModel1Sum ofSquares df Mean Square F Sig.Predictors: (C onstant ), 空腹血糖, 体重指数, 病程, 瘦素a. Dependent Variable: 脂联素b.

  F=17.000,P<0.001,差异有统计学意义,故拒绝 H0,接受 H1,认为见相关系数 βi 不全为零,该回归模型有统计学意义,用这四个自变量构成的回归方程解释脂联素的变化有意义。

 6、计算决定系数 Model Summaryb.855 a .731 .688 5.10668Model1R R SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (Constant), 空腹血糖, 体重指数, 病程, 瘦素a. Dependent Variable: 脂联素b.

  决定系数 R2=0.731,说明利用体重指数、病程、空腹血糖、瘦素等四个因素可以解释脂联素的约 73.1%的变异,可以认为回归效果较好。调整的确定系数 R2ad=0.688<0.731,说明在回归方程中存在一些对反应变量贡献很小或没有贡献的自变量。

 7、各偏回归系数的假设检验: 建立假设检验,确立检验水准 H0:βi=0;

 H1:βi≠0;

 α=0.05 t 检验结果如下 Coefficientsa58.199 11.575 5.028 .000 34.359 82.039-1.030 .530 -.343 -1.942 .063 -2.122 .062-.131 .211 -.067 -.621 .540 -.566 .304-.811 .253 -.566 -3.211 .004 -1.332 -.291-.579 .447 -.139 -1.293 .208 -1.500 .343(Constant)体重指数病程瘦素空腹血糖Model1B Std. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientst Sig. Lower Bound Upper Bound95% Confidence Interval for BDependent Variable: 脂联素a.

  体重指数:t1=-1.942,P=0.63>0.05,故不拒绝 H0,认为 β1=0.即体重指数对脂联素的影响无统计学意义。

 病程:t2=-0.621,P=0.054>0.05,故不拒绝 H0,认为 β2=0.即病程对脂联素的影响无统计学意义。

 瘦素:t3=-3.211,P=0.005<0.005,故拒绝 H0,接受 H1,认为 β3≠0.即瘦素对脂联素的影响有统计学意义。

 空腹血糖:t4=-1.293,P=0.208>0.05,故不拒绝 H0,认为 β4=0.即病程对脂联素的影响无

 统计学意义。

 综上,估计回归方程为 Ý=58.199-0.811X(瘦素)

  8、绘制残差图 30.00000 20.00000 10.00000 0.00000Uns ta nda rdize d P re dicte d Va lue2.000001.000000.00000-1.00000-2.00000Standardized Predicted Value 由残差图可知,X 值(瘦素)变动时,相应的 Y 值(脂联素)有相应的变动,两变量间有线性关系,两变量满足方差齐性。

  二,c Logistic 回归分析

 因为因变量为二分类变量,取值只有 0 和 1,故采用 Logistic 回归分析。

 1、Logistic 回归模型的基本结构:

 Ln(p/1-p)=β0+β1X1+β2X2+β3X3 2、Logistic 回归方程的假设检验 建立假设检验,确立检验水准: H0:β1=β2=β3=β4=0 ,模型无统计学意义 H1:β1,β2,β3,β4 不全为 0,,模型有统计学意义 α=0.05 卡方检验结果如下:

 Omnibus Tests of Model Coefficients21.730 3 .00021.730 3 .00021.730 3 .000StepBlockModelStep 1Chi-square df Sig.

 由上表可知:卡方值 X2=21.730, P<0.001,故在 α=0.05 水准下拒绝 H0,接受 H1,认为模型有统计学意义。

 3、Logistic 回归的参数估计及假设检验 建立假设,确立检验水准:

 H0:βi=0;H1:βi≠0

  α=0.05 统计结果如下:

 Variables in the Equation1.110 .348 10.142 1 .001 3.034 1.532 6.007.703 .329 4.559 1 .033 2.019 1.059 3.850.975 .344 8.036 1 .005 2.651 1.351 5.203-2.086 .351 35.263 1 .000 .124X1X2X3ConstantStep1aB S.E. Wald df Sig. Exp(B) Lower Upper95.0% C.I.for EXP(B)Variable(s) entered on step 1: X1, X2, X3.a.

  由上表可知:

 X1:Wald X2=10.142,P=0.001<0.05,故在 α=0.05 检验水准下 拒绝 H0,接受 H1,认为抢救前是否有休克对抢救结果有影响。β1>0,Exp(B)=3.034,说明休克是增加死亡优势的危险因素,当其他变量取固定值时,抢救前已休克的死亡风险是抢救前无休克的死亡风险的 3.034 倍。

 X2:Wald X2=4.559,P=0.33<0.05,故在 α=0.05 检验水准下 拒绝 H0,接受 H1,认为抢救前是否有心衰对抢救结果有影响。β2>0,Exp(B)=2.019,说明心衰是增加死亡优势的危险因素,当其他变量取固定值时,抢救前发生心衰的死亡风险是未发生心衰死亡风险的 2.019 倍。

 X3:Wald X2=8.036,P=0.005<0.05,故在 α=0.05 检验水准下 拒绝 H0,接受 H1,认为能否及时送往医院对抢救结果有影响。β3>0,Exp(B)=2.651,表明未能及时送往医院是增加死亡优势危险因素,当其他变量取固定值时,未能及时送往医院的死亡风险是及时送往医院的死亡风险的 2.65 倍。

 综上所述,得出 Logistic 回归方程:

 Ln(p/1-p)=-2.086+ 1.110 X1+ 0.703 X 2+ 0.975 X 3

 三、卡方检验:

 该资料为计数资料,故采用非参数检验:卡方检验。

 建立假设检验,确立检验标准 H0:两种药物疗效相同; H1:两种药物疗效不同。

 α=0.05 结果如下:

 Chi-Square Tests1.086 b 1 .297.611 1 .4341.090 1 .297.435 .2171.068 1 .30160Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFisher"s Exact TestLinear-by-LinearAssociationN of Valid CasesValue dfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. The minimum expected count is 13.00.b.

  卡方值 X2=1.086,自由度 v=1,P=0.297>0.05,差异无统计学意义,故不拒绝 H0,不能认为两种药物疗效不相同。

 四、 简单线性相关与回归

 1、绘制散点图 15.0 12.0 9.0 6.0 3.0 0.0距离(km)

 距离(km)40302010就 就诊 诊率 率( (% % )

 )

 由散点图可知两变量存在线性关系,就诊率随距离的增加呈直线下降趋势。

 2、正态性检验 Tests of Normality.127 16 .200* .953 16 .532 距离(km)Statistic df Sig. Statistic df Sig.Kolmogorov -SmirnovaShapiro-WilkThis is a lower bound of the true significance.*. Lilliefors Significance Correctiona.

 Tests of Normality.104 16 .200* .944 16 .403 就诊率(%)Statistic df Sig. Statistic df Sig.Kolmogorov -SmirnovaShapiro-WilkThis is a lower bound of the true significance.*. Lilliefors Significance Correctiona.

  由上表可知距离与就诊率的 K-S 分别为 0.127 和 0.104,P 值均为 0.200>0.10,两变量均来自正态分布总体。

 因两变量为随机变量且各样本相互独立,两变量存在线性关系均服从正态分布,故可进行Pearson 相关分析。(如果不满足双变量正态分布,则用 Spearman 秩相关,要对原始数据进行编秩再分析)

 3、计算相关系数,对相关系数进行假设检验:

 建立假设检验,确立检验水准:

 H0:ρ=0;

  H1:ρ≠0;

 α=0.05 Correlations1 -.989**.00016 16-.989** 1.00016 16Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N就诊率距离就诊率 距离Correlation is significant at the 0.01 lev el(2-tailed).**.

 由上表可知 pearson 相关系数 r=-0.989,P<0.001,按 ɑ=0.05 水准故拒绝 H0,接受 H1,认为ρ≠0,两变量间线性相关有统计学意义。r=-0.994<0,说明两变量间存在很强的负相关。

 4、方差齐性检验:残差图中散点分布围绕 e=0 为中心分布,故可推断方差齐性。

 0.16000 0.14000 0.12000 0.10000 0.08000 0.06000 0.04000 0.02000 0.00000 -0.02000Uns ta nda rdize d P re dicte d Va lue Uns ta nda rdize d P re dicte d Va lue4.000002.000000.00000-2.00000-4.00000Standardized Residual Standardized Residual

 4、综上可知,变量间满足线性、独立、正态及等方差的前提,可进行线性回归分析。

 5、建立回归模型,估计线性回归方程:Y=α+βX 6、线性回归方程的假设检验:

 建立假设检验,确立检验水准:

 H0:总体回归方程不成立或总体中自变量 X 对因变量 Y 没有贡献。

 H1:总体回归方程成立或总体中自变量 X 对因变量 Y 有贡献。

 ɑ=0.05 方差分析结果如下:

 ANOVAb1970.787 1 1970.787 624.935 .000 a44.150 14 3.1542014.938 15RegressionResidualTotalModel1Sum ofSquares df Mean Square F Sig.Predictors: (C onstant ), 距离(km)a. Dependent Variable: 就诊率(%)b.

 F=624.935,P<0.001,按 ɑ=0.05 水准拒绝 H0,接受 H1,可认为距离与就诊率之间的回归方程具有统计学意义。

 7、回归系数假设检验:

 建立假设检验,确立检验水准:

 H0:β=0;

  H1:β≠0;

 α=0.05 Coefficientsa47.779 .945 50.584 .000 45.753 49.805-3.529 .141 -.989 -24.999 .000 -3.832 -3.226(Constant)距离(km)Model1B Std. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientst Sig. Lower Bound Upper Bound95% Conf idence Interval for BDependent Variable: 就诊率(%)a.

 t=-24.999,P<0.001,按 α=0.05 水准拒绝 H0,接受 H1,认为该回归系数具有统计学意义。总体回归系数估计值 b=-3.529,双侧 95%置信区间为(-3.832,-3.226). 综上所述,得出线性回归方程为:Ý=47.779-3.529 X,说明距离每增加 1 公里,就诊率平均可能下降 3.529%。

 Model Summaryb.989 a .978 .977 1.79034Model1R R SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (C onstant), 距离a. Dependent Variable: 就诊率b.

  决定系数 R2=0.978,说明就诊率总变异的 97.%与距离有关。

  五、t 检验 1、 两独立样本 t 检验 该例属完全随机设计,两样本各自独立。

 (1)正态性性检验

 Tests of Normality.163 10 .200* .955 10 .731.150 10 .200* .951 10 .683group正常窒息SDStatistic df Sig. Statistic df Sig.Kolmogorov-SmirnovaShapiro-WilkThis is a lower bound of the true significance.*. Lilliefors Significance Correctiona.

  K-S 正态性检验:P 均为 0.200>0.10,故两变量均服从正态分布。

 (2)方差齐性检验 Test of Homogeneity of VariancesSD.104 1 18 .751LeveneStatistic df1 df2 Sig.

 Levene 方差齐性检验得 F=0.104,P=0.751>0.05,故方差齐性。

 综上,该实验属完全随机设计实验,样本相互独立、均来自正态分布总体且方差齐性,故可进行两独立样本的 t 检验。

 (3)两独立样本的 t 检验 建立假设检验,确立检验水准:

 H0:μ1= μ2,即正常新生儿和窒息新生儿血液中的 SOD 总体平均水平相等。

 H1:μ1≠μ2,即正常新生儿和窒息新生儿血液中的 SOD 总体平均水平不相等。

 ɑ=0.05 Group Statistics10 141.1470 7.52181 2.3786110 126.2400 7.54533 2.38604group正常窒息SDN Mean Std. DeviationStd. ErrorMean

  Independent Samples Test.104 .751 4.425 18 .000 14.90700 3.36912 7.82874 21.985264.425 18.000 .000 14.90700 3.36912 7.82874 21.98526Equal variancesassumedEqual variancesnot assumedSDF Sig.Levene"s Test forEquality of Variancest df Sig. (2-tailed)MeanDifferenceStd. ErrorDifference Lower Upper95% ConfidenceInterval of theDifferencet-test for Equality of Means

 因方差齐性,故 t=4.425,P<0.001,差异有统计学意义,按 ɑ=0.05 水准拒绝 H0,接受 H1,

 认为正常新生儿和窒息新生儿血液中的 SOD 总体平均水平不相等,窒息新生儿血液中的 SOD平均比正常新生儿的高。

  配对资料 t 检验:

 该资料属配对设计定量资料,且只有两个变量,故用配对资料 t 检验。

 1、计算差值 d 2、检验差值 d 的正态性 Tests of Normality.216 10 .200* .907 10 .258 dStatistic df Sig. Statistic df Sig.Kolmogorov-SmirnovaShapiro-WilkThis is a lower bound of the true significance.*. Lilliefors Significance Correctiona.

  K-S 正态性检验:P=0.200>0.10,表明 d 来自正态分布总体。

 3、t 检验 建立假设检验,确立检验水准:

 H0:μd=0,即新药与对照组平均瘤重相等 H1:μd≠0,即新药与对照组平均瘤重不相等 ɑ=0.05 Paired Samples Statistics.6060 10 .16854 .05330.4350 10 .10491 .03317对照组新药组Pair1Mean N Std. DeviationStd. ErrorMean

  Paired Samples Test.17100 .16576 .05242 .05242 .28958 3.262 9 .010 对照组 - 新药组 Pair 1Mean Std. DeviationStd. ErrorMean Lower Upper95% ConfidenceInterval of theDifferencePaired Diff erencest df Sig. (2-tailed)

 t=3.262,P=0.010<0.05,差异有统计学意义,按 ɑ=0.05 检验水准拒绝 H0,接受 H1,认为新药与对照组平均瘤重不相等,使用新药治疗后平均瘤重较低。

  六,方差分析

 1、完全随机设计方差分析:

 由资料可知该实验设计为完全随机设计,变量值为计量资料,各样本是相互独立的随机样本。

 (1)正态性检验 Tests of Normality.128 10 .200* .958 10 .757.174 10 .200* .913 10 .300.169 10 .200* .922 10 .378.129 10 .200* .925 10 .400group对照组低剂量组中剂量组高剂量组耐氧时间Statistic df Sig. Statistic df Sig.Kolmogorov -SmirnovaShapiro-WilkThis is a lower bound of the true significance.*. Lilliefors Significance Correctiona.

  由上表 K-S 检验知各个样本均来自正态分布总体。

 (2)方差齐性检验 Test of Homogeneity of Variances耐氧时间.954 3 36 .425LeveneStatistic df1 df2 Sig.

 F=0.425>0.10,方差齐性。

 综上,该实验设计为完全随机设计,各样本是相互独立的随机样本;各样本都来自正态总体;各总体方差相等,故采用完全随机设计方差分析比较各样本均数。

 (3)方差分析 建立假设,确立检验水准 H0:μ1=μ2=μ3=μ4,即四组小鼠平均耐氧存活时间相等; H1:μ1、μ2、μ3、μ4 不全相等,即四组小鼠平均耐氧存活时间不全相等; α=0.05 计算检验统计量如下:

 ANOVA耐氧时间767.346 3 255.782 17.528 .000525.349 36 14.5931292.695 39Between GroupsWithin GroupsTotalSum ofSquares df Mean Square F Sig.

 F=17.528,P<0.001,按 α=0.05 水准,拒绝 H0,接受 H1,认为不同剂量的茶多酚保健饮料对延长小白鼠的平均耐氧存活时间有差别。

 (4)对各个样本进行两两比较

 Multiple ComparisonsDependent Variable: 耐氧时间-.95100 1.70839 .581 -4.4158 2.5138-6.01700* 1.70839 .001 -9.4818 -2.5522-10.94900* 1.70839 .000 -14.4138 -7.4842.95100 1.70839 .581 -2.5138 4.4158-5.06600* 1.70839 .005 -8.5308 -1.6012-9.99800* 1.70839 .000 -13.4628 -6.53326.01700* 1.70839 .001 2.5522 9.48185.06600* 1.70839 .005 1.6012 8.5308-4.93200* 1.70839 .007 -8.3968 -1.467210.94900* 1.70839 .000 7.4842 14.41389.99800* 1.70839 .000 6.5332 13.46284.93200* 1.70839 .007 1.4672 8.3968-.95100 1.70839 1.000 -5.7208 3.8188-6.01700* 1.70839 .007 -10.7868 -1.2472-10.94900* 1.70839 .000 -15.7188 -6.1792.95100 1.70839 1.000 -3.8188 5.7208-5.06600* 1.70839 .032 -9.8358 -.2962-9.99800* 1.70839 .000 -14.7678 -5.22826.01700* 1.70839 .007 1.2472 10.78685.06600* 1.70839 .032 .2962 9.8358-4.93200* 1.70839 .039 -9.7018 -.162210.94900* 1.70839 .000 6.1792 15.71889.99800* 1.70839 .000 5.2282 14.76784.93200* 1.70839 .039 .1622 9.7018(J) group低剂量组中剂量组高剂量组对照组中剂量组高剂量组对照组低剂量组高剂量组对照组低剂量组中剂量组低剂量组中剂量组高剂量组对照组中剂量组高剂量组对照组低剂量组高剂量组对照组低剂量组中剂量组(I) group对照组低剂量组中剂量组高剂量组对照组低剂量组中剂量组高剂量组LSDBonf erroniMeanDif f erence(I-J) Std. Error Sig. Lower Bound Upper Bound95% Conf idence Interv alThe mean dif f erence is signif icant at the .05 lev el.*.

  耐 氧 时 间10 21.889010 22.840010 27.906010 32.8380.581 1.000 1.000group对照组低剂量组中剂量组高剂量组Sig.Student-Newman-KeulsaN 1 2 3Subset for alpha = .05Means for groups in homogeneous subsets are displayed.Uses Harmonic Mean Sample Size = 10.000.a.

  由以上两表可知 LSD,Bonferroni,S-N-K 法均表明对照组与低剂量组的平均耐氧存活时间无差异,中剂量组与其他三组的平均耐氧存活时间均有差异,高剂量组与其他三组的平均耐氧存活时间均有差异。高剂量组的平均耐氧存活时间最长,其次是中剂量组,低剂量组与对照组的平均耐氧存活时间无明显差别。

  2 2 、 随机区组设计

 由资料可知该实验设计为随机区组设计,资料为计量资料,样本量大于 2,由残差图可直观判断随机区组随机区设计资料满足方差齐性,故采用随机区组随机区组方差分析对各样本均数进行比较。

 (1)方差分析

 建立假设,确立检验水准 H0:三种不同药物作用后小鼠肉瘤重量的总体均数相等; H1:三种不同药物作用后小鼠肉瘤重量的总体均数不全相等。

 H0:各区组的总体效应相等; H1:各区组的总体效应不全相等。

 均取 α=0.05

 Tests of Between-Subjects EffectsDependent Variable: 瘤重.456 a 6 .076 7.964 .0053.092 1 3.092 323.742 .000.228 4 .057 5.978 .016.228 2 .114 11.937 .004.076 8 .0103.625 15.533 14SourceCorrected ModelInterceptgroupdrugErrorTotalCorrected TotalType III Sumof Squares df Mean Square F Sig.R Squared = .857 (Adjusted R Squared = .749)a.

  处理组(drug):F=11.9378,P=0.004<0.05,按 α=0.05 水准拒绝 H0,接受 H1,认为三种不同药物作用后小鼠肉瘤重量的总体均数不全相等。

 区间组(group):F=5.978,P=0.16>0.05,按 α=0.05 水准接受 H0,认为各区组的小鼠平均肉瘤重的差异无统计学意义。

 (2)处理组间多重比较 瘤 重Student-Newman-Keulsa,b5 .31405 .43405 .6140.088 1.000drugC药B药A药Sig.N 1 2SubsetMeans for groups in homogeneous subsets are displayed.Based on Type III Sum of SquaresThe error term is Mean Square(Error) = .010.Uses Harmonic Mean Sample Size = 5.000.a. Alpha = .05.b.

  S-N-K 法两两比较结果如上,B 药组与 C 药组间无差异,A 药组与 B 药组、C 药组均有差异,故认为 A 药作用后小鼠的平均肉瘤重量比 B、C 药作用后的重,而 B、C 药作用后小鼠的平均肉瘤重量无差异。

相关热词搜索: 复习资料 统计学 修改