(1)建立假设。
假设检验的第一步是建立两个假设:原假设 H0 和备择假设H1。
在对总体均值进行检验时,有三类假设:
H0 :μ=μ0 (或μ ≤ μ0), H1 :μ>μ0 (单边假设检验)
H0 :μ=μ0 (或μ ≥ μ0), H1 :μ<μ0 (单边假设检验)
H0 :μ=μ0 , H1 :μ≠μ0 ( 双边假设检验,即μ>μ0或μ<μ0)
(2)选择检验统计量,确定拒绝域的形式。
1)选择检验统计量:
● 若对总体的均值进行检验,用样本均值“X bar”引出检验统计量;
● 若对正太总体的方差检验,用样本方差 S² 引出检验统计量。
2)确定拒绝域的形式:拒绝域W与不能拒绝域A。
根据统计量的值把整个样本空间分为两个部分:拒绝域W与不能拒绝域A。当样本统计量的值落在拒绝域中就拒绝原假设,否则就无法拒绝原假设。所以在假设检验中必须找出拒绝域。
根据备择假设的不同,拒绝域可以是双边的也可以是单边的。在确定了拒绝域的类型后,还要确定临界值c,这应根据允许犯错误的概率来确定。
拒绝是有说服力的,无法拒绝待检验。
(3)给出检验中的显著性水平α。
在对原假设是否成立进行判断时,由于样本的随机性,判断可能产生两类错误:拒真(Ⅰ型错误或第一类错误)和取伪(Ⅱ型错误或第二类错误),它们的概率分别称为拒真概率 α 和取伪概率 β(即PH1 (A)= β ) 。
详细点描述两类错误概率为:
● 第一类错误:当实际上原假设为真时,由于样本的随机性,使样本观测值落在拒绝域W中,从而作出拒绝原假设的决定,其发生的概率称为犯第一类错误概率,也称为拒真概率,记为 α ,即PH0 (W)=α。
● 第二类错误:当实际上原假设为假时,由于样本的随机性,使样本观测值落在不能拒绝域A中,从而作为无法拒绝原假设的决定,其发生的概率称为犯第二类错误的概率,也称为取伪概率 β,即PH1 (A)= β 。
若要求犯Ⅰ型错误的概率不超过 α,由此给出的检验称为水平为 α的检验,称 α为显著性水平,常取 α为0.05,有时也可能取0.10等。
以上一节例5-1为例,为了真正理解假设检验结论的含义,应该具体地理解犯两类错误的实际意义:
● 犯第一类错误说明:如果钢筋总体平均抗拉强度实际为 μ ≤ 2000kg,平均抗拉强度并未提高,却当作了”有提高“,即 H0 实际是成立的,却拒绝了 H0 ,这就是第一类错误。通常取α=0.05作为犯第一类错误的风险概率。
● 犯第二类错误说明:如果钢筋总体平均抗拉强度实际比原来有提高了,但误认为没提高,即 H0不成立时,却没有拒绝 H0,这就是犯了第二类错误。
(4)给出临界值,确定拒绝域。
有了显著性水平α后,可以根据给定的检验统计量的分布,查表得到临界值,从而确定具体的拒绝域。
三种不同的备择假设下,拒绝域、临界值与显著性水平α的关系是不同的。
(a) H1 :μ>μ0 右侧检验:
(b) H1 :μ<μ0 左侧检验:
(c)H1 :μ≠μ0 双侧检验:
(5)根据样本测值,计算检验统计量的值。收集样本数据,计算检验统计量的值。
(6)根据检验统计量的值是否落在拒绝域中作为判断。
1)将检验统计量的值与拒绝的临界值相比较,当它落在拒绝域中就作为拒绝原假设的结论,否则就作为不能拒绝原假设的结论。
2)由检验统计量计算P值。
P值就是当原假设成立时,出现目前状况的概率(严格地说是当原假设成立时,出现目前状况或对原假设更不利情况,即对备择假设更有利状况的概率)。
当这个概率很小时(如小于0.05),这个结果在原假设成立的条件下就不该在一次试验中出现;但现在它确实出现了,因此有理由认为“原假设成立”这个前提是错的,因而应该拒绝原假设,接受备择假设。因此有一个最一般的规则:如果P<α,则拒绝原假设。
总结一下关于P值:
● P值是可以拒绝原假设接受备择假设的最小值;
● 根据样本计算出来的显著性水平;
● 若P值>α,不能拒绝H0;
● 若P值<α,拒绝H0。
3)根据样本观测值可以得到总体参数的置信区间。
如果原假设的参数值未落入此置信区间,就作出拒绝原假设的结论,否则就作出保留原假设的结论。