龙永红概率统计54.ppt
5 4假设检验概述 一 假设检验问题的提法 二 假设检验的思想和原理 三 假设检验的一般步骤 四 检验的显著性水平与两类错误 五 多参数与非参数假设检验问题 一 假设检验问题的提法 引例 例5 20某厂生产的一批产品 其出厂标准为 次品率不超过4 现抽测60件产品 发现有3件次品 问这批产品能否出厂 若以X记一次抽测的结果 X 1与X 0分别表示抽到正品与次品 则X为伯努利总体且P X 1 p 这里p为次品率 问题转化为判断是否有p 4 我们把它称为一个假设 一 假设检验问题的提法 引例 例5 20某厂生产的一批产品 其出厂标准为 次品率不超过4 现抽测60件产品 发现有3件次品 问这批产品能否出厂 根据问题 知次品率p是未知的 样本的次品率为3 60 5 但我们不能简单地根据样本的次品率5 认定次品率超过4 而必须提出合理的方法去判断假设是否成立 我们要利用样本去判断假设p 4 是否成立 例5 21某厂宣称已采取大力措施治理废水污染 根据经验 废水中所含某种有毒物质的浓度X 单位 mg kg 服从正态分布 现环保部门抽测了9个水样 测得样本平均值为 x 17 4 样本标准差为s 2 4 以往该厂废水中有毒物质的平均浓度为18 2 试问有毒物质的浓度有无显著变化 根据问题 知X N 2 其中 2均是未知的 正常情况下 18 2 样本平均值为 x 17 4 直观上看 有毒物质的浓度有所降低 但这种差异也有可能是抽样的随机性造成的 问题可转化为判断是否有 18 2 我们要利用样本去判断假设 18 2是否成立 例5 22随机抽测了50名2000年1月出生的男婴的体重 希望确定男婴的体重X是否服从正态分布 设F x 为X的分布函数 同样先提出假设 F x 是N 2 分布 然后利用样本去判断假设是否成立 例5 21某厂宣称已采取大力措施治理废水污染 根据经验 废水中所含某种有毒物质的浓度X 单位 mg kg 服从正态分布 现环保部门抽测了9个水样 测得样本平均值为 x 17 4 样本标准差为s 2 4 以往该厂废水中有毒物质的平均浓度为18 2 试问有毒物质的浓度有无显著变化 对总体分布函数的类型或分布函数中的参数提出假设 希望通过抽样并根据样本提供的信息对假设是否成立进行推断 这类问题即是统计推断的另一类基本问题 假设检验 假设检验 在假设检验问题中 我们把任何一个有关总体未知分布的假设称为统计假设 简称假设 统计假设 通常把待检验的假设称为原假设或零假设 记为H0 与之对立的假设则称为备择假设或对立假设 记为H1 通常把待检验的假设称为原假设或零假设 记为H0 与之对立的假设则称为备择假设或对立假设 记为H1 对总体分布函数的类型或分布函数中的参数提出假设 希望通过抽样并根据样本提供的信息对假设是否成立进行推断 这类问题即是统计推断的另一类基本问题 假设检验 假设检验 统计假设 比如上述三例假设问题可分别简述为 H0 p 4 H1 p 4 H0 18 2 H1 18 2 H0 F x 是N 2 分布 H1 F x 不是N 2 分布 总体的分布类型是已知的 未知的只是其中的一个或几个参数 统计假设只与这些未知参数有关 我们称为参数假设 相应的检验称为参数假设检验 总体的分布类型也是未知的 在这种情形往往需要直接针对总体分布的具体形式或总体分布的某些特征提出假设 我们称此类假设为非参数假设 相应的检验称为非参数假设检验 参数假设检验与非参数假设检验 二 假设检验的思想和原理 我们可以对照确定性论证中的反证法 如果条件A成立导出一个矛盾的或不可能成立的结论B 那么A就是错误的 假设检验的一般思想 统计上的假设检验不可能像反证法一样导出确定的结论 但论证的逻辑却相似 它依据的是小概率原理 如果H0成立导致一个小概率事件发生了 那么我们就拒绝假设H0 二 假设检验的思想和原理 检验的显著性水平是根据具体问题需要事先确定的一个很小的正数 比如0 01 0 05 0 10等 假设检验的一般思想 检验的显著性水平 要实施检验 首先要确定小概率的大小 这一小概率在假设检验中称为检验的显著性水平 通常记作 统计上的假设检验不可能像反证法一样导出确定的结论 但论证的逻辑却相似 它依据的是小概率原理 如果H0成立导致一个小概率事件发生了 那么我们就拒绝假设H0 二 假设检验的思想和原理 假设检验的一般思想 检验的显著性水平 要实施检验 首先要确定小概率的大小 这一小概率在假设检验中称为检验的显著性水平 通常记作 对给定的显著性水平 我们要确定一个由样本所描述的概率不超过显著性水平 的小概率事件 这一小概率事件对应的样本取值区域通常称为假设检验的拒绝域 拒绝域 二 假设检验的思想和原理 对给定的显著性水平 我们要确定一个由样本所描述的概率不超过显著性水平 的小概率事件 这一小概率事件对应的样本取值区域通常称为假设检验的拒绝域 拒绝域 一旦样本观察值落入拒绝域 便拒绝零假设 否则 不能拒绝零假设 为确定拒绝域 需要构造一个含待检验参数 分布已知的枢轴量 通过枢轴量的已知分布并结合零假设确定拒绝域 三 假设检验的一般步骤 检验的一般步骤 1 建立零假设H0 2 构造一个含待检参数 不含其他未知参数 且分布已知的枢轴量u X1 X2 Xn 并确定其分布 3 对给定的显著性水平 由上述枢轴量及其分布 结合零假设H0 确定拒绝域C 使得P X1 X1 Xn C H0 5 6 4 根据样本值 x1 x1 xn 是否落在C中作出是否拒绝H0的统计决断 如果 x1 x2 xn C 则拒绝H0 如果 x1 x2 xn C 则不能拒绝H0 例5 23已知X N 2 其中 2均是未知的 n 9 x 17 4 s 2 4 试在 0 05的显著性水平下检验H0 18 2 解 1 建立零假设H0 18 2 其中t0 025 8 2 306 于是拒绝域为 例5 23已知X N 2 其中 2均是未知的 n 9 x 17 4 s 2 4 试在 0 05的显著性水平下检验H0 18 2 解 3 于是拒绝域为 4 因为观察到的样本值 x1 x1 xn 满足 样本值不在拒绝域中 不能拒绝H0 18 2 即不能认为有毒物质浓度有明显变化 四 检验的显著性水平与两类错误 一般说来 统计推断的特点是由样本提供的信息来推断总体 这样 推断时所下的结论未必总是正确的 四 检验的显著性水平与两类错误 两类错误 如果零假设H0事实上是成立的 但却因样本观察值落入拒绝域而拒绝了零假设H0 这便犯了弃真错误 通常称为第一类错误 如果零假设H0不成立 却因样本的观测值落入接受域 而接受了零假设H0时 便犯了纳伪错误 通常称为第二类错误 显著性水平的作用 零假设H0成立时 拒绝零假设的概率至多为显著性水平 这表明犯第一类错误的概率至多为 从而说明检验的显著性水平是用以控制犯第一类错误的概率的 说明 不能认为显著性水平 取得越小 假设检验的准确程度就越高 因为显著性水平只是用来控制犯第一类错误的概率 而在假设检验中还存在着犯第二类错误的可能性 一般来说 当样本容量给定时 在降低显著性水平的同时 往往会增大犯第二类错误的可能性 通常的做法是事先给定显著性水平 来限制犯第一类错误的概率 再通过选取好的检验方法尽可能减少犯第二类错误的概率 五 多参数与非参数假设检验问题 前面介绍的所有内容也适用于多参数假设检验或非参数假设检验问题 只需在若干细节上作适当调整即可 1 对于多参数假设检验问题 可寻求一个包含所有待检验参数的枢轴量 并使之服从或渐近地服从一个已知的确定分布 2 非参数假设检验问题可近似地化为一个多参数假设检验问题来解决