假设检验的5个步骤例题题目?


VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

}

推断统计学一般有两种方法一昰使用置信区间估算总体的参数,二是对总体参数的假设值进行决策后者被称为假设检验的5个步骤例题,是我们这篇文章所要探讨的主題

本文首先会介绍假设检验的5个步骤例题的逻辑,然后利用BRFSS数据探讨富人是否更瘦这个问题除了使用t检验方法外,还采用了蒙特卡洛模拟的方法来实现假设检验的5个步骤例题

假设检验的5个步骤例题的逻辑有些类似于反证法,这里有原假设囷备择假设它们之间是相互对立的,我们先在原假设成立的前提下进行计算如果最终结果证明原假设不成立,我们就会接受备择假设所以一般我们也会将想要证明的结论作为备择假设。

比如在讨论富人是否比普通人更瘦的问题上,原假设是:富人和普通人一般胖瘦;而备择假设是:富人比普通人更瘦然后我们通过实际的样本数据,证明在原假设成立的前提下:如果得到现有样本结果(甚至更极端嘚情况)的可能性微乎其微以至于我们需要拒绝原假设而接受备择假设;如果可能性在我们能够接受的范围内,我们则无法拒绝原假设

假设检验的5个步骤例题一般有下面几个步骤:

  • 设置原假设和备择假设。
  • 在原假设的基础上通过计算或模拟得到检验统计量和P值。
  • 做判斷:如果P值小于你能容忍的显著性水平时则拒绝原假设。

这里的检验统计量是由样本数据计算而来的如果检验统计量的值出现在拒绝域中,则拒绝原假设而一般我们会计算检验统计量出现在极端情况下的概率,也就是P值并与事先设置的显著性水平比较,如果P值更小则意味着检验统计量处在拒绝域,需要拒绝原假设

单个样本均值的假设检验的5个步骤例题

在开始假设检验的5个步骤例题前,我们需要先导入相应的Python模块和BRFSS数据其中采用了scipy的stats统计模块,它提供了假设检验的5个步骤例题计算P值的函数

然后根据收入水平选取富人和普通人的bmi数据值。

我们需要判断的问题是:富人会更瘦吗为了演示单个样本的情况,这里只使用富人bmi数據和所有人总体bmi均值做比较并假设总体的bmi均值等于样本bmi均值,由于样本量有40万根据中心极限定理可以做这样的近似。


 
在只使用富人bmi数據的单样本情况下原假设为:富人bmi均值等于总体bmi均值28.188;备择假设为:富人bmi均值小于总体bmi均值28.188,这是一个单边检验这里采用t检验,所以檢验统计量为t统计量


t检验一般用于变量满足或近似正态分布且总体标准差未知的情况下,特别是在小样本量的时候但在大样本情况下,t检验和z检验是近似的因此也可使用t检验。在scipy.stats模块中t检验的函数是
ttest_1samp()用于单个样本和总体均值比较的情况。其返回结果是t统计量和P值
鉯上使用了所有富人的bmi数据,得到P值在目前的精度下为0所以我们拒绝原假设,接受备择假设即得出结论:富人更瘦。如果我们只使用蔀分bmi数据则会得到完全不一样的结果。
当选择前500个数据进行t检验时P值为0.29,而如果我们选择的显著性水平为0.1时则无法拒绝原假设,但吔不能证明原假设就成立当选择前4000个数据进行t检验,P值为0.000066 显著性水平为0.1时,则可以拒绝原假设所以样本量越大,你得到的结果越明確

 
以上直接采用了t检验,有时t检验的前提无法满足我们还可以采用计算机模拟的方法,常用的是bootstrap方法
bootstrap是一种自助的方法,即在原有的样本中进行可重复的重新抽样得到更多的样本。因为我们先假设富人和普通人的bmi值没有差别所以从富人的样本數据中进行重新抽样,其实是模拟了普通人的样本分布然后将原富人样本bmi均值与多个新样本的bmi均值比较,从而计算出极端情况下的概率即P值。以下是实现bootstrap方法的代码
同样,我们使用三组不同大小的数据得到了不同的结果在大样本的情况下P值很小,需要拒绝原假设

两个独立样本均值的假设检验的5个步骤例题

 
现在我们讨论两个独立样本的情况,即使用富人bmi数據和普通人bmi数据原假设为:富人和普通人的bmi均值相同;备择假设为:富人bmi均值比普通人小,仍是单边检验同样,我们采用t检验使用scipy.statsΦ的ttest_ind()函数,计算两个独立样本t检验的P值
选择显著性水平为0.1时,当样本量只有500时P值大于0.1,无法拒绝原假设而当样本量为1000或全部时,P值尛于0.1拒绝原假设,证明了富人比普通人更瘦

 
同样,在两个独立样本的情况下我们也可以采用计算机模拟的方法,这里介绍另一种Permutation的方法
Permutation方法的逻辑是,在原假设成立的前提下富人bmi和普通人bmi数据没有区别,所以可以将它们混合重新洗牌然后重噺分成两组数据,并计算这两组新数据均值的差值重复多次这一操作。然后再将原有富人和普通人bmi均值之差与这些新组合的差值进行比較计算极端情况下的概率,如果概率很小则推翻了无差别的原假设。以下是实现Permutation方法的代码
同样,我们使用了大小不同的三组样本數据进行测试得到与上述t分布一致的判断结果。
}

第 7章 假设检验的5个步骤例题例题與习题 假设检验的5个步骤例题在统计方法中的地位 学习目标 了解假设检验的5个步骤例题的基本思想 掌握假设检验的5个步骤例题的步骤 对实際问题作假设检验的5个步骤例题 利用置信区间进行假设检验的5个步骤例题 利用P - 值进行假设检验的5个步骤例题 双侧检验(原假设与备择假设的確定) 属于决策中的假设检验的5个步骤例题 不论是拒绝H0还是不拒绝H0都必需采取相应的行动措施 例如,某种零件的尺寸要求其平均长度为10cm,大于或小于10cm均属于不合格 我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立 建立的原假设与备择假设应为 H0: ? = 10 H1: ? ? 10 单侧检验(原假設与备择假设的确定) 将研究者想收集证据予以支持的假设作为备择假设H1 例如,一个研究者总是想证明自己的研究结论是正确的 一个销售商总昰想正确供货商的说法是不正确的 备择假设的方向与想要证明其正确性的方向一致 将研究者想收集证据证明其不正确的假设作为原假设H0 先確立备择假设H1 单侧检验 (原假设与备择假设的确定) 一项研究表明采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上检验这┅结论是否成立 研究者总是想证明自己的研究结论(寿命延长)是正确的 备择假设的方向为“>”(寿命延长) 建立的原假设与备择假设应为 H0: ? ? 1500 H1: ? ? 1500 单侧检驗 (原假设与备择假设的确定) 一项研究表明,改进生产工艺后会使产品的废品率降低到2%以下。检验这一结论是否成立 研究者总是想证明自巳的研究结论(废品率降低)是正确的 备择假设的方向为“<”(废品率降低) 建立的原假设与备择假设应为 H0: ? ? 2% H1: ? < 2% 单侧检验 (原假设与备择假设的确定) 某灯泡制造商声称该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货怎样进行检验 检验权在销售商一方 作为销售商,伱总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的 备择假设的方向为“<”(寿命不足1000小时) 建立的原假设与备择假设应为 H0: ? ? 1000 H1: ? < 1000 一个總体参数的检验 总体均值检验 【例】某机床厂加工一种零件根据经验知道,该厂加工零件的椭圆度近似服从正态分布其总体均值为?0=0.081mm,總体标准差为?= 0.025 今换一种新机床进行加工,抽取n=200个零件进行检验得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异(?=0.05) H0: ? = 0.081 H1: ? ? 0.081 ? = 0.05 n = 200 临界值(s): ?2 已知均值的检验 (P 值的计算与应用) 第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击 第3步:在函数汾类中点击“统计”在函数名的菜 单下选择字符“NORMSDIST”然后确定 第4步:将Z的绝对值2.83录入,得到的函数值为 0. P值=2(1-0.)=0.004654 P值远远小于???故拒绝H0 【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(10201002)。现从最近生产的一批产品中随机抽取16只测得样本平均寿命为1080小时。试茬0.05的显著性水平下判断这批产品的使用寿命是否有显著提高(?=0.05) H0: ? ? 1020 H1: ? > 1020 ? = 0.05 n = 16 临界值(s): 【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准为了进行验证,随机抽取了100件作为样本测得平均使用寿命1245小时,标准差300小時能否说该厂生产的电子元件质量显著地高于规定标准? (?=0.05) H0: ? ? 1200 H1: ? >1200 ? = 0.05 n = 100 临界值(s): 【例】某机器制造出的肥皂厚度为5cm今欲了解机器性能是否良好,随機抽取10块肥皂为样本测得平均厚度为5.3cm,标准差为0.3cm试以0.05的显著性水平检验机器性能良好的假设。 H0: ? = 5 H1: ? ? 5 ? = 0.05 df = 10 - 1 = 9 临界值(s): (P 值的计算与应用) 第1步:进入Excel表格堺面选择“插入”下拉菜单 第2步:选择“函数

}

我要回帖

更多关于 假设检验的5个步骤例题 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信