有老玩 家就知道玩吗认4组6怎么中奖?

百度拇指医生
&&&普通咨询
您的网络环境存在异常,
请输入验证码
验证码输入错误,请重新输入上海天天选4,组选24中3个号码有奖金吗?_百度知道
上海天天选4,组选24中3个号码有奖金吗?
您的回答被采纳后将获得:
系统奖励15(财富值+成长值)+难题奖励30(财富值+成长值)
我有更好的答案
为您推荐:
其他类似问题
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。期 1 2 2 4 (组选12) 2 4 6 8 (组选24) 请问大家我中奖了没? 分别中多少? 再问具体怎样玩?_百度知道
期 1 2 2 4 (组选12) 2 4 6 8 (组选24) 请问大家我中奖了没? 分别中多少? 再问具体怎样玩?
我有更好的答案
其他3条回答
为您推荐:
其他类似问题
成人纸尿裤的相关知识
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
平均值的标准误 (SE Mean)
度量样本平均值多大精确程度地估计总体平均值,并用于创建总体平均值的置信区间。SE Mean 值越小,表示对总体平均值的估计越精确。
SE Mean 等于样本标准差 (s) 除以样本大小 (n) 的平方根。因此:
标准差越大,产生的 SE Mean 越大。
样本大小越大,产生的 SE Mean 越小。
例如,根据 312 个交货时间的随机样本,得到平均交货时间为 3.80 天,标准差为 1.43 天。这些数字产生的 SE Mean 为 0.08 天(1.43 除以 312 的平方根)。如果从相同总体中抽取大小相同的多个随机样本,则这些不同样本平均值的标准差将大约为 0.08 天。
SE Mean 可用于创建总体平均值的置信区间。例如,根据样本大小,95% 的置信区间将从样本平均值向外展开大约 +/- 两个 SE Mean。对于此示例,95% 置信区间将为 (3.64, 3.96) 天。真实总体平均值落于此范围内的置信度为 95%。
SE Mean 估计样本之间的变异性,而标准差则度量单个样本内的变异性
一种相对变异性的度量,等于标准差除以均值(Minitab 会将所得的商乘以 100)。因为它是一个无量纲数,所以可以用来比较均值显著不同的总体的离散性。
例如,您是一家牛奶瓶装厂的质量控制检验员,该厂的牛奶有大瓶装和小瓶装两种。您抽取每种产品的样本并观测到小瓶装的平均容量为 1 杯,标准差为 0.08 杯,大瓶装的平均容量为 1 加仑(16 杯),标准差为 0.4 杯。虽然大瓶加仑装的标准差是小瓶装的标准差的 5 倍,但它们的变异系数 (COV) 却支持不同的结论:
大瓶装 小瓶装
0.4 杯 / 16 杯 = 2.5 COV = 100
0.08 杯 / 1 杯 = 8
小瓶装的变异系数是大瓶装的三倍多。也就是说,虽然大瓶装具有较大的标准差,但小瓶装相对于其均值来说具有更大的变异性。
均方递差 (MSSD)
作为方差估计值使用。它是通过将连续观测值之间的平方差相加,然后再用所得和除以 2 计算得出。
两种常见应用为:
基本统计量  均方递差的一种常见应用是用于检验一个观测值序列是否是随机的。在此检验中,是将估计的总体方差与均方递差进行比较。
质量控制  另一种应用是当子组大小为 1 时作为方差估计值使用。对于单值、CUSUM、EWMA 和移动平均控制图,Minitab 默认使用平均移动极差法来估计标准差。对于您无法假定两个连续点形成一个合理子组并使用移动极差法的情况,均方递差法可作为替代方法。要作为标准差的估计值使用,请计算均方递差的平方根。
计算均方递差
例如,假设您正在收集使用机器注装小瓶 MMR 接种疫苗的数据。您要确保机器是随机分配的,即不存在任何特殊变异原因。
12 个小瓶的注装量分别为:
0.50 毫升 0.48 毫升 0.49 毫升 0.50 毫升
0.505 毫升 0.50 毫升 0.49 毫升 0.498 毫升
0.50 毫升 0.479 毫升 0.49 毫升 0.51 毫升
均方递差 =
 (Xi + 1  Xi)2
2 (n  1)
要手工执行此计算,可以将 0.50 毫升减去 0.48 毫升获得第一个差值 (0.02)。将 0.48 毫升减去 0.49 毫升获得第二个差值 (&#)。继续这一过程直至得到 11 个差值。将每个差值平方后相加。将所得和除以 22 或 2x(n-1)。
用于通过单个数据值来评估和比较样本分布,这些值可以选择按类别变量分组。单值图还可以帮助您查找编码值中的明显错误。下图显示了用三种不同橡胶配方制成的橡胶带的弹性。当从左到右对它们进行比较时,您可以看到,尽管不同配方橡胶的弹性平均值在增大(由各组之间连接的蓝色符号标注),但第三组中变异(即各组中点的散布程度)的增加相当显著。(非正式)标识异常值和分布形状时,单值图类似于箱线图,其不同之处在于它单独为每个值绘制一个图。当观测值相对较少或需要评估每个观测值的效应时,单值图特别有用。
Fisher 精确检验
检验两个二进制变量是否是独立的。该检验可以分析 2x2 列联表,并产生精确的 p 值,以检验以下假设:
H0:行变量和列变量是独立的
H1:行变量和列变量是相关的
Fisher 精确检验中的 p 值对于所有样本大小都是准确的,而当单元格计数较小时,用于检查相同假设的卡方检验的结果可能不准确。
例如,可以使用 Fisher 精确检验来分析下面的竞选结果列联表,以确定投票是否独立于投票人的性别。
候选人 A 候选人 B
男性 21 35
对于该表,Fisher 精确检验产生的 p 值为 0.263。由于该 p 值大于常用的  水平,因此数据与原假设一致。因而,没有证据表明在竞选中投票人的性别会影响其选择。
您还可以使用 Fisher 精确检验来确定两个总体比率是否相等。对于此应用,原假设假定两个总体比率是相等的 (H0:p1= p2);备择假设可以是左尾 (p1& p2)、右尾 (p1 & p2),或双尾 (p1 ≠ p2)。Fisher 精确检验作为两个比率的检验十分有用,因为它对于所有样本大小都是准确的,而当事件数小于 5 时,以及试验数减去事件数的结果小于 5 时,基于正态近似的 2 个比率的检验可能不准确。
Fisher 精确检验基于超几何分布。因此,p 值在表的边际合计中是有条件的。
Poisson 过程描述某一事件在给定的时间、面积、体积等范围内的出现次数。
正态性检验
确定您绘制样本所基于的总体是否呈非正态分布的单样本假设检验。许多统计过程均依赖于总体正态性,且使用正态性检验确定否定此假设是不是分析中的重要步骤。正态性检验的原假设假定总体为正态分布。备择假设假定总体为非正态分布。要确定样本数据是否来自非正态总体,您可以从四种检验中进行选择。
您可以使用正态概率图来评估总体正态性,如果样本的总体呈正态分布,该图将根据您期望它们接近的值绘制顺序数据值。如果总体呈正态分布,绘制的点将大致形成一条直线。
Anderson-Darling 检验
此检验是将样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进行比较。如果实测差异足够大,该检验将否定总体呈正态分布的原假设。
Ryan-Joiner 正态性检验
此检验通过计算数据与数据的正态分值之间的相关性来评估正态性。如果相关系数接近 1,则总体就很有可能呈正态分布。Ryan-Joiner 统计量可以评估这种相关性的强度;如果它未达到适当的临界值,您将否定总体呈正态分布的原假设。此检验类似于 Shapiro-Wilk 正态性检验。
Kolmogorov-Smirnov 正态性检验
此检验是将样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进行比较。如果实测差异足够大,该检验将否定总体呈正态分布的原假设。
如果这些检验的 p 值低于您选择的  水平,您可以否定原假设并断定总体呈非正态分布。
“粗笔检验”
一种非正式的近似正态性检验,称为“粗笔检验”,常应用于概率图。想象有一支“粗笔”从拟合线上划过:如果它覆盖了图中的所有数据点,则数据可能为正态分布;如果图中的点距离拟合线很远以致粗笔边缘之外还有很多点,则数据可能为非正态分布。这种非正式的方法并不能代替正态性检验的统计推断,但它可以作为一种有用的快速直观评估方式。在下列图形中,将粗笔检验应用到了上面的概率图中。灰色带形就表示在拟合线上划的粗笔。
卡方统计量
数据的分布与所选择的预期或假设分布之间的差异的度量。例如,它可用于:
检验类别变量之间的独立性或确定关联性。例如,如果有一个按投票者性别分类的选举结果的双因子表,卡方统计量可帮助确定投票是否独立于投票者的性别,或者在投票与性别之间是否存在关联。如果与卡方统计量相关联的 p 值小于选定的  水平,检验将拒绝两个变量彼此独立的原假设。
确定某个统计模型是否能够充分拟合数据。例如,Logistic 回归将计算卡方统计量以评估模型的拟合情况。如果与卡方统计量相关联的 p 值小于选定的  水平,检验将拒绝模型与数据相拟合的原假设。另一个示例是“基本统计量”菜单中的用于 Poisson 数据的拟合优度检验,它使用卡方统计量来确定数据是否服从 Poisson 分布。
最小二乘和极大似然估计法
用于估计随机样本中的总体参数的两种不同方法。主要是在 Minitab 的可靠性命令和分析变异性中需要在这两种方法之间进行选择。
最小二乘法
最小二乘估计值是通过将回归线拟合到数据集中的点来计算的,这些数据集具有最小的平方差和(最小二乘误)。在可靠性分析中,该值标绘在概率图中,这样更容易进行解释。
极大似然法
似然函数指明了观测的样本作为可能参数值函数的几率有多大。因此,通过最大化似然函数,可以确定最可能产生观察数据的参数。从统计学观点来看,一般建议对大样本使用 MLE,因为此方法是通用的,适用于大多数模型和不同类型的数据,而且会产生最精确的估计值。
在许多情况下,LS 和 MLE 结果之间的差异非常小,因而这两种方法可以互换使用。您可能希望同时运行这两种方法并查看其结果是否可以相互印证。如果结果不同,您可能希望找出其中原因。如果不一致,您也可以使用更保守的估计值,或者考虑两种方法的优点,然后再针对您的问题做出选择。一种方法优越于另一种方法体现在某些方面:
偏倚 否 是(对于小样本),但会随着样本大小的不断增加而降低
估计方差 较大 较小
P 值 精确度较高 精确度较低
系数 精确度较低 精确度较高
删失数据 可靠性较低,在极端情况下不可用 甚至在极端情况下可靠性也较高
如果样本大小较小且删失不是特别严重,请使用 LSE。否则,一般情况下会首选 MLE 估计值。根据其相对强度,可以对分析的不同部分一同使用 LSE 和 MLE。请使用 LSE 的更精确的 p 值来选择要在模型中包括的项,并使用 MLE 估计最终系数。
用于检查回归和方差分析中模型的拟合优度。检查残差图有助于确定是否满足普通最小二乘假设。如果满足这些假设,则普通最小二乘回归将产生方差最小的无偏系数估计。Minitab 提供以下残差图:
残差的直方图。一种显示残差的一般特征(包括典型值、展开和形状)的研究性工具。一侧的长尾可能表示偏斜分布。如果有一个或两个条形与其他条形距离较远,则这些点可能是异常值。
残差的正态概率图。如果残差呈正态分布,则此图中的点一般应该形成一条直线。如果图中的点不能形成一条直线,则正态性假设可能不成立。
残差与拟合值。此图应显示残差在 0 两侧的随机模式。如果某个点远离大多数点,则该点可能是异常值。残差图中也不应该有任何可识别的模式。例如,如果残差值的展开倾向于随拟合值增大,则可能违反方差恒定这一假设。
残差与数据顺序。这是一个所有残差以收集数据的顺序排列的图,可以用于找出非随机误差,特别是与时间相关的效应。此图有助于检查残差彼此不相关这一假设。
残差与预测变量。这是残差与预测变量的图。此图应显示残差在 0 两侧的随机模式。非随机模式(如右侧的示例)可能违反预测变量与残差无关这一假设。用于对弯曲建模的函数形式可能不正确。 残差
用于回归和 DOE,失拟检验评估模型的拟合度。如果 p 值小于您选择的  水平,则证明模型未能与数据准确拟合。您可能需要添加项,或者变换数据,以便更准确地为数据建模。Minitab 计算两种类型的失拟检验:
纯误差失拟检验:如果您的数据包含仿行(多个观测值具有相同的 x 值)而且您要简化模型,请使用此检验。 仿行表示“纯误差”,因为只有随机变异才能导致观测响应值之间出现差异。如果要简化模型,而且生成的失拟 p 值小于您选择的  水平,则应保留已从模型中删除的项。
数据子集失拟检验:如果数据不包含仿行,而且要确定是否准确地为曲率建立了模型,请使用此检验。此方法将识别数据中的曲率以及可能影响模型拟合度的自变量之间的交互作用。只要数据子集的 p 值小于  水平,Minitab 就会显示消息“变量 %1 中的可能曲率(P 值 = 0.006)”。这证明该曲率没有被正确建模。在散点图中对原始数据进行检查后,您可以尝试包括一个高次项为该曲率建模。
识别异常值
异常值 是大于平均响应值或预测变量值的观测值。Minitab 提供了几种识别异常值的方法,包括残差图和三种存储统计量:杠杆率 、Cook 距离 以及 DFITS ,下面将分别加以介绍。 识别异常值非常重要,因为它们会显著影响 模型,从而有可能形成误导或导致不正确的结果。如果在数据中识别出异常值,应该检查测量值以了解它为什么异常,并做出相应的补救。
杠杆率值告诉我们,与其余数据相比,某个观测值是否具有异常预测变量值。杠杆率度量某个观测值的 x 值与所有观测值的 x 值的均值之间的距离。杠杆率值大表示某个观测值的 x 值离所有观测值的 x 值的中心位置远。具有大杠杆率的观测值可能对拟合值进而对回归模型产生相当大的影响。
杠杆率值介于 0 到 1 之间。大于 2p/n 或 3p/n(其中,p 为预测变量加上常量的数目,n 为观测值的个数)的杠杆率值被视为大杠杆率,应该对其进行检查。Minitab 会在异常观测值表中用 X 标识杠杆率大于 3p/n 或 0.99(以较小者为准)的观测值。
Cook 距离或 D 从总体上度量各个观测值对拟合值的综合影响。由于 D 是使用杠杆率值和标准化残差计算的,因此在分析某个观测值是否异常时它会同时考虑 x 值和 y 值。从几何角度看,Cook 距离度量的是使用 ith 观测值计算的拟合值与不使用 ith 观测值计算的似合值之间的距离。表示异常观测值的大值之所以会出现,是因为观测值具有 1) 大残差和中等杠杆率,2) 大杠杆率和中等残差,或 3) 大残差和大杠杆率。一些统计学家建议将 D 与 F 分布 (p, n-p) 进行比较。如果在第 50 个百分位数处 D 大于 F 值,则认为 D 相当大,应该对其进行检查。另外一些统计学家则建议将 D 统计量相互对比,从而识别出比其他值大很多的值。有一种简单的 D 值比较方法,就是使用图形 & 时间序列将它们绘制出来,其中 x 轴表示观测值而不是索引或时间周期。
DFITS 提供了另一种确定某个观测值是否异常的度量方式。它使用杠杆率和删后(t 化)残差来计算使用和不使用 ith 观测值计算的拟合值之间的差异。DFITS 粗略表示将 ith 观测值从数据中删除后,拟合值改变的估计标准差的数量。一些统计学家认为,DFITS 值大于 sqrt(2p/n) 的观测值为有影响的观测值。另外一些统计学家则建议将 DFITS 值相互对比,从而识别出比其他值大很多的值。有一种简单的 DFITS 值比较方法,就是使用图形 & 时间序列将它们绘制出来,其中 x 轴表示观测值而不是索引或时间周期。
t 化删后残差
有助于检测异常值。计算观测值的 t 化删后残差的方法是将观测值的删后残差除以其标准差的估计值。删后残差 di 是 yi 与其在模型中的拟合值之差,该拟合值在计算中忽略了第 i 个观测值。忽略观测值是为了确定没有此潜在异常值时模型的行为。如果观测值的 t 化删后残差较大(如果其绝对值大于 2),则它可能是数据中的异常值。
标准化残差很有用,因为原始残差的方差不恒定,因此无法很好地指示异常值:相应 X 值远离
的残差的方差比相应 X 值接近
的残差的方差要大。将此非恒定方差的对照物 t 化,所有 t 化残差就具有相同的标准差。
每个 t 化删后残差都服从具有 (n – 1 – p) 个自由度的 t 分布,其中 p 等于回归模型中的项数。
t 化删后残差也称为外部 t 化残差或删后 t 残差。
标准化残差
有助于检测异常值。标准化残差等于残差值 ei 除以其标准差的估计值。通常将大于 2 和小于 2 的标准化残差视为较大,Minitab 在异常观测值表以及拟合值与残差表中以 &R& 标记这些观测值。
标准化残差很有用,因为原始残差的方差不恒定,因此无法很好地指示异常值:相应 X 值远离
的残差的方差比相应 X 值接近
的残差的方差要大。将此非恒定方差的对照物标准化,所有标准化残差就具有相同的标准差。
标准化残差也称为内部 t 化残差。
残差类型... 在下列情况下选择...
使用数据的原始尺度检查残差
响应 - 拟合值
标准化 使用大拇指规则识别与模型拟合不佳的观测值。如果标准化残差的绝对值大于 2 就将算作大残差。Minitab 会在一个异常观测值表(标记为 R)中显示这些观测值。
(残差)/(残差的标准差)
删后 t 化 标识与模型拟合不佳的观测值。删除观测值会影响方差估计,也会影响参数估计。绝对值很大的 t 化残差表明,模型中包括该观测值可能会增大误差方差,或者它对参数估计会产生很大影响,或者两种情况都存在。 
(残差)/(残差的标准差)。在删除第 i 个观测值的情况下计算第 i 个 t 化残差。
Anderson-Darling 统计量
测量数据服从特定分布的程度。分布与数据拟合越好,此统计量越小。使用 Anderson-Darling 统计量可比较若干分布的拟合情况,以查看哪种分布是最佳分布,或者检验数据样本是否来自具有指定分布的总体。例如,可以使用 Anderson-Darling 统计量为可靠性数据分析在 Weibull 和对数正态分布之间进行选择,或者检验数据是否符合 t 检验的正态性假设。
Anderson-Darling 检验的假设如下:
H0:数据服从指定分布
H1:数据不服从指定分布
如果 Anderson-Darling 检验的 p 值(如果可用)低于选定的显著性水平(通常为 0.05 或 0.10),则可以得出结论:数据不服从指定分布。Minitab 并不始终为 Anderson-Darling 检验显示 p 值,因为某些情况下它在数学意义上并不存在。
如果尝试确定数据服从哪种分布,并且您具有多个 Anderson-Darling 统计量,通常可通过比较来作出正确选择。具有最小 Anderson-Darling 统计量的分布与数据最为拟合。如果分布具有相似的 Anderson-Darling 统计量,可基于实践经验选择一种分布。
某些命令会生成调整的 Anderson-Darling(或 AD*)统计量。未调整的 Anderson-Darling 统计量使用基于计算标绘点的 Kaplan-Meier 方法的非参数阶梯函数,而调整的 Anderson-Darling 统计量使用其他方法来计算标绘点。
方差膨胀因子 (VIF)
表示回归分析中存在多重共线性(预测变量之间的相关性)的程度。多重共线性会产生问题,因为它可以增大回归系数的方差,从而使其不稳定或难以解释。
方差膨胀因子 (VIF) 度量相对于预测变量不线性相关时,估计回归系数的方差膨胀多大。使用以下准则解释 VIF:
方差膨胀因子 预测变量为...
VIF = 1 不相关
1& VIF & 5 中等相关
VIF & 5 至 10 高度相关
VIF 值大于 10 可能表明多重共线性过度影响了回归结果。在此情况下,可能要通过从模型中去除不重要的预测变量来减小多重共线性。
Durbin-Watson 统计量
检验残差中是否存在自相关。自相关表示相邻观测值是相关的。 如果它们是相关的,那么最小二乘回归低估了系数的标准误;此时,您的预测变量似乎非常显著,其实可能是不显著的。
例如,来自每日股票价格数据回归的残差可能取决于以前的观测值,因为前一天的股票价格会影响第二天的价格。
Durbin-Watson 统计量以观测值的顺序(行)为条件。Minitab 假设观测值遵循有意义的顺序(如时间顺序)。Durbin-Watson 统计量确定相邻误差项之间的相关性是否为零。要从检验中得出结论,需要将显示的统计量与表中的上下限进行比较。如果 D & 上限,表示不存在相关性;如果 D & 下限,表示存在正相关性;如果 D 在上下限之间,则无法从检验中得出结论。
多重共线性
在回归中,多重共线性是指与其他预测变量相关的预测变量。适度的多重共线性可能不会导致问题。但是,严重的多重共线性可能会产生问题,因为它可以增大回归系数的方差,使它们变得不稳定而且难以解释。
要度量多重共线性,可以检查预测变量的相关性结构。您也可以检查方差膨胀因子 (VIF),它度量预测变量相关时估计回归系数的方差增加的幅度。如果 VIF = 1,表示不存在多重共线性,但如果 VIF & 1,预测变量可能存在一定程度的相关性。当 VIF 介于 5 到 10 之间时,回归系数的估计严重不准。
严重多重共线性的可能解决办法:
从模型中删除那些高度相关的预测变量。由于它们提供了冗余信息,因此删除它们通常不会显著减少 R2。考虑使用逐步回归、最佳子集回归或数据集的专门知识来删除这些变量。
使用偏最小二乘回归 (PLS) 或主成份分析。这些方法可以将预测变量的数量减少为更小的不相关分量集。
例如,一家玩具制造商希望根据调查结果预测客户满意度,开始时他们将“强度”和“没有破损”作为预测变量包括在回归模型中。调查人员发现,这两个变量之间有非常强的负相关关系,其 VIF 值大于 5。在这种情况下,调查人员可以尝试删除其中的一个变量,或者利用 PLS 或主成份分析来使用这些相关变量生成一个“耐用性”分量。
预测平方和 (PRESS)
用于评估模型的预测能力。一般而言,PRESS 值越小,模型的预测能力越强。PRESS 用于计算预测的 R2,它解释起来通常更直观。该统计量有助于防止过度拟合模型,因为它是使用未包括在模型估计中的观测值计算的。过度拟合是指模型看似解释了用于模型计算的数据集的预测变量与响应变量之间的关系,但却无法为新观测值提供有效预测。
PRESS 类似于误差平方和 (SSE),是预测误差的平方和。PRESS 不同于 SSE 之处在于,PRESS 中的每个拟合值
i 是通过从数据集中排除第 i 个观测值、根据其余的 n  1 个观测值来估计回归方程、然后用拟合回归函数获得第 i 个观测值的预测值来获得的。
Durbin-Watson 统计量
检验残差中是否存在自相关。自相关表示相邻观测值是相关的。 如果它们是相关的,那么最小二乘回归低估了系数的标准误;此时,您的预测变量似乎非常显著,其实可能是不显著的。
例如,来自每日股票价格数据回归的残差可能取决于以前的观测值,因为前一天的股票价格会影响第二天的价格。
Durbin-Watson 统计量以观测值的顺序(行)为条件。Minitab 假设观测值遵循有意义的顺序(如时间顺序)。Durbin-Watson 统计量确定相邻误差项之间的相关性是否为零。要从检验中得出结论,需要将显示的统计量与表中的上下限进行比较。如果 D & 上限,表示不存在相关性;如果 D & 下限,表示存在正相关性;如果 D 在上下限之间,则无法从检验中得出结论。
表示对距离平均值的变异或离差的度量。计算方法是与平均值之差的平方之和。计算总平方和时同时考虑来自因子和来自随机可能性或误差的平方和。
在回归中,总平方和有助于表达 y 的总变异。例如,您收集数据以确定将总体销售额解释为广告预算的函数的模型。
总平方和 =
回归平方和 (SSR) + 残差平方和 (SSE)
 (y 
)2 =  (
 (y 
回归平方和是因 x 与 y 之间关系(本例中为广告预算与销售额之间)所致的变异。残差平方和是因误差所致的变异。
通过将回归平方和与总平方和进行比较,得出总变异中由回归模型解释的比率(R2,确定性系数)。此值越大,将销售额解释为广告预算的函数的关系越好。
在方差分析 (ANOVA) 中,总平方和有助于表达可能因不同因子所致的总变异。例如,运行试验以检验三种洗衣粉的效果。
总平方和 =
处理平方和 (SST) + 误差平方和 (SSE)
处理平方和是因处理(在此例中为洗衣粉之间的不同)所致的变异。残差平方和是因误差所致的变异。
通过除以自由度将平方和转换为均方,可以对这些比率进行比较,并确定是否因洗衣粉而导致显著差异。此比率越大,处理对结果的影响越大。
顺序平方和与调整的平方和
Minitab 将方差的 SS 回归或处理分量分解为每个因子的平方和。
连续平方和取决于将因子输入到模型中的顺序。在给定以前输入的因子的情况下,连续平方和是 SS 回归中唯一由因子解释的部分。
例如,如果模型有三个因子 X1、X2 和 X3,在 X1 已经在模型中的情况下,X2 的连续平方和显示 X2 解释的其余变异的量。要获得不同的因子序列,请重复回归过程,以不同顺序输入因子。
调整的平方和并不取决于将因子输入到模型中的顺序。在给定模型中所有其他因子的情况下,这是 SS 回归中唯一由因子解释的部分,与将因子输入到模型中的顺序无关。
例如,如果模型有三个因子 X1、X2 和 X3,在 X1 和 X3 已经在模型中的情况下,X2 的调整的平方和显示 X2 解释的其余变异的量。
在回归和方差分析模型中,用于度量某个观测值的 x 值与数据集中所有观测值的 x 值的平均值之间的距离。杠杆率值很大的观测值可能会对模型产生不成比例的影响,并因此产生误导性结果。例如,一个显著系数看上去可能并不显著。但是,并非所有杠杆率点都是有影响的观测值。
杠杆率值介于 0 和 1 之间。应对杠杆率值大于 3p/n 的观测值加以分析,其中 p 为模型项(包括常量)的数目,n 为观测值的数目。Minitab 会在异常观测值表中用 X 标识杠杆率值大于 3p/n 或 0.99(以较小者为准)的观测值。
要确定影响程度,可以包含和不包含该观测值拟合模型,并比较系数、p 值、R2 和其他模型信息。如果在排除有影响的观测值后模型有显著变化,首先确定该观测值是否是数据输入或测量错误。如果不是,请进一步检查模型以确定您是否忽略了一个重要的项(例如,交互作用项)或变量,或指定了不正确的模型。您可能需要收集更多数据以解决此问题。
杠杆率也称为 Hi。
Cook 距离 (D)
在回归分析或方差分析模型中,测量某个观测值对一组回归系数的影响。有影响的观测值对模型具有不成比例的影响,会产生误导性结果。例如,显著的系数可能表现为并不显著。有影响的观测值可以是杠杆率点、异常值或这两者。
Cook 距离在确定对回归系数的影响时会同时考虑每个观测值的杠杆率值和标准化残差。一般来讲,检查 D 大于 F(0.5, p, n-p) 的观测值是一个很好的方法,后者是 F 分布的中位数,其中 p 是模型项数(包括常量),n 是观测值数。另一种检验 D 值的方法是以图形方式将它们与另一个值相比较(使用线条图)。相对于其他观测值,具有较大 D 值的观测值可能是有影响的观测值。
要确定影响的程度,可以分别使用和不使用有影响的观测值来拟合模型,并比较系数、p 值、R2 以及其他模型参数。如果删除有影响的观测值后模型出现显著变化,则首先确定该观测值是否是数据录入误差或测量误差。如果都不是,则进一步检查模型以确定是否忽略了重要项(例如,交互作用项)或变量,或者指定了错误的模型。您可能需要收集更多数据来解决问题。
测量每个观测值对回归和方差分析模型中的拟合值的影响。有影响的观测值对模型具有不成比例的影响,会产生误导性结果。例如,显著的系数可能表现为并不显著。有影响的观测值可以是杠杆率点、异常值或这两者。
DFITS 粗略表示从数据集中删除每个观测值并重新拟合模型时,拟合值改变的标准差的数量。使用大于 2*sqrt(p/n) 的 DFITS 值来调查观测值,其中 p 为模型项的数量(包括常量),n 为观测值的数量。
要确定影响的程度,可以分别使用和不使用有影响的观测值来拟合模型,并比较系数、p 值、R2 以及其他模型参数。如果删除有影响的观测值后模型出现显著变化,则首先确定该观测值是否是数据录入误差或测量误差。如果都不是,则进一步检查模型以确定是否忽略了重要项(例如,交互作用项)或变量,或者指定了错误的模型。您可能需要收集更多数据来解决问题。
适用回归模型的特征 检查使用... 可能解决方案
响应与预测变量之间存在线性关系 。
残差与变量图
在模型中添加高次项。
变换变量。
残差 的方差恒定。
残差与拟合值图
变换变量。
加权最小二乘。
残差彼此独立(不相关)。 Durbin-Watson 统计量
残差与顺序图
添加新的预测变量。
使用时间序列分析。
添加滞后变量。
残差呈正态分布。 残差的直方图
残差的正态图
残差与拟合值图
正态性检验
变换变量。
检查异常值。
没有异常观测值或异常值。 残差图
变换变量。
删除异常的观测值。
数据不是病态数据。
方差膨胀因子(VIF)
预测变量的相关矩阵
删除预测变量。
偏最小二乘回归。
变换变量。
如果确定模型不满足上面所列标准,就应该:
进行检查以确定数据输入是否正确,特别是观测值是否标识为异常。
尝试确定导致这一问题的原因。您可能想要知道模型对这个问题的敏感程度。例如,如果包含异常值,运行回归时将此观测值排除在外,然后看看两个结果有什么区别。
考虑使用上面所列的可能解决方案。
用于 t 检验族的检验统计量,它以标准误的单位度量观测的统计量与其假设的总体参数之差。t 检验将此观测的 t 值与自由度为 (n-1) 的 t 分布中的临界值进行比较,以确定估计和假设的总体参数值之差是否在统计意义上显著。 t 值的应用包括:
比较两个样本平均值
比较匹配对的平均值
确定回归系数的显著性
比较两个回归系数
还可以在单样本 t 检验中使用 t 值。例如,要确定所制造部件的长度是否满足其目标值 10 厘米。抽取 50 个部件作为样本,用以下假设对其平均长度执行双侧单样本 t 检验:
H0:= 0(所有部件的平均长度都满足目标值)
H1: ≠ 0 (并非所有部件的平均长度都满足目标值)
检验产生的 t 值为 2.5。在具有 (n-1 = 49) 个自由度的 t 分布中,此 t 值对应的 p 值为 0.0158。对于最常见的 alpha 水平,此结果在统计意义上显著,因此否定平均长度满足目标的原假设,并得出过程需要改进的结论。
回归的标准误 (S)
用作对回归和方差分析中模型拟合的度量。S 以响应变量的单位进行度量,表示数据值与回归线的标准距离(即残差的标准差)。对于给定的研究,方程对响应的预测越好,S 值越小。
例如,您为一家薯片公司工作,该公司正在研究影响每个包装中碎薯片数量(响应变量)的因子。将模型简化为显著的预测变量,发现 S 的计算结果为 1.79。这表明,实际数据点到回归线(预测值)的标准距离为 1.79 片碎薯片。如果正在比较模型(如在最佳子集回归中),低于 1.79 的值表明拟合较好,而较高的值则表明拟合较差。
生成方程以描述一个或多个预测变量与响应变量之间的统计学关系,并预测新观测值。回归一般使用通过使平方残差之和最小化来导出方程的普通最小二乘法。
回归结果表明预测变量与响应之间关系的方向、大小和统计学显著性。
每个系数的符号表明关系的方向。
系数表示保持模型中其他预测变量恒定时,预测变量的单位变化导致的响应平均变化。
每个系数的 P 值检验系数等于零(无效应)这一原假设。因此,较低的 p 值说明预测变量对模型而言是有意义的补充。
方程在给定预测变量值的情况下预测新观测值。
例如,您为一家薯片公司工作,该公司正在分析发货前影响每个包装内碎薯片百分比的因子(响应变量)。您正在进行回归分析,并以马铃薯相对其他成分的百分比和加工温度(摄氏度)作为两个预测变量。 下面是简化的结果表。
回归方程: %碎薯片 = 4.231 - 0.044(马铃薯百分比)+ 0.023(加工温度 C)
预测变量 系数 P
常量 4.231 0.322
马铃薯百分比 -0.044 0.001
加工温度 0.023 0.020
R-Sq = 67.2%
回归结果表明,由于两个预测变量的 p 值都很低,因此它们都是显著的。这两个预测变量一共占碎薯片方差的 67.2%。具体地说:
马铃薯含量每增加 1%,碎薯片百分比预期会减少 0.044%。
加工温度每增加 1 摄氏度,碎薯片百分比预期会增加 0.023%。
为了预测马铃薯含量为 50% 且加工温度为 175C 时的碎薯片百分比,您计算出碎薯片的期望值为 4.831%。
注 含一个预测变量的模型称为简单线性回归,否则称为多元线性回归。
Mallows Cp
用来帮助在多个候选回归模型之间进行选择的一个统计量。Mallows Cp 会将整个模型的精确度和偏倚与具有最佳预测变量子集的模型进行比较。它可帮助您在模型中的预测变量数方面实现重要平衡。具有过多预测变量的模型的精确度相对较差,而预测变量过少的模型又会产生偏倚的估计。接近预测变量数加上常量数的 Mallows Cp 值表明模型在估计真实回归系数和预测未来响应时比较精确且无偏倚。
例如,您为一家薯片公司工作,该公司正在研究影响每个包装中的碎薯片数量(响应变量)的因子。预测变量包括马铃薯的百分比、冷却速率和加工温度。
下面是来自最佳子集回归分析的简化结果:
步骤 %马铃薯 冷却速率 加工温度 Mallows Cp
3 X X X 5.5
上表表明包含两项因子(“%马铃薯”和“冷却速率”)的模型比较精确且无偏倚,因为其 Mallows Cp (2.9) 最接近预测变量数加上常量数 (3)。您应当同时检验 Mallows Cp 与最佳子集输出中包括的其他统计量,如 R2、调整的 R2 和 S。
警告 仅当使用相同的预测变量完整集合时,使用 Mallows Cp 比较回归模型才有效。
太多了,能否打包往上发????????????????????
4 个回复,游客无法查看回复,更多功能请或
扫一扫微信订阅
浏览: 12013
关注: 0 人
6SQ质量日刊
服务号: Lsqdnet
6SQ质量周刊}

我要回帖

更多关于 就知道玩 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信