统计误差分析 统计误差分析

统计误差分析

  • 期刊名字:读与写(教育教学刊)
  • 文件大小:524kb
  • 论文作者:费传宝
  • 作者单位:江苏省镇江市高等专科学校管理系
  • 更新时间:2020-09-25
  • 下载次数:
论文简介

第6卷第10期读与写杂恋2009年10月Vol. 6 No.10Read and Write PeriodicalOctober 2009统计误差分析费传宝(江苏省镇江市高等专科学校管理系江苏镇江212003)摘要:在信息时代,准确而有效的信息往往给企业带来财富。而信息的搜集需要一系列统计工作,在实际统计工作中,统计误差在所难免。精度是统计调查的生命线,所以很有必要对统计误差,特别是可以控制的非抽祥误差要进行深入、系统地探讨。关键词:随机抽祥抽样误差 调查积累误羞中图分类号: G642文献标识码: A .文章编号:1672-1578(2009)10 0087. -02在理论上,统计误差中的抽样误差分为两类,一类是工作性址 发生了完全的变化,如果依旧按以前的抽样框去抽样,那么精误差又称登记性误差;另一类是代表性误差。在代表性误差中又度 就会非常难以控制。分为系统性误差和随机误差"。而在实际统计工作中,统计误差2.1.5辅助信息不正确是多种多样的。有些误差是可以避免的,有的误差是不可以避免前面四种抽样框误差会发生在简单抽样概也会发生在复杂的。下面我们就从这两个方面展开分析和讨论。抽样框,而辅助信息不正确只可能出现在复杂抽样框内。一般,1统计误差 中不可避免的误差较大规模和较复杂的抽样必须采用复杂抽样框,就是必须要有随机误差是指在遵循了随机原则的情况下抽到各种不同样辅助信息。如果辅助信息不准确,就会影响复杂抽样的效果。本所产生的误差,这种误差是不可避免的误差。不过.我们可以2.2 无回答误差对它进行事先计算并设法加以控制。通常在抽样推断中所说的所谓的无回答误差就是指数据丢失,数据丢失的原因有两抽样误差就是指这种随机误差,即假设不存在登记性误差和系种,一是有意不回答,二是无意不回答。有意识不回答,主要是指统性误差的情况下,仅考虑由于抽样的随机性而产生的样本估被调查者拒绝访问或拒绝就某-一个问题给予回答。无意识不回计量与总体参数之间的代表性误差。影响抽样误差大小的因素箸则叮能受访者不在家或者是访问者疏忽,导敛数据遗漏。无回有四个方面:答误差产生的原因有很多,归纳起来的话有以下几点:1.1总体各单位标志值的差异程度2.2.1抽样遗漏在总体中各单位标志值得差异程度越大,抽样误差就越大;所谓抽样遗满的概念就是抽样过程中没有抽到一些本应调反之,总体各单位标志值的差异程度越小,抽样误差就越小。查的抽样单位.这在邮寄调查中最普遍。邮寄调查最大的缺陷就1.2抽样单位数的多少是愿意回答和不愿意问答的人有不同的特征值,而不愿意调查在随机抽样中.如果抽取的样本单位数越多,抽样误差就越人群中有相当部分应该在被调查的范围以内。这种误差产生的小;反之,抽取的样本单位数越少,抽样误差就越大。后果是比较严重而且非常难以调整的。1.3抽样方法2.2.2无法查找到被访对象在随机抽样中,不重复抽样(又称为无放回抽样)比重复抽无法查找最主要的原因是被访对象的地址不确切或者已经样(又称为有放回抽样)的误差要小。迁移,导致无法寻找到被访对象。1.4抽样调查的组织形式2.2.3虽然已经接触到被访者,但因为种种原因被迫放弃调查在随机抽样中,-般有简单随机抽样(又叫纯随机抽样);类被迫放弃的原因很多,首先是访向者拒访,这占了被迫放弃型抽样(又叫分层抽样);等距抽样(又叫机械抽样);整群抽样。误差的绝大多数。另外被迫放年还有几种可能,比如被访者因为在类型抽样中所产生的抽样误差较小,其次是等距抽样;在简单健康原因不能接受或完全接受采访。随机抽样和整群抽样中所产生的抽样误差较大。2.3计量误差2统计误差 中可以避免的误差计负误差可以分为三类,- -是问卷设计阶段产生的误差,二2.1抽样框误差是调查阶段产生的误差.三是其他误差。所谓的抽样框误差指目标总体和抽样样本不一致时产生的2.3.1问卷设计产生的误差误差。属于系统性误差,这是违背了随机原则造成的。理想的抽这种误差属 于工作性误差,主要来自于不同措辞的不同表样框需要满足以下要求,就是所有的抽样单位必须覆盖目标总达。包括文字表达本身产生歧意,文字表达不够简练等等。问卷体,抽样框误差有五个来源,分别是:设计阶段另外一个误差来源就是,问卷设计过长,导致访问者疲2.1.1不能覆盖目标总体单位劳而产生数据失真的现象。所谓的不能覆盖目标总体单位,指的是目标总体单位没有2.3.2调查阶段产生的误差出现在抽样样本中,那么他们就不可能在随后的抽样过程中被调查阶段产生的计量误差也属于工作性误差,它来自于两选中,导致数据丢失。个方面,一是访问员有意或无意导致数据失真,二是被访者有意2.1.2抽样样本包含了非目标总体单位或无意导致数据失真。受访者因为各种各样的原因包括因为间包含非目标总体单位主要是由于目标总体的变化产生的误隔时间太长而产生的记忆误差,记忆误差是计量误差当中非常差。相对于不能覆盖的误差而言,包含非目标总体单位误差比较重 要的组成部分。容易被发现。2.3.3其他计量误差2.1.3复合联接其他计最误差包括,随机数字表的编制和使用,数据处理过复合联接的意思就是一个目标总体单位联接着一个以上的程中(包托他望品t竺\尝出的设茧抽样单位。比如,有的家庭拥有两个住所、两个地址,那么他们被2.4 积中国煤化工选中的概率就是一般家庭的两倍。复合联接的对象如果具有某现很容易被人们疏忽。些特征值就会使样本失真,导致均值发生偏差。不要小.C.N.M.H. C会直接影响到统计数据2.1.4抽样框老化的真实性。甚至改变了计算结果的性质。正所谓千里之堤,溃于统计数据有很强的即时性.随着时间的推移,抽样框必须更蚁穴。下面我们举一个例子来说明这个问题。新,否则就会老化不符合实际情况使抽样不精确。最典型的例某企业在1997- -2002 年的产量(万件)与单位产品成本子,就是随着城市建设的大规模展开.许多地区已经被改造,地(元/件)资料如下: .-87-第6卷第10期读与写杂志2009年10月Vol.6 No.10Read and Write PeriodicalOctober 2009份1997 1998 1999 I 2000 2001 | 2002√L. ?L。V1.5733 .3333√11 .5375? 3.3333,? ?0.98|产量2.7 2.8 3.1[ 3.5| 3.8| 4.1;单位成本31T 8879b?2???2.12; a?j?bx?4&? (?2.12)?0 ?86.73L’1.5733要求:(1)计算产量与单位成本的相关系数。(2)建立以单位成本为因变量的直线回归方程,并解释回归系数的经济意义。所以,以单位成本为因变量的直线回归方程: y ?8673?212x产量每增加1万元件单位成本平均下降2.12万元。年份产量(x) L单位成本(y)x2由相关系数的性质知:1997 2.77.296561218.71.当It=0时,表示x与y完全没有线性相关;1998.8_7.84226.82.当0

论文截图
上一条:X荧光分析
版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。