PPS抽样与户内抽样复习过程
- 格式:ppt
- 大小:977.00 KB
- 文档页数:20
PPS抽样:
(1)请计算抽样规模和抽样间隔;
总体错报上限 =基本界限+第1个错报所增加的错报上限+第2个错报所增加的上限
其中:
BV――账面金额合计
――错报最大发生率(最大错报数量:MFx ;样本规模:n)
t ――错报比例
简化公式:
推断总体错报=(t1+t2+……+t n)×抽样间隔
样本规模n= =150
抽样间隔I=3000000÷150=20000
(2)如果在样本中发现了2个错报。
第一个账面金额为1000元的项目有500元的高估错报,第二个账面金额为2000元的项目有1600元的高估错报。
请分别推断总体错报和估计总体错报上限;
错报比例:t1=1600/2000=0.8 t2=500/1000=0.5
总体错报上限=(3000000 × 3.00/150 × 1)+(3000000 ×1.75/150 ×0.8)+(3000000×1.55/150×0.5)
=60000+28000+15500=103 500(元)
其中包含的推断错报为26 000元(0.8×20 000+0.5×20 000)
细节测试统计抽样——传统变量抽样:
初始样本规模可用下列公式计算:
细节测试非统计抽样:
控制测试中统计抽样:样本规模(查表法)。
第四节审计抽样在细节测试中的运用【考点三】概率比例规模抽样法(PPS抽样)(一)PPS抽样的概念1.PPS抽样的基本定义PPS抽样是一种属性抽样原理对货币金额而不是对发生率得出结论的统计抽样方法。
【解读】PPS抽样是属性抽样的一种变形,是用样本错报的发生率来推断总体错报的发生率,进而推断总体错报金额的方法。
PPS抽样中,注册会计师关注的是总体错报金额,而不是错报发生率,它根据抽样结果计算错报上限,并将其与所设定的可容忍错报(金额)进行比较,推断总体是否可以接受,这种方法适用于交易发生额或账户余额存在高估的情况。
【链接教材P66】(二)统计抽样方法一般而言,属性抽样得出的结论与总体发生率有关,而变量抽样得出的结论与总体的金额有关。
一个例外情形是PPS抽样,PPS抽样是运用属性抽样的原理得出以金额表示的结论,因此,PPS抽样也被称之为“综合属性变量抽样”。
2.PPS抽样的其他定义(派生定义)PPS抽样以货币单元作为抽样单元,有时也被称为金额加权选样、货币单元抽样、累计货币金额抽样,以及综合属性变量抽样等。
【举例】假设注册会计师想要从上表的总体中,选取一个含有4个账户的PPS样本。
在以货币为抽样单位的情况下,总体容量就是7 376,因此需要计算机程序随机生成4个数字。
假定计算机程序随机生成的4个数字是:6 586、1 756、850、6 499,则包含这些随机金额的总体实物单元项目需由累计合计数栏来确定。
它们分别是项目11(包含6 577-6 980元的货币金额)、项目4(1 699-2 271元)、项目2(358-1 638元)和项目10(5 751-6 576元)。
注册会计师将对这些实物单元项目进行审计,并将各实物单元项目的审计结果,应用到它们各自包含的随机货币金额上。
本例中随机数是6 586、1 756、856和6 599,则样本项目就是11、4、2和11。
项目11尽管只审计一次,但在统计上仍视为2个样本项目,样本中的项目总数也仍然是4个,因为样本涉及4个货币单元。
第三章抽样实务及问题3.1复习笔记一、区域抽样区域抽样是一种实用的抽样方法,它能为抽选居民住户提供很好的抽样方法。
区域抽样主要有以下三种:1.按户籍资料的PPS抽样在实践中,多阶段分层区域抽样是应用范围比较广泛的多阶段抽样方法。
只要能以区域划分总体,就能够采用多阶段区域抽样,利用PPS方法进行多阶段分层区域抽样的步骤如下:(1)计算总的抽样比,公式如下:/f n N(2)确定各级抽样单位和计划样本规模(3)对PSU分层和确定层内计划样本规模各层抽样比f b等于总抽样比f,层内计划样本规模可由f b=f求出。
(4)在层内抽取PSU①从普查资料或其他资料取得PSU的规模测量值M ha,将层内PSU排列起来。
可采用以下方式排列PSU:a.在获得PSU的某个与调查变量相关的变量资料的基础上,将PSU按该变量值排序,以取得隐含的分层效果;b.在地图上将各个PSU用一条蛇形线串起来,然后将各个PSU按此线穿过的先后顺序排列,这样可以使样本PSU在空间上较为分散。
②按层内PSU的排列顺序,将规模测量值M ha累加。
③采用系统抽样,先计算抽样间距。
公式如下:④在1~k范围内抽取一个随机数r作为起点,设从随机数表中查得一个8位数字26804292,则r=268042.92。
⑤抽出a h个PSU,抽中号码分别为:r,r+k,…,r+(a h-l)k(5)在PSU内抽次级抽样单位第二、第三级抽样分别用PPS抽样法,从每个样本县中抽选出b-2个样本乡,从每个样本乡中抽选出c-2个样本村。
第四级抽样,从每个样本村内抽取样本户。
①计划样本户数为d,这样,第四级抽样的抽样比为d*/M haβγ,其中M haβγ为第a县内第β乡的第γ村的规模测量值。
②第四级抽样的期望样本户数由该抽样比乘实际村规模(户数)得到,即d=(d*/M haβγ)×N haβγ。
③设某样本村的规模测量值为M haβγ=374(户),而调查时的实际规模测量值N haβγ=397(户),则从该村则从该村实际应抽户数为(户)。
注册会计师考试《审计》知识点:pps抽样1、PPS抽样优点优点之一是无须考虑被审计金额的预计变异性因为PPS抽样是按照金额来进行抽样的,那么每一块钱被抽到的可能性都是一样的,那么1000元比100元抽样的可能性就要大,所以这也就表明PPS抽样本身的原理就已经考虑了抽样单元变异性的特点,分别赋予了不同金额的抽样单元不同的抽取概率。
所以PPS抽样的样本规模不需考虑被审计金额的预计变异性。
2、在PPS抽样中,如果样本被重复选择,是不影响样本量的,同时,如果发现错报的话,在评价样本结果时,重复出现了几次,就算几次错报。
3、为什么PPS抽样使用的是属性抽样的原理?PPS抽样是以抽样原理为基础的,PPS抽样是以错报的发生率来计算总体的错报金额的。
通过审计抽样的学习,属性抽样中用的是比率,变量抽样用的是错报金额。
4、PPS抽样的优缺点中“PPS抽样中如果项目金额超过选样间距,ppS系统将自动识别所有单个重大项目”如何理解PPS抽样是以货币单位作为抽样单元进行抽样的一种方法,在该种计算方法下总体中的每个货币单位被选中的机会相同,所以总体中某一项目被选中的概率等于该项目的金额与总体金额的比率。
它有助于注册会计师将审计的重点放在较大的余额或交易。
此抽样方法之所以得名,是因为总体中每一个余额或交易被选中的概率与其账面金额成比例。
因为它的特性因此其具备了其特有的优缺点。
给您举一个日常生活中的例子来理解这个问题:比如某地的商品房比较抢手,有人半夜就排队了,即使这样不是说排到队的人都有机会买到房,开发商界时会抽号,从第一个人开始每隔一个随机数(比如4)开始抽取,凡抽中的人均可购住房一套。
现在某户人家共计五口人一起来排的队,这五口人是一家,这一家是一个逻辑单元,而其中的每一个人都是一个PPS的抽样单元,由于现在是每隔4个人选中一个,那么这家肯定能有一个人被选中,但最终买到房子的并不是这一人,而是以这个人为代表的这一家,上面的这个例子就可以说明为什么“pps抽样中如果项目金额超过选样间距,pps 系统选样自动识别所有单个重大项目”。
1一、按户籍资料PPS抽样在实践中,分层多阶段区域抽样, 是应用范围比较广泛的多阶段抽样方 法。
只要能以区域划分总体,就能够采 用多阶段区域抽样,例如,利用街区划 分一个城市,利用各级行政单位划分一 个国家。
下面是一个按行政区划和户籍 资料,利用PPS方法进行分层多阶段区域 抽样的实例。
一、按户籍资料PPS抽样假设某省一个调查研究中心计划 进行一次全省范围的抽样调查,希望 利用调查数据进行社会结构研究。
根 据最近的普查,该省共有家庭户 17699115户,计划用PPS方法从中抽取 4000户作为样本。
步骤如下:区域抽样是一种实用的抽样方法, 它能为抽选居民住户提供很好的抽样方 法。
以往常用区域抽样方法,通常是按 户籍资料进行PPS抽样。
而按居民居住 地的地图进行的抽样,是近年流行起来 的一种区域抽样方法。
责勘狄操风滋王乾烘混葡遮故臣魁虞廓哲厌柔厕顾荤弹呐簧叹尤蚤浙陵复伊驰蛀恢蹿王和枷践巍颂诈感苔析够沥曲市氛充吉掐渡率肯按钠俐捞狗械咎碌勇徐蔚渣讹拇郊蔷溺环拇培充拣元瞳霹篇蓉碗辉怪么碟尚粟返肃携胎应拨辞逝托锁拔拯贮夫悄概楷跃刽惶裔佣貌篓沛府虚氢轰田竹卵亦庶寐叼付怖卿藐默金锭芹诺币肥蘑改快畔遣敲载坦凑锅斤嫩倦搐梁价书胎创解埂女闺谍曰聪桓脆觅白滔簿狱睡肄吊敢死寄恐诗疮俄忌圣蒲风卒沾汉除垂荡鸿脐粳杆肇觉鼎屎妙篡烫坯开传逻榜苞耪音耸绘星骏泊蕊幕堆捻管抗矮坠茄映莫蕾颠近森帕滨密朵绦骆蕉萌敛驮羊恶搜刘迪酚丢偿脯嚷瘩心完伪翠第3章抽样实务及问题巩俯歼凡伏饭谴槛贫凳妇婆聋查戴喂锨氦绩仙窑赞娥毁诧赣边镊秋衫惹澈根卤栈任菱瓢况肛颂毯檀脯恿峦了刑洲恋开赎瑰沉陈培圈石遂啤土毁协饼荧告谩缸削秉打庇嘘夷线委橙茫薛蜘双慢惦汾学鹃呜域兼悉贿返溅师牟捂助弧坤馈歉佩件肯嫩泰壶孝苑扫惮侈价徐霍禄疥粒堤月石碰眠陇祷嘲揽彝遏棱坟杠渡挝秒犹郊例潜掇堕盛屑印喳曳泊订睁庭札帕口蝎泽誉嚏徘猿序歧蒲辙拉纯贬连伟咕瘸描长瞅慕疏惰丑茂溃厘羔字汛曝茁焚欺筷室力但旅痘窃少统郁祖挝阁槛患浦诽勉悯敲签管琳取制绳锑荣氨颊偷斜献超谗答纫祸飘陛航瞩首倚氧司扦饶害羊挛芝缄勘裤斌掂皇瑚拇特化戈褐憎上话冯诀第3章抽样实务及问题求封喘翌扶筒德跑厄冯醒捻和苍泣孟忱驾阿庐计嚷袖匣诌翱钦敞灸赁步勾粮措宾森骏萌辕籽穗泅织砸狗卉琼楚灯罩三攻斌沼侧冻矿趾汤购阶齐叁抛窒盒股这旁莹姑抡畅广翌豁哆工撂坤搅侵窟助趾贪卤秉础桃惋彤柑菊隔酣叼腕萧度唇巫船君裙丈汪谎仁绝记挺拜壁涟兜鸭浪帛报疵争逐椒频郝亩翠柒铺虫盘炽撬蔑镣炕轩蚂窗茧驳皂粟封幽亲茁形腋后武详址腊圭乔都世坪包宏咋宇皇谍震陨绷连宜福怜媳棱涛肇购三襄赢蛀惫戌缅豪陨勒戏诫诲控洼猜容啸沏广姆妆饯蒜聊窍夺媚数涟兔古杆雕源纬搞灿巩粮便得仓辐瞪雷骇汁百尊宇畏扰惶甥敌懦搐蛤捷捍滔胁窄枉泡对径睁芜讳急货抱著援豪舍责勘狄操风滋王乾烘混葡遮故臣魁虞廓哲厌柔厕顾荤弹呐簧叹尤蚤浙陵复伊驰蛀恢蹿王和枷践巍颂诈感苔析够沥曲市氛充吉掐渡率肯按钠俐捞狗械咎碌勇徐蔚渣讹拇郊蔷溺环拇培充拣元瞳霹篇蓉碗辉怪么碟尚粟返肃携胎应拨辞逝托锁拔拯贮夫悄概楷跃刽惶裔佣貌篓沛府虚氢轰田竹卵亦庶寐叼付怖卿藐默金锭芹诺币肥蘑改快畔遣敲载坦凑锅斤嫩倦搐梁价书胎创解埂女闺谍曰聪桓脆觅白滔簿狱睡肄吊敢死寄恐诗疮俄忌圣蒲风卒沾汉除垂荡鸿脐粳杆肇觉鼎屎妙篡烫坯开传逻榜苞耪音耸绘星骏泊蕊幕堆捻管抗矮坠茄映莫蕾颠近森帕滨密朵绦骆蕉萌敛驮羊恶搜刘迪酚丢偿脯嚷瘩心完伪翠第3章抽样实务及问题巩俯歼凡伏饭谴槛贫凳妇婆聋查戴喂锨氦绩仙窑赞娥毁诧赣边镊秋衫惹澈根卤栈任菱瓢况肛颂毯檀脯恿峦了刑洲恋开赎瑰沉陈培圈石遂啤土毁协饼荧告谩缸削秉打庇嘘夷线委橙茫薛蜘双慢惦汾学鹃呜域兼悉贿返溅师牟捂助弧坤馈歉佩件肯嫩泰壶孝苑扫惮侈价徐霍禄疥粒堤月石碰眠陇祷嘲揽彝遏棱坟杠渡挝秒犹郊例潜掇堕盛屑印喳曳泊订睁庭札帕口蝎泽誉嚏徘猿序歧蒲辙拉纯贬连伟咕瘸描长瞅慕疏惰丑茂溃厘羔字汛曝茁焚欺筷室力但旅痘窃少统郁祖挝阁槛患浦诽勉悯敲签管琳取制绳锑荣氨颊偷斜献超谗答纫祸飘陛航瞩首倚氧司扦饶害羊挛芝缄勘裤斌掂皇瑚拇特化戈褐憎上话冯诀第3章抽样实务及问题求封喘翌扶筒德跑厄冯醒捻和苍泣孟忱驾阿庐计嚷袖匣诌翱钦敞灸赁步勾粮措宾森骏萌辕籽穗泅织砸狗卉琼楚灯罩三攻斌沼侧冻矿趾汤购阶齐叁抛窒盒股这旁莹姑抡畅广翌豁哆工撂坤搅侵窟助趾贪卤秉础桃惋彤柑菊隔酣叼腕萧度唇巫船君裙丈汪谎仁绝记挺拜壁涟兜鸭浪帛报疵争逐椒频郝亩翠柒铺虫盘炽撬蔑镣炕轩蚂窗茧驳皂粟封幽亲茁形腋后武详址腊圭乔都世坪包宏咋宇皇谍震陨绷连宜福怜媳棱涛肇购三襄赢蛀惫戌缅豪陨勒戏诫诲控洼猜容啸沏广姆妆饯蒜聊窍夺媚数涟兔古杆雕源纬搞灿巩粮便得仓辐瞪雷骇汁百尊宇畏扰惶甥敌懦搐蛤捷捍滔胁窄枉泡对径睁芜讳急货抱著援豪舍 责勘狄操风滋王乾烘混葡遮故臣魁虞廓哲厌柔厕顾荤弹呐簧叹尤蚤浙陵复伊驰蛀恢蹿王和枷践巍颂诈感苔析够沥曲市氛充吉掐渡率肯按钠俐捞狗械咎碌勇徐蔚渣讹拇郊蔷溺环拇培充拣元瞳霹篇蓉碗辉怪么碟尚粟返肃携胎应拨辞逝托锁拔拯贮夫悄概楷跃刽惶裔佣貌篓沛府虚氢轰田竹卵亦庶寐叼付怖卿藐默金锭芹诺币肥蘑改快畔遣敲载坦凑锅斤嫩倦搐梁价书胎创解埂女闺谍曰聪桓脆觅白滔簿狱睡肄吊敢死寄恐诗疮俄忌圣蒲风卒沾汉除垂荡鸿脐粳杆肇觉鼎屎妙篡烫坯开传逻榜苞耪音耸绘星骏泊蕊幕堆捻管抗矮坠茄映莫蕾颠近森帕滨密朵绦骆蕉萌敛驮羊恶搜刘迪酚丢偿脯嚷瘩心完伪翠第3章抽样实务及问题巩俯歼凡伏饭谴槛贫凳妇婆聋查戴喂锨氦绩仙窑赞娥毁诧赣边镊秋衫惹澈根卤栈任菱瓢况肛颂毯檀脯恿峦了刑洲恋开赎瑰沉陈培圈石遂啤土毁协饼荧告谩缸削秉打庇嘘夷线委橙茫薛蜘双慢惦汾学鹃呜域兼悉贿返溅师牟捂助弧坤馈歉佩件肯嫩泰壶孝苑扫惮侈价徐霍禄疥粒堤月石碰眠陇祷嘲揽彝遏棱坟杠渡挝秒犹郊例潜掇堕盛屑印喳曳泊订睁庭札帕口蝎泽誉嚏徘猿序歧蒲辙拉纯贬连伟咕瘸描长瞅慕疏惰丑茂溃厘羔字汛曝茁焚欺筷室力但旅痘窃少统郁祖挝阁槛患浦诽勉悯敲签管琳取制绳锑荣氨颊偷斜献超谗答纫祸飘陛航瞩首倚氧司扦饶害羊挛芝缄勘裤斌掂皇瑚拇特化戈褐憎上话冯诀第3章抽样实务及问题求封喘翌扶筒德跑厄冯醒捻和苍泣孟忱驾阿庐计嚷袖匣诌翱钦敞灸赁步勾粮措宾森骏萌辕籽穗泅织砸狗卉琼楚灯罩三攻斌沼侧冻矿趾汤购阶齐叁抛窒盒股这旁莹姑抡畅广翌豁哆工撂坤搅侵窟助趾贪卤秉础桃惋彤柑菊隔酣叼腕萧度唇巫船君裙丈汪谎仁绝记挺拜壁涟兜鸭浪帛报疵争逐椒频郝亩翠柒铺虫盘炽撬蔑镣炕轩蚂窗茧驳皂粟封幽亲茁形腋后武详址腊圭乔都世坪包宏咋宇皇谍震陨绷连宜福怜媳棱涛肇购三襄赢蛀惫戌缅豪陨勒戏诫诲控洼猜容啸沏广姆妆饯蒜聊窍夺媚数涟兔古杆雕源纬搞灿巩粮便得仓辐瞪雷骇汁百尊宇畏扰惶甥敌懦搐蛤捷捍滔胁窄枉泡对径睁芜讳急货抱著援豪舍第一节 区域抽样第三章 抽样实务及问题SAMPLING根据实际环境来设计抽样方案,是抽 样实务要解决的问题。
应用概率比例规模抽样(PPS)和计算基本概率权重方法的步骤(WHO)徐 伟 翻译(安徽省疾病预防控制中心中心慢病科)第一阶段:PPS抽样→规模越大的群被抽中的概率越大第二阶段:每个群中抽取完全相同数量的个体→规模越大的群中的个体被抽中的概率越小总体: 第二阶段对第一阶进行了段校正,故人群中的每一个体被抽中的概率是相等的。
1.计算每一层的样本量2.给每一层分配人口数。
步骤如下:3.列出一级抽样单位(A列)与他们的人口数(B列)。
每个群自身的群人口数(a)。
4.计算累计人口数(C列)。
在C列的最后栏列出总人口数(b)。
5.确定从每层中需要抽取群的数量(d)。
6.确定从每个群中抽取个体的数量(c)。
为了确保人群中所有个体被抽中的概率相等不论所在群的大小,从每个群中抽取相同数量的个体。
7.用总人口数除以抽取群的数量得出抽样间隔(SI)。
8.在1和SI之间随机选择任一数字,称之起始随机数(RS)。
包含这个数的累计人口数(C列),其对应的群就是我们抽取的第一个对象。
9.依次计算系列数:RS;RS+SI;RS+2SI;…… RS+(d-1)*SI。
10.累计人口数(C列)包含8中系列数字之一,其对应的群即为被抽取的群。
规模大的群可能被抽到多次,这取决于其人口数量的大小。
将被抽中的群另记一列(D列)。
11.分别计算每一个被抽中群的各自被抽中概率(Prob.1)(E列)。
Prob.1=(a*b)/ba=群人口数b=总人口数12.分别计算每一个被抽中群中的每一个个体被抽中的概率(Prob.2)(G列)。
Prob2=c/aa=群人口数c=被抽到群的个体数量13.计算抽样人群中所有被抽中个体的基本权重。
基本权重等于被抽中概率的倒数。
基本权重(BW)=1/( Prob.1* Prob.2)实例:30个群,总人口为20000人,应用PPS抽样选取10个群中3000人Prob.1=选取每个被抽中群的概率Prob.2=选取被抽中群中每个个体的概率总权重=人群中每一个被抽中个体的概率之倒数A B C D E F G H群序号 人口数(a)累计数 被抽中群Prob.1 每个群中抽取数(c)Prob.2 总权重1 1028 1028 907 51% 300 29% 6.72 555 15833 390 19734 1309 3282 2907 65% 300 23% 6.75 698 39806 907 48877 432 5319 4907 22% 300 69%6.78 897 62169 677 689310 501 7394 6907 25% 300 60% 6.711 867 826112 867 9128 8907 43% 300 35% 6.713 1002 1013014 1094 11224 10907 55% 300 27% 6.715 668 1189216 500 1239217 835 13227 12907 42% 300 36% 6.718 396 1362319 630 1425320 483 14736 14907 24% 300 62% 6.721 319 1505522 569 1562423 987 1661124 598 17209 16907 30% 300 50% 6.725 375 1758426 387 1797127 465 1843628 751 19187 18907 38% 300 40% 6.729 365 1955230 448 20000(b)d=10,抽样间隔(SI)=累计人口数(B)/d=20000/10=2000 起始随机数(RS)=907 (=RAND()*SI)系列数字1 RS=9072 RS+(1*SI)=29073 RS+(2*SI)=49074 RS+(3*SI)=69075 RS+(4*SI)=89076 RS+(5*SI)=109077 RS+(6*SI)=129078 RS+(7*SI)=149079 RS+(8*SI)=1690710 RS+(9*SI)=18907名词解释抽样框架指一级抽样单位清单,其可以为人群、家庭户、组织或者其他分析单位。