当前位置:文档之家› 临床试验中的统计学

临床试验中的统计学

临床试验中的统计学
临床试验中的统计学

小胖说统计之一:认识α,β

要了解生物统计在临床试验中的应用,首先需从认识α,β开始,就是这两个不起眼的符号贯穿了临床试验生物统计的始终。α和β的定义是比较拗口的,特别是对于那些没学过统计的人来说,这两个东西是怎么也搞不明白具体是怎么回事。虽然比较拗口,但咱还得在这里重复一下α和β的科学定义:α又称第I类错误或显著性水平,指拒绝了实际上成立的H0,β又称第II类错误,指不拒绝实际上不成立的H0。对应β的还有一个概念叫power,国内翻译为把握度,它等于1-β,指拒绝实际上不成立的H0的概率。

说得通俗一点,临床试验中你会犯俩错误,一种错误就是两种药本来没啥区别,却说成您的药优于人家的药,这就是α;另一种错误就是你的药的确优于人家的药,却说成两种药没啥区别,这就是β。那1-β呢,就是咱的优秀药物被发现的概率啊。

不知道,上边的解释,您听明白了吗?如果听明白了,小胖要问您了,谁应该最关心α啊,那又谁应该最关心β啊?

最关心α的当然是我们伟大的SFDA以及诸如FDA之类的药品审批机构啊,为啥?他们当然不希望一种药明明和别的药没啥区别,却被药厂说成疗效更好,换言之,他们可不希望审批无效的药物进入市场。所以啊,它们要限定这种错误发生的概率,也就是我们的α了,一般情况下,α被限定为0.05。

最关心β的当然是我们的药厂了,为啥?为钱,哈哈!药厂当然不希望明明他的药优于别人的药,却被说成两种药没啥区别吧,所以它们希望降低这种错误发生的概率,也就是降低β了。换言之,他希望提高把握度(1-β),使自己的药能有更高的概率作出来优于别的药物,从而进入市场,赚取钞票。。。一般情况下,β应小于0.2,甚至0.1,对应的把握度为80%或90%。

当然药厂降低β,也就是提高把握度,会提高你试验成功的概率,但这也同时意味着同等条件下样本量的增加,样本量的增加就意味着money的增加,这些都是矛盾的,没办法,谁让这世界本来就是一个矛盾的世界呢,你只好去权衡利弊,找个平衡点呗。。。

今天就到这里吧,休息,休息。。。

小胖说统计之二:怎样认识Non-positive 试验

在上一博认识完α和β后,我们继续深入探讨一下β。。。

在很多情况下,我们会经常遇到临床试验的结果是Non-positivie(P>0.05),此时你会怎么解释呢?有的同学比较干脆,看到p>0.05,就立马认为两种药无差别,更有甚者,如果对照组是安慰剂的话,那这个药就被判定为无效,彻底over了。当然这些同学未免有点武断了,其实大多数情况下,这是由于under-powered造成的,下边小胖就给大家举个例子看看吧。。。

咱保护人家的知识产权,先说明这个例子的referencnce为: Arch Pediatr Adolesc Med. 2006;160(11):1126-1129, 仅供咱参考学习之用。

试验是这样的:

本试验比较Duct Tape和placebo治疗小学儿童人乳头瘤病毒(疣)的疗效,主要疗效指标是6周后的wart resolution,最后的试验结果是Duct Tape组16%,placebo组6%,p=0.12。

看到这个结果,你会得出啥结论?别,咱先别急,先看看它的最初的样本含量和把握度设计的叙述:

根据以往综述,placebo治疗10周后约有30%的wart resolution。假设双测检验0.05显著水平,每组需要39例病人才能有80%的把握检验出Duct Tape和placebo组wart resolution30%的的差异。考虑到失访,最终入组100例(每组50例)。

看完这个叙述,你应该会发现点东西了吧,对!研究者过高地估计了placebo的wart resolution,同时也过高地估计了两组之间的差别。研究者那个后悔啊,肠子都悔青了,后来经过反省,他发现了俩估计上的问题:

(1)人家以前的综述,是说10周后的wart resolution是30%,本试验主要指标是6周后的wart resolution,当然这个率应该低一些;

(2)与placebo30%的差别,也太过于自信了吧,人家临床上觉得你的药有15%的提高就有临床意义了,你把标准提得这么高,不是自找麻烦吗。

根据试验结果,我们可以推算出本试验的把握度只有26%, 这么低的把握度就怪不得没做出啥来了。。。

这样吧,小胖替研究者重新设计一下,咱假设plcebo组30%wart resolution不变,把两组差异降为15%,这样算出来,每组做175例,总共350例。

假设同样的wart resolution结果,Duct Tape组16%,placebo组6%,你猜咋得?把握度大于80%,P<0.05了!!!咱的Duct Tape有救了!!!

说了这么半天,大家可能也闹胡涂了,算了,记住以下几点吧,随便锻炼一下英文,权当这次没白来看小胖的blog。

1. Non-positive ONLY not conclusive

2. Not be able to detect a difference does NOT mean there is no difference

3. The predominant reason of Non-positive trials is mostly “under-powered”, rather than ineffectiveness of the test therapy

小胖说统计之三:优效、等效和非劣效试验(一)

小胖在论坛上转悠了一阵子了,发现有很多同学对优效、等效和非劣效试验都做过一些讨论,小胖不才,在这里再给大家解释一下,权当班门弄斧,如有偏颇,大家尽管拍砖,就算小胖来找残吧,所谓小胖不入地狱,谁入地狱,小胖开博开讲了。。。

先从优效性试验开讲吧。顾名思义,优效性试验的目的是显示试验药物的疗效优于对照药。优效性检验的第一步往往是对两组进行统计学检验,看看有没有显著性差异。当两组有显著性差异后,下一步就得判断两组之间的差异是否有临床意义。这里小胖需要强调的是,统计学显著性差异并不意味着差异有临床意义。举个极端的例子,只要样本量足够大,10000甚至100000,哪怕是0.01的差异都能有统计学意义,但这个0.01的差异当然在临床上是不会被认可的。考虑到这一点,当计算优效性试验的样本量时,你假设的两组差异必须在临床上是有意义的。

关于优效性试验还有一个大家常碰到的问题是,究竟是单侧检验还是双侧检验呢?其实这个问题统计学界本身存在着争议,至于具体争议,小胖就不在此赘述了,小胖想让大家知道的是,现在通常优效性试验取的都是双侧0.05显著水平。

至于具体的统计检验,可通过双侧0.05显著水平或双侧95%可信区间两种方法来实现,当然了优效性试验要求p<0.05,或两组疗效(治疗-对照)之差的95%可信区间的下限大于0。

今天小胖就罗唆到此,下次继续。。。休息。。。

小胖说统计之四:优效、等效和非劣效试验(二)

在上篇博客中,小胖给大家简单地介绍了一下优效性试验,不知大家明白一点没有,如大家有何问题,尽可拍砖。。。

今天继续讲一下等效/非劣效试验,首先小胖问大家一个问题,为啥要做等效/非劣效试验?其实说起来很简单,现在开发出一种疗效确实优于现有标准治疗的药那有那么容易啊,那你就要得从别的方面考虑了,就是首先保证你的药不差于人家的药的基础上,在别的方面有优势啊,不然人家为什么批准你上市。那这些别的方面的优势是啥呢?

(1)你的药便宜,这个就不用多说了

(2)你的药副作用少,考察一个药可不只是疗效,现在安全性也越来越重要了

(3)你的药服用方式方便,例如,你的是口服,人家的是静脉;你的每周一次,人家的每周三次,等等

(4)你的药的依从性好,这个和服用方式也有较大的关系,当然也包括剂量疗程等方面的考虑

(5)你的药能更好地改善生活质量,这年头病人生活质量改善是越来越时髦了

还有别的很多很多,反正你必须找一个让人家审评机构认可的理由,不然谁批准你啊!

关于这个非劣效检验的问题,小胖不得不先在这里发一下牢骚,可能大家也知道现在国内临床试验的现状,这几年还好,以前大家做临床试验基本上就是找个对照药,每组做个100例,两者一比较,如果p<0.05,求之不得,如果P>0.05,ok!说俺的药和人家的药没啥区别,SFDA也就稀里糊涂地批了。现在吗,进步了,SFDA也学习人家,开始在试验设计和统计上有要求了,但在缺乏原创的中国,优效试验(当然安慰剂排除)是没啥把握的,只好非劣效试验了,但非劣效试验的样本量大家是知道的,一般情况下是优效试验的4倍以上,但咱的药厂就算是外资药厂,动不动就几百个病人的试验,在这个还是销售市场驱动的中国市场,何以承受!所以现在很多药厂频频打擦边球,SFDA呢,我也不知道他怎么办的,不好评述,

反正不敢恭维。。。

小胖这几年做下来的感觉,一句话SFDA和FDA的差距比中国和美国经济的差距还大,不过也没办法,人家FDA多少年了,你SFDA才几年啊,况且你SFDA面对的是仿制药横行的中国,其实冷静下来想,最适合的就是最好的,也许这是最适合中国国情的,况且它也在不断进步中,对比这几年的变化,小胖也应该为他鼓掌。。。

跑题了,跑题了,^_^。。。

下次小胖一定言归正传,好了,下次继续。。。

小胖说统计之五:优效、等效和非劣效试验(三)

上篇博客中,小胖发了一通牢骚,还望众弟兄见谅,今天小胖给大家谈一下等效性试验。

首先等效性试验的目的是显示试验药物的等同于对照药,这里大家要注意了,你的药要和人家的药疗效相同,既不能优于人家,也不能差于人家哦。

等效性试验主要在生物等效性研究中使用,在中国还真不少用。为啥,咱仿制药多哦,和人家原创药怎么也得做个生物等效吧。但是在生物等效性试验不可行的情况下,需做临床等效,比如说一些吸入的或局部给药的药物。

生物等效性试验一般比较药代动力学参数的90%可信区间,而临床等效呢,一般是95%可信区间。

等效性检验采用双侧可信区间,当可信区间完全落在等效界值之内,则推断为等效。至于界值咋确定,这个关键的问题小胖下次重点白话一下。。。

今儿,周末了,少写点,小胖要早点休息了。。祝大家周末愉快!

小胖说统计之六:优效、等效和非劣效试验(四)

经过一个周末的休息调整,小胖开博继续,今天着重给大家讨论一下非劣效试验界值的选择问题。

首先看看非劣效试验的目的,显示试验药物的疗效在临床上不劣于阳性对照药,说白了就是证明您的药不差于人家的药。要做非劣效试验有两点特别重要,啥呢?

一是选择对照药,当然你选择的对照组必须是广泛应用的,已被证实疗效的标准用药,特别强调的是对照药以前必须在过往的优效性临床试验中证实疗效,这点不难理解,你选择了和安慰剂差不多的药做对照,还说自己的药非劣于它,这不找死吗。

二是确定非劣效界值,这是重中之重。咋确定呢?小胖在这必须严正指出,非劣效界值的确定取决于临床实践,必须由临床医生作出,统计师只是在统计理论上加以考虑,那种把非劣效界值确定一股脑全部抛给统计师的做法是相当错误的,也是极端不负责任的,从这个角度,什么SFDA规定的必须在15%还有什么20%或者其他数字之内的说法都是极不科学的。其实非劣效界值的确定,小胖总结了三原则:

1.必须基于临床判断和统计理论的结合,上边已说,不再赘述

2.必须小于对照药和安慰剂之间疗效的差异,很好理解,比如对照药和安慰剂之间应答率差异总共才10%,你整个非劣效界值15%,那你的药还有啥疗效,还成了负疗效不成。。。3.不能高于最小的临床有意义的差异值,比较拗口,啥意思呢,举个例子,比如临床上认为治疗某种疾病,在应答率方面如果有超过10%的差异就算有临床意义了,那么我们确定的非劣效界值就不能高于10%。这也很好理解,你确定的界值如果大于这个值,比如15%了,就算你作出来差个14%,虽说满足了非劣效界值的要求,但在临床上你差个14%,从临床上判断这个差别就是有临床意义的差别,就很难被临床接受。

非劣效界值的确定是个很复杂的工作,没有一个统一具体的定量的规定,都是case by case 的,不能搞一刀切。作为提高国内临床试验质量的主体,研究者包括临床医生必须明确自己在其中的主导作用,而不是一味地推诿给sponsor,推诿给统计师,讲到这里,我们不得不承认我们的研究者在临床试验的道路上还有不少路要走。。。

关于非劣效界值的确定,EMEA有一个专门的guideline,

www.emea.europa.eu/pdfs/human/ewp/215899en.pdf;FDA的guideline好像也会在不久以后颁布,其研究也在不断完善中。。。

小胖说统计之七:优效、等效和非劣效试验(五)

上次博客中,小胖着重给大家介绍了一下非劣效界值的选择,今天继续讲一下非劣效试验的其他方面的东西。

怎么证实非劣效呢,很简单,根据非劣效界值D,非劣效性检验通常采用单侧95%可信区间,如果两组疗效差值的95%可信区间的下限大于-D,则推断为非劣效。比如你在研究设计中确定非劣效界值为5%,那么你的药减去人家的药的差值的95%可信区间的下限如果大于-5%,OK!恭喜!侬的要过关了!

在这里我们要坚决讨伐一下以前国内的某些临床试验,有些人对两组的疗效进行比较,发现P>0.05, 就说他的药非劣于或等于人家的药,这种推断是十分错误的。

讲了非劣效了,有人会问小胖了,有没有可能本来你设计成非劣效试验,结果作出来是优效的了。当然有这种情况,咱们可以在证实了非劣效的基础上再寻求优效啊,呵呵,没办法,人总得往高处走啊,要真能证实了优效,那不是意外之馅饼,何乐而不为呢。那具体上怎么实现呢?首先,你必须在方案中说明,比如说俺这个试验设计为非劣效试验或优效性试验,啥意思呢,就是说首先证实非劣效,然后在非劣效的基础上,满足什么条件,就推断为优效,诸如此般的说法,至于啥条件呢,就是两组疗效差异的95%可信区间的下限不仅大于-D,还大于0。方案中一旦规定好了,就相当于咱这是事先规定的,不是事后诸葛亮,ok,下一步就根据你的95%可信区间下限来判断了。

在这里小胖又得罗索一下,也是俺多年悟出来的真理啊,临床试验统计的第一原则是什么,小胖告诉你,是计划,英文叫planned,就是你所有的统计方法都必须在方案中或统计分析计划书中事先规定好,不能等到数据分析时,来这个,来那个,这种ad hoc 分析都是不对的,统计学上有个专业术语,你这样就会产生bias,而我们所要做的就是要减少bias。

还有人会问小胖,我们能不能先设计个优效试验,如果优效试验不满足的话,再证实非劣效,小胖说的是可以,和从非劣效到优效的转换一样,你必须在方案中说明,特别是对非劣效界值确定的说明。

以上就是小胖所讲的优效和非劣效之间的转换,小胖看到过比较多的从非劣效到优效的转换,但从优效到非劣效的转换很少,当然这与许多因素有关,在此不再详述。

关于优效和非劣效之间的转换,EMEA也有个专门的guideline:www.emea.europa.eu/pdfs/human/ewp/048299en.pdf,有兴趣的同学可以阅读一下,受益匪浅哦。

小胖说统计之八:如何从统计角度来review研究方案(一)

一个临床试验研究方案的撰写,离不开统计,那么对于一个完整的研究方案,从统计角度它应该包括什么内容,或者一个统计师应从那些方面来review呢,小胖从今天开始陆续在此小谈一下,个人愚见,仅供参考。

1.必须有具体明确的研究目的。这点勿容置疑,如果你连研究目的和用来证实研究目的的终点指标都没搞清楚,你就别做了,准备洗洗睡吧。。。研究目的是啥?研究目的就是你做这个试验想要回答的问题。设立正确的研究目的是临床试验最关键的一部分。研究目的一旦确定,它就直接决定着你的临床试验设计、数据的收集、数据的分析乃至最后的结论的确立和解释,因此研究目的可谓整个临床试验的基石。当我们review我们临床试验的研究目的时,首先要问自己两个问题:

(1)这个研究目的是否合理和切合实际?很简单咱不能做不切实际的幻想。。

(2)这个研究目的可否可以被证实,就是说根据我们的研究方案能否回答我们的研究目的。研究目的应该尽量具体化,而不是仅仅说确立某某药的疗效和安全性。研究目的不宜过多,如果研究目的不止一个,那么应对研究目的进行排序。

2.必须有清楚的终点指标(endpoints)。一般会有主要终点和次要终点。主要终点是临床

试验最重要的指标,能最确切地反应药物的疗效或安全性。通常情况下,主要终点只有一个,这也是最理想的状态,当然在一些疾病的临床试验中,需要同时从两个方面对疗效进行评估,这时会出现co-primary endpoints。如果存在多个主要终点时,就要考虑控制I类错误。所以小胖建议大家在设计临床试验时,尽量选择单一的主要终点,比较易于设计、分析和解释。主要终点也是样本量计算的依据,这一点很重要哦。还有一点小胖要提醒大家的是,在选择主要终点时,尽量选择客观性指标。如果选择一些生活质量评分诸如此类的主观性指标,很容易在研究者评分或受试者评分时产生较大的偏倚,小胖就曾看到过双盲安慰剂对照的临床试验因为把所谓的受试者评分作为主要终点,结果因为产生较大的偏倚而导致失败的例子,因此说实话,特别是在国内,这种主观性的评分还是不要作为主要终点为好,来自研究者、受试者以及各方面的偏倚会很多。。。关于次要终点,就强调两点,一是必须与试验目的相关,二是数目不要太多。

好了,今天先讲这两点,下次待续。。。

小胖说统计之九:如何从统计角度来review研究方案(二)

接上篇博文,继续从统计角度review研究方案:

3.终点指标的定义和测量方法。在研究方案中必须加以详细描述,特别注意一些关键的时间点的定义,比如基线和终点时间等。这对以后的统计分析至关重要。这里需要强调的是在一些肿瘤临床试验中,终点指标的定义比如应答的定义等。测量方法比如MMR等的描述必须详细准确。

4.符合入选/排除标准的研究人群。小胖在这里简单说两句。你可以首先简单问自己两个问题,一是你选择的人群的疾病是不是太轻度以至于无法检测出差异,二是你选择的人群的疾病是不是太严重以至于无法检测出差异。另外,小胖需要说的是,一些标准可以在入选标准中出现,也可以在排除标准中出现,而不用在入选/排除标准中同时出现。现在很多方案,明明在入选标准中已经说明了,非要在排除标准中再不厌其烦地反着说一遍。比如你在入选标

准里规定了18-75岁的受试者,结果你还要在排除标准里写上年龄<18或>75的受试者。不是说不对,但小胖认为这样不大专业。。。

5.入组和随机化分配方法。方案中应详细说明受试者入组和随机化分配方法。随机化方法主要有简单随机化、区组随机化和分层随机化。现在我们的多中心试验大部分采取的是以中心为分层因素的中心区组随机化。至于具体的随机化方法,小胖将在以后的博文中设立专题介绍,这里不再赘述。

好了,周末了,外边还下雨,今天就讲这三点,下次继续。。。

小胖说统计之十:如何从统计角度来review研究方案(三)

6.根据研究目的确定样本量。样本量的计算也许是统计师遇到的最常见的问题之一,关于样本量的确定,小胖会在以后单独讨论。在这里小胖先给大家讲几点。一样本量的计算通常应根据主要指标;二是你需要提供给统计师最重要的东西是difference,也就是两组之间的差异(非劣效试验为非劣效界值);三是样本量的计算的关键和难处在于effect size 的估计,这是一个广泛阅读文献和临床实践的过程,当然最难的工作不属于统计师,统计师的工作就是计算,这个吗,简单,有公式,有软件。。。

7.合适的临床试验设计。不好意思,这一项应排在第三位,小胖遗漏了。在review研究设计时,可首先问自己一个问题,就是这个试验设计能不能回答你的研究目的?这是最重要的。啥临床试验设计类型那,有平行设计、交叉设计、析因设计以及现在hot的成组序贯设计等。当然大家接触的最多的是平行设计。当然在比较类型上还有优效、等效和非劣效。这里的临床试验设计包括很多方面,review啥呢,其实把研究方案中的study flow chart看好了,就基本差不多了。。。

8.数据收集。很简单,这是建立database和进行统计分析的基础,无须多言

9.盲底保存和揭盲的方法。这个进局限于盲态试验,这个我相信每个公司都有自己的SOP,具体小胖以后将做介绍。

待续。。。。。

小胖说统计之十一:如何从统计角度来review研究方案(四)

10.中期分析及数据监查的办法。中期分析在肿瘤试验中比较常见,但因涉及到一类错误的调整、独立数据核查机构等较为复杂的问题,在国内临床试验中较为少见。小胖以前一直在强调的一点,就是plan,这一点在中期分析上尤为重要。对中期分析的具体操作方法和统计处理方法必须在研究方案中事先规定,而不能在试验开始后,随便进行到一段时间后,就来个分析,还美其名曰中期分析。。。

11.样本量的核查以及变更。这一点较为少见,主要适用于adaptive design,就是根据中期分析的结果进行样本量的调整。。

12.统计学假设(Hypothesis)。就是你统计检验要检验的东西,这个必须与你的研究目的相对应。

13.多重性问题。主要包括多个主要变量和多个处理组间的比较,在统计学方法上会涉及到一类错误的调整以及对power的影响。

14.对失访、缺失以及方案违背的处理

15.对各种类型数据的统计分析方法,具体说是连续型数据,分类型数据,时间事件数据等。。。16.数据管理和统计分析使用的系统和软件,无非是clintrial,OC,SAS等等。。。

好了,以上几篇文章简单介绍了16项review内容,在以后的博文中,小胖将陆续针对这里边的项目进行专题详细的讨论。。。

小胖说统计之十二:How many subjects do I need? (一)

How many subjects do I need? 这是个问题,是一个临床试验中最常见的问题。在回答此问题前,咱先看看如果咱的临床试验没有足够的样本量会造成啥后果。

大家在临床试验中最常见的就是试验结果无法下结论,明明作出来一个35%,一个20%,相差15%,很明显咱的药很好,可p值却怎么也不小于0.05,咋办,白做了呗,冤啊!这

个还好,要是由于机遇(play of chance)的原因,甚至你的药看起来比人家的药差就玩完了,这可不是吓唬你哦,这种风险可是存在的。其实说到底,最严重的后果是啥,当然是浪费钱了,作了半天,啥都没做出来,甚至还整了个相反的结果,费人费钱费力啊。。。

明白了这个问题的重要性,那谁来回答这个问题呢,研究者和统计师!在这里研究者的知识和假设起着关键作用,而统计师只是进行技术性的计算作用。

那小胖问大家样本量计算难吗?

难!

研究者难!研究者为了确定那几个effect size参数值,需要阅读大量文献,需要长期临床实践,这可真是一个艰难决策的过程。这个难可以理解为科学决策的难!

Sponsor难!样本量的大小直接决定着budget的大小!每个sponsor总想最少的钱办最大的事,可风险呢,怎么平衡呢,难啊!

不难!

统计师不难!咱不怕,等他们决定好了,咱就是动动手,简陋的,有计算器,高级的,有软件。。。PASS、nQuery、EAST等样本量计算软件的出现,让咱的工作更简单了,咱不就是填填参数吗。。。

小胖说统计之十三:How many subjects do I need? (二)

关于样本量的计算,可以分为两类:

1.Precesion-based

2.Power-based

那怎么来选择呢?

让小胖来简单介绍一个判断的过程,在判断前,你可以首先问自己一个问题,即你的研究问题是否涉及到了特定的比较,比如治疗组和安慰剂的比较,治疗组和阳性对照组的比较等?如果你的回答是yes,那么你就应该选择power-based即根据研究假设和把握度等来计算

样本量;如果你的回答是No,那么你就可以选择precison-based,根据估计的精确度来计算样本量。这里还有一种关于比较的特殊情况,即在研究中涉及到了两组间的比较,但研究关心的问题是估计两组之间的差异有多大,那么还应选择precision-based。

啥为precesion-based?

通俗地讲,比如你想知道你的药治疗哮喘的应答率情况,你不能让所有的哮喘病人都吃你的药吧,所以你就要从所有的哮喘病人中选择一定数量的哮喘病人来做临床试验,通过这一部分人的应答率来估计整个哮喘病人的应答率。此时,所有的哮喘病人就是一个总体,所有哮喘病人的应答率就是总体率,而你选择的那一定数量的哮喘病人就是一个样本,那他们的应答率就是样本率。因此,我们做的就是利用样本率来估计总体率,当然通过样本率来估计总体率总会有精确不精确的问题,这时我们就需要对这个精确度(precesion)有个要求,而这个又通过95%可信区间来实现,比如说咱要求咱估计出来的率的95%可信区间在真值的+-5%范围内,你也可以这样简单地理解,就是你临床试验作出来的应答率和整个哮喘人群的应答率的差异不会超过+-5%。此时5%就是这个precesion。很显然precesion越小,你估计的越精确,当然需要的样本量越多。你也可以反过来想想,当你抽取的样本量越大,即做的受试者越多时,你估计出来的结果就越接近总体的真实值啊。。。

小胖说统计之十四:How many subjects do I need? (三)

今天小胖通过例子给大家介绍一下precision-based样本量计算。

precision-based样本量计算最常见于一些单组的观察研究,下边是一个简单的例子:

假设你想做一个A药治疗XX疾病的单组观察试验,主要疗效指标是应答率,那怎么计算样本量呢?

我们先看公式吧

n = z21-α/2*P*(1-P)/d2

那我们继续看里边的参数的意义:

z21-α/2这一般是固定的即α=0.05,此时这个值为1.962

P为你估计的应答率,即你估计的A药治疗XX疾病的应答率

d为precesion,即精确度,即与总体率相差不大于+-d

其实这时你需要确定的是p和d,如果你实在无法估计p,可以用0.5来代替,为什么呢?大家可以看一下公式,P*(1-P)在p=0.5时最大,此时n也最大,即最保守,所以你不知道p的情况下,可以用0.5来代替,此时n最大,这也是最保守的估计。

这样我们需要确定的最关键的是d值。

下边是关于样本量的英文叙述,供大家参考:

A sample size of approximately XX subjects will allow an estimate (using 95% confidence limits) to be within XX of the response rate.

An approximate total sample size of XX patients will provide a precision of XX for 95% confidence interval for the response rate.

至于中文,比较拗口,仅供参考,大家可以有更好的说法。。。

大约需要XX例受试者以95%可信区间可使应答率在真值的XX范围内。

小胖说统计之十五:How many subjects do I need? (四)

今天小胖给大家简单介绍一下最常见的power-based sample size calculation,不外乎两种最常见的情况,一是连续性变量的比较和分类变量的比较。

1. 连续性变量:

假如你想比较治疗组与对照组某个变量的均值,那么每组需要的样本量是:

N=f(α,β)*2*S2/δ2

f(α,β):根据α和β计算所得,最常用的为:

当α=0.05, β=0.2时,f(α,β)=7.9

统计学中的基本概念

1、2 统计学得几个基本概念 1、2、1 总体与总体单位 1、总体 (1)总体得概念:总体就是指客观存在得、具有某种共同性质得许多个别事物组成得整体; 在统计研究过程当中,统计研究得目得与任务居于支配与主导得地位,有什么样得研究目得就应该有什么样得统计总体与之相适应。例如:要研究我们学院教师得工资情况,那么全体教师就就是研究得总体,其中得每一位教师就就是总体单位;如果要了解某班50个学生得学习情况,则总体就就是该班得50名学生,每一名学生就是总体单位。根据我们研究目得得不同,我们要选取得研究对象也就就是研究总体相应地要发生变化。 (2)总体得分类: 总体根据总体单位就是否可以计量分为有限总体与无限总体: ★有限总体:指所包含得单位数就是有限得总体。 如一个企业得全体职工、一个国家得全部人口等都就是有限总体; ★无限总体:指所包含得单位数目就是无限得,或准确度量它得单位数就是不经济或没有必要得,这样得总体称为无限总体。 如企业生产中连续生产得大量产品,江河湖海中生长得鱼得尾数等等。 划分有限总体与无限总体对于统计工作得意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体得特征: ★大量性:就是指构成总体得单位数要足够得多,总体应由大量得单位所构成。大量性就是对统计总体得基本要求。 个别单位得现象或表现有很大得偶然性,而大量单位得现象综合

则相对稳定。因此,现象得规律性只能在大量个别单位得汇总综合中才能表现出来。只有数量足够得多,才能准确地反应我们要研究得总体得特征,达到我们得研究目得。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性就是构成统计总体得前提条件。 ★变异性:即构成总体得各个单位除了至少在某一方面具有共同性质外,在其她方面具有一定得差异。差异性就是统计研究得主要内容。 如以一个班级得所有学生作为一个总体,则“专业”就是该总体得同质性,而“性别”、“籍贯”等则就是个体之间得变异性;以我院全体教师为一个总体,则“工作单位”就是其同质性,而“学历”、“月工资”等则就是它得变异性。 需要特别说明得三个问题: ★变异就是客观存在得,没有变异得事物就是不存在得; ★变异对于统计非常重要,没有变异就没有统计。这就是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位得资料就可以推断总体情况了; ★变异性与同质性之间相互联系、相互补充,就是辩证统一得关系。用同质性否定变异性或用变异性否定同质性都就是错误得。 2、总体单位 就是构成总体得每一个个体。 【思维动起来】 对2015年10月份某市小学生得近视情况进行调查: 统计总体就是什么?总体单位就是什么? 总体得同质性就是什么?变异性就是什么? 3、总体与总体单位得关系 在统计研究中,确定统计总体与总体单位就是十分重要得,它决定于统计研究目得与认识对象得性质。在一次特定范围、目得得统计研究中,统计总体与总体单位就是不容混淆得,二者得含义就是确切得,

统计学中的基本概念

1.2 统计学的几个基本概念 1.2.1 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。 划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。 如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的; ★变异对于统计非常重要,没有变异就没有统计。这是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位的资料就可以推断总体情况了; ★变异性和同质性之间相互联系、相互补充,是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位 是构成总体的每一个个体。 【思维动起来】 对2015年10月份某市小学生的近视情况进行调查: 统计总体是什么?总体单位是什么? 总体的同质性是什么?变异性是什么? 3.总体和总体单位的关系 在统计研究中,确定统计总体和总体单位是十分重要的,它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系,但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

临床试验中的统计学若干问题

临床试验中的统计学若干问题 ——《小胖说统计》系列日志节选(一)

前言 “统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视,这是因为对很多寄主来说,如果没有寄生虫就会死。对有的动物来说,如果没有寄生虫就不能消化它们的食物。因此,人类奋斗的很多领域,如果没有统计学,虽然不会死亡,但一定会变得很弱” -L.J.Savage “统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。” -H.G.Wells 统计学研究的是来自各领域的数据,由解决其他领域内的问题而存在并发展。这一点对临床试验生物统计学也不例外,临床试验的大力发展催生并发展了统计在制药行业的应用。对于每个从事临床试验工作的人来说,我们并不都需要你通晓每种统计方法的由来,我们需要的是你用一种统计的思维方式来看待和判断临床试验中的问题。 基于此小胖结合自己在临床试验生物统计方面微不足道的经历,于2008年6月推出了自己的日志系列《小胖说统计》,初衷在于在不侧重复杂的统计理论和计算的基础上,通过一些浅显易懂的语言,简单介绍一下临床试验中一些生物统计的基本知识,并希望能成为和广大临床试验同行进行交流的平台。 承蒙广大网友的抬爱,《小胖说统计》推出后受到了大家的认可,至今已发表约180篇博文。为了方便大家的阅读,应广大网友的要求,特对《小胖说统计》中的主要内容加以节选,所有内容均属个人观点,仅供参考,欢迎大家批评指正。 《小胖说统计》系列日志将会继续进行持续更新,详细内容可参见以下链接: https://www.doczj.com/doc/6510293458.html,/2113 https://www.doczj.com/doc/6510293458.html,/ucenterhome/5612 在此对长期关注和支持《小胖说统计》系列日志的公卫论坛和药物临床试验论坛的广大坛友表示感谢。

ICH E9临床试验的统计学指导原则解析

ICH E9临床试验的统计学指导原则解析 ICH E9 Statistical principles for clinical trials (临床试验的统计学指导原则)可谓生物统计师的bible,目的在于协调欧洲、日本和美国在进行药品上市申请的临床试验时所应用的统计学方法的指导原则。虽说中国是协调三方之外的国家,SFDA还为此另外制定了自己的《化学药物和生物制品临床试验的生物统计学技术指导原则》,但其内容基本还是照抄翻译了ICH E9的内容。 首先,我们先看一下ICH E9的内容概况: 1.引言 2.整个临床试验的基本考虑 3.试验设计中的基本考虑 4.试验进行中的基本考虑 5.数据分析 6.安全性与耐受性评价 7.研究报告 临床研发计划中的统计思维 众所周知,药物临床研究的主要目标就是以最小的成本和最快的时间,科学地评估有希望进入市场的药物的风险-效益。万事计划为先,为了保证药物研发的成功,制定一个临床研发计划(clinical development plan)是十分必要的。 那什么是临床研发计划包括哪些内容呢? 通常地,临床研发计划包括研发依据、试验的一些基本情况、时间表、预算以及所需的人力物力财力资源等。 在大多数公司,在开展一项临床试验前,可能不会有一项正规的成文的临床研发计划,但总会考虑到上述这些内容。 尽管临床研发计划的确定主要基于医学和科学的正确合理,但其他方面比如生物统计、注册、市场甚至管理层的影响也同等重要。 在这里我们重点讨论一下,统计在临床研发中的作用。首先,管理者在做临床研发计划时希望从生物统计师这里获得一些有助于他们决策的有用的信息。他们需要在市场销售、医学、注册等各方面追求一个平衡。他们需要明确知道药物研发的风险收益。 Confirmatory Trial(验证性试验)和Exploratory Trial (探索性试验) 对整个临床试验的角度考虑,我们通常可以把临床试验分为Confirmatory Trial(验证性试验)和Exploratory Trial (探索性试验)两种类型。 什么是验证性试验呢?简单地讲,验证性试验就是检验假设(hypothesis-testing)的试验,是一种事先提出假设,并对其进行检验的有对照组的试验。可以提供疗效和安全性方面的确定的证据。我们进行的验证性试验包括所有的III期试验、大多数IV期试验以及一些晚期的II期试验。当然对于验证性试验,我们接触最多的便是III期注册试验。其中验证性试验最核心的部分就是假设(Hypothesis),而对于它必须做到: 1.假设必须直接根据试验的主要目的确定 2.假设必须在试验前事先确定 3.假设必须在试验完成后进行检验 与之对应的探索性试验,对数据作一些探索分析,可能会做一些假设检验,但这些假设不需要是事先确定的,而是根据数据的特点而定的,因此不能作为证实疗效的正式依据。虽然说

临床试验中的统计学讲解

小胖说统计之一:认识α,β 要了解生物统计在临床试验中的应用,首先需从认识α,β开始,就是这两个不起眼的符号贯穿了临床试验生物统计的始终。α和β的定义是比较拗口的,特别是对于那些没学过统计的人来说,这两个东西是怎么也搞不明白具体是怎么回事。虽然比较拗口,但咱还得在这里重复一下α和β的科学定义:α又称第I类错误或显著性水平,指拒绝了实际上成立的H0,β又称第II类错误,指不拒绝实际上不成立的H0。对应β的还有一个概念叫power,国内翻译为把握度,它等于1-β,指拒绝实际上不成立的H0的概率。 说得通俗一点,临床试验中你会犯俩错误,一种错误就是两种药本来没啥区别,却说 成您的药优于人家的药,这就是α;另一种错误就是你的药的确优于人家的药,却说成两 种药没啥区别,这就是β。那1-β呢,就是咱的优秀药物被发现的概率啊。 不知道,上边的解释,您听明白了吗?如果听明白了,小胖要问您了,谁应该最关心α啊,那又谁应该最关心β啊? 最关心α的当然是我们伟大的SFDA以及诸如FDA之类的药品审批机构啊,为啥?他们当然不希望一种药明明和别的药没啥区别,却被药厂说成疗效更好,换言之,他们可不希 望审批无效的药物进入市场。所以啊,它们要限定这种错误发生的概率,也就是我们的α了,一般情况下,α被限定为0.05。 最关心β的当然是我们的药厂了,为啥?为钱,哈哈!药厂当然不希望明明他的药优 于别人的药,却被说成两种药没啥区别吧,所以它们希望降低这种错误发生的概率,也就 是降低β了。换言之,他希望提高把握度(1-β),使自己的药能有更高的概率作出来优于别的药物,从而进入市场,赚取钞票。。。一般情况下,β应小于0.2,甚至0.1,对应的把握度为80%或90%。 当然药厂降低β,也就是提高把握度,会提高你试验成功的概率,但这也同时意味着 同等条件下样本量的增加,样本量的增加就意味着money的增加,这些都是矛盾的,没办法,谁让这世界本来就是一个矛盾的世界呢,你只好去权衡利弊,找个平衡点呗。。。 今天就到这里吧,休息,休息。。。

统计学基本概念

基本概念 1、统计的含义:统计工作、统计资料、统计学 2、社会经济统计学的特点:数量性、社会性、综合性 3、统计工作的职能:统计信息职能、统计咨询职能、统计监督职能 4、统计工作过程:统计调查、统计整理、统计分析 5、统计调查的质量要求:准确性、全面性、及时性、有效性 6、专门调查的方法:普查、重点调查、典型调查、抽样调查 7、统计调查的方法:直接观察法、报告法、采访法、通讯法、实验调查法、网上调查法 8、次数分布的主要类型:钟型分布、U型分布、J型分布 9、统计表的结构,从组成要素看,由总标题、横行与纵栏标题、指标数值等三部分组成 10、统计表的结构,从容上看,由主词、宾词两部分构成 11、统计分析方法:综合指标、动态数列、统计指数、相关回归、抽样推断 12、综合指标从它的作用和方法特点的角度可概括为三类:总量指标、相对指标、平均指标 13、相对指标的种类:计划完成相对指标、结构相对指标、比例相对指标、比较相对指标、强度相对指标、动态相对指标 14、平均指标的种类:算术平均数、调和平均数、几何平均数、众数、中位数 15、测定标志变动度的主要方法:全距、四分位差、平均差、标准差、离散系数

16、动态数列按构成其指标数值的性质不同分为:绝对数动态数列、相对数动态数列、平均数动态数列 17、动态数列的水平分析指标:发展水平、平均发展水平、增长量、平均增长量 18、动态数列的速度分析指标:发展速度、增长速度、平均发展速度、平均增长速度 19、测定长期趋势常用的主要方法:间隔扩大法、移动平均法、最小平方法 20、指数按其反映指标性质不同分为:数量指标指数和质量指标指数 21、指数按其表现形式不同分为:综合指数、平均指数、平均指标对比指数 22、相关关系按其方向不同分为:正相关和负相关 23、相关关系按其涉及因素多少分为:单相关和复相关 24、相关关系按其形式不同分为:直线相关和曲线相关 25、抽样调查的组织形式:简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样 26、总体参数的抽样估计方法为点估计和区间估计。 统计分析 1.某市某“五年计划”规定计划期最末一年甲产品产量应达到75万吨,假定每天产量相等,实际生产情况如下表所示(单位:万吨)。试计算该市甲产品产量五年计划完成程度和提前完成计划的时间。 第一年第二年第三年56 58 62 第四年一季二季三季四季16 17 18 18

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

临床试验中常用统计分析方法

临床试验中常用统计分析方法 ---统计分析的质量是与临床试验的设计、实施和数据管理密切相关的。就统计分析本身而言,其指导思想是使偏差最小和避免I类错误的增大。 定性资料的统计分析方法 统计学试验设计:包括确定样本量的大小、试验设计方法(盲法/开放)(具体见有关章节) 1. 定性资料的概念: ---统计资料中按品质和属性分组计数所得的资料,由定性变量和频数两部分组成。定性变量可分为名义变量(如治疗方法分甲、乙、丙等)和有序变量(如疗效结果分治愈、显效、有效、无效)。 ---新药临床研究中,定性资料常用的统计检验方法有卡方检验、校正的卡方检验、Fisher精确检验及Ridit检验、秩和检验。 2. 定性资料的统计描述计算率、比等指标,如试验组和对照组的有效率,并可用各种统计图来表示。 3. x2检验 ---治疗前年龄、性别、病程、病情等一般情况组间均衡性比较,治疗后计数资料的改善情况比较均为双向无序R×C 表资料,用x2检验。当表中理论频数小于5的格子数超过

全部格子数的1/5时,应用Fisher精确检验。 ---如果为2×2表资料,当总样本含量n≥40,且理论频数T均大于5时,用x2检验;当总样本含量n≥40,单有理论频数满足1≤T<5时,用校正的x2检验;当总样本含量n <40或有理论频数<l时,用Fisher精确检验。 ---目前,各种计算机统计软件的应用(如SAS)使统计学分析中复杂得运算过程简单化,有条件将双向无序R×C表资料均进行Fisher精确检验。 4. 秩和检验 ---进行组间疗效比较或对量化的症状、体征的改善进行组间比较以及考察疗效与年龄、性别等相关性分析时,这些资料属于单向有序R×C表资料,应采用与"有序性"有联系的秩和检验或Ridit检验。 ---秩和检验的优势在于它不仅可判断各组间是否有显著性差异,而且可说明对比各组的效果优劣和强弱是x2检验无法做到的。 ---对于单向有序R×C表资料,Ridit检验和秩和检验的意义完全相同,根据试验者的习惯及熟练程度选一种即可。 5. 定性资料统计分析注意事项 (1) 不可用x2检验分析一切列联表资料,要根据列联表中定性变量的性质决定统计分析方法。 (2) x2检验中资料要满足公式的要求,不可盲目套用。

统计学中的基本概念

统计学的几个基本概念 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。 划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。 如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的; ★变异对于统计非常重要,没有变异就没有统计。这是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位的资料就可以推断总体情况了; ★变异性和同质性之间相互联系、相互补充,是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位 是构成总体的每一个个体。 【思维动起来】 对2015年10月份某市小学生的近视情况进行调查: 统计总体是什么总体单位是什么 总体的同质性是什么变异性是什么 3.总体和总体单位的关系 在统计研究中,确定统计总体和总体单位是十分重要的,它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系,但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

统计学中的基本概念

1、2统计学得几个基本概念 1. 2. 1总体与总体单位 1、总体 ⑴总体得概念:总体就是指客观存在得、具有某种共同性质得许多个别事物组成得整体; 在统计硏究过程当中,统计研究得目得与任务居于支配与主导得地位, 有什么样得硏究目得就应该有什么样得统计总体与之相适应。例如:要硏究 我们学院教师得工资情况,那么全体教师就就是研究得总体,其中得每一位 教师就就是总体单位;如果要了解某班50个学生得学习情况,则总体就就是该班得50名学生,每一名学生就是总体单位。根据我们研究目得得不同,我们要选取得研究对象也就就是研究总体相应地要发生变化。 ⑵总体得分类: 总体根据总体单位就是否可以计量分为有限总体与无限总体:★有限总体:指所包含得单位数就是有限得总体。 如一个企业得全体职工、一个国家得全部人口等都就是有限总体; ★无限总体:指所包含得单位数目就是无限得,或准确度量它得单位数就是不经济或没有必受寻这样得总体称为无限总体。 如企业生产中连续生产得大量产品,江河湖海中生长得鱼得尾数 划分有限总体与无限总体对于统计工作得意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进 行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位 进行非全面调查,据以推断总体。 ⑶总体得特征: ★大量性:就是指构成总体得单位数要足够得多,总体应由大量得单位所构成。大量性就是对统计总体得基本要求。 个别单位得现象或表现有很大得偶然性,而大量单位得现象综合则相对稳定。因此,现象得规律性只能在大量个别单位得汇总综合中才能表现出来。只有数量足够得多,才能准确地反应我们要研究得总体得特征,达到我们得研究目得。

统计学基本概念

日志吕品吕品的日志当前日志返回日志首页? 较新一篇/ 较旧一篇 分享 1. 统计学:收集处理分析解释数据并从数据中得出结论的科学。 2. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。 3. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。 4. 分类数据:只能归于某一类别的非数字型数据。 5. 顺序数... 如果你也考统计学~~~~~网上搜索到的统计学基本概念~~~~~ 2011-05-28 12:06 | (分类:默认分类) 1. 统计学:收集处理分析解释数据并从数据中得出结论的科学。 2. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。 3. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。 4. 分类数据:只能归于某一类别的非数字型数据。

5. 顺序数据:只能归于某一有序类别的非数字型数据。 6. 数值型数据:按数字尺度测量的观察值。 7. 观测数据:通过调查或观测而收集到的数据。 8. 实验数据:在实验中控制实验对象而收集到的数据。 9. 截面数据:在相同或近似相同的时间点上收集的数据。 10. 时间序列数据:在不同时间上收集到的数据,这类数据按时间顺序收集到的。 11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,根据样本调查结果来推断总体特征的数据收集方法。

12. 普查:为特定目的而专门组织的全面调查。 13. 总体:包含所研究的全部个体(数据)的集合。 14. 样本:从总体中抽取的一部分元素的集合。 15. 样本容量:也称样本量,是构成样本的元素数目。 16. 参数:用来描述总体特征的概括性数字度量。 17. 统计量:用来描述样本特征的概括性数字度量。 18. 变量:说明现象某种特征的概念。 19. 分类变量:说明事物类别的一个名称。 20. 顺序变量:说明事物有序类别的一个名称。

临床试验中的统计学要求(DOC)

临床试验中的统计学要求 临床试验是以病人为研究对象,比较临床治疗干预措施和对照措施的效果及其临床价值的前瞻性研究。临床试验以人为研究对象,与动物实验不同。在临床试验中,研究者不能完全支配病人的行为,只能要求病人避免采用某些干扰试验的治疗或行为,因此必须考虑病人的依从性问题。临床试验还必须考虑医学伦理学问题,当新药已被证实对病人弊大于利,尽管试验仍未完成,也要中止。当已经存在经医学验证对试验疾病有效的药物时,使用安慰剂对照是不适当的。当病人出现紧急情况需要额外治疗措施时,也必须给予。因此临床试验要面对比动物实验更多的问题,在设计上有着更严格的特殊要求。 新药的临床试验分为Ⅰ、Ⅱ、Ⅲ、Ⅳ期:Ⅰ期临床试验是初步的临床药理学及人体安全性评价试验,观察人体对于新药的耐受程度和药物代谢动力学,为制定给药方案提供依据;Ⅱ期临床试验是随机盲法对照临床试验,对新药有效性及安全性作出初步评价,推荐临床给药剂量;Ⅲ期临床试验是扩大的多中心临床试验,遵循随机对照原则,进一步评价有效性和安全性;Ⅳ期临床试验是新药上市后的监测,在广泛使用条件下考察疗效和不良反应,尤其是罕见不良反应。本节主要讨论II期和III期临床试验的统计学要求。 例11.1 临床观察发现急性心肌梗塞后,梗塞区膨出和左心室重构常导致左心室增大和心功能不全。为研究急性心肌梗塞后长期使用卡托普利治疗对心脏的保护作用,需设计一个药物疗效评价的临床试验,在设计中要考虑以下问题。 1.观察变量的选择 (1)主要变量和次要变量主要变量 (primary variable)又称目标变量(target variable),即能够为临床试验目的提供可信证据的变量。临床试验的主要变量一般只有一个,必要时可有多个。主要变量应易于量化、客观性强、被相关研究领域所公认。次要变量(secondary variable)是指与试验主要目的有关的附加的变量,也可以是与试验次要目的有关的变量。两种变量均应在临床试验的设计方案中明确定义,并说明其被选择的理由。临床试验的样本含量估计、疗效或安全性评价应以主要变量为依据。 (2)复合变量(compound variable) 当与临床试验主要目的有关的变量很多,难以确定单一的主要变量时,可预先确定一种综合计算方法(如求和,加权求和等),或用多元分析的方法(如主成分分析等)将多个变量综合成一个复合变量,如临床研究中采用的各种量表就是一种复合变量。当组成复合变量的某些单项变量具有临床意义时,也可以单独进行统计分析。 (3)全局评价变量(global assessment variable) 将客观指标和研究者对病人的病情及其改变总的印象综合起来所设定的变量称为全局评价变量,它通常是有序分类变量。全局评价变量往往带有一定的主观成份。因此,如果需选择全局评价变量,应在方案中明确说明它与试验的主要目的有关,有选择的依据和可靠的基础,同时具有明确判断等级的方法。客观性较好的全局评价变量应该作为主要变量之一单独加以考虑。 例11.1中,研究目的是为评价卡托普利治疗对左心室容量、收缩功能和舒张充盈的作用,因此主要指标是用多普勒超声心动图测定左心室容量和射血分数。次要变量可选择左心室充盈速率。评价左心室容量和充盈速率的变量有多个,各变量的结果不一致时,难以对药物作总的结论。因此在统计分析时可以将多个变量综合成一个变量进行分析,这综合变量就是复合变量。上例中研究的最终目的是卡托普利治疗对心功能的保护作用,因此可以选择心功能级别作为全局评价变量。 2.对照组的选择 临床试验中对照组与试验组唯一的差别是试验组中受试者接受新药治疗, 而对照组的受试者则接受对照药物的治疗。 临床试验要求试验组和对照组来自相同的受试者总体。两组受试者不但在试验开始时要求基本情况相似, 而且在试验进行中除了试验药物不同外, 其它条件均需保持一致。临床试验中常用的对照组设置有以下3种类型: (1)安慰剂对照安慰剂(placebo)是一种虚拟药物, 其外观剂型、大小、颜色、重量、气味和口味等都与试验药尽可能保持一致, 但不含有试验药物的有效成份。设置安慰剂对照的目的在于消除研究者、受试者和参与评价人员等由心理因素等影响而形成的偏倚,分离出由试验药物所引起的真正的效应和不良反应。安慰剂可以用于平行对照或自身交叉对照。 (2)阳性药物对照在临床试验中采用已知的、已批准上市的有效药物作为试验药的对照, 称为阳性药物对照。阳性对照药物必须是合法的、公认有效的、并对所研究的适应症最为有效安全的药物。设计方案可以是平行对照也可以是自身交叉对照。 (3)剂量-反应对照将试验药物设计成几个剂量, 而受试者随机地分入其中一个剂量组;它可以包括安慰剂对照即零剂量,也可以不包括安慰剂组。剂量-反应对照主要用于研究剂量与疗效和不良反应的关系, 或者仅用于说明疗效。剂量-反应对照有助于回答给药方案中采用的剂量是否合适。 例11.1中急性心肌梗塞病人不适宜采用安慰剂对照,因此采用常规治疗包括溶栓剂、阿斯匹林等作阳性药物

统计学中的基本概念

变异 ?同质~性质相同。是指基本条件相同 变异~同质事物之间的差异。是指不同的个体在相同的条件下,对外界环境因素的反应不同 ?总体Population:根据研究目的所确定的同质观察单位的全体; ?个体Individual:是构成总体的最基本观察单位; ?根据随机化原则有总体中随机抽取部分个体组成总体的过程 ?样本Sample:是从总体中按照一定的目的随机抽取的一部分个体。为什么要抽样? ?样本含量Sample Size:样本中包含的个体个数。 抽样原则 一个样本应具有: “代表性(representative)” “随机性(randomization)” “可靠性(reliability)” 如果进行两个或多个样本之间的比较,要求:每二个样本之间应具有:可比性(comparable) 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 误差(error) ?系统误差(system error) ?由于固定的原因(常见实验条件),影响资料的准确性。可以克服。 ?随机测量误差(random measurement error) ?由于偶然的因素造成同一对象多次测量结果的差异。可控制但不可 消除。 应采取措施,尽最大可能在一定的允许范围内 抽样误差(sampling error) 抽样的原因造成统计量与总体参数或不同样本统计量之间的差异。 原因:①个体变异②抽样 抽样误差,对它要用统计方法进行正确分析 概率 ?概率有古典概率与统计概率之分, ?医学上常用的是统计概率f/N ?必然事件,概率为1 ?不可能事件,概率为0 ?小概率事件,P≤0.05 或P≤0.01 ?常把P≤0.05 作为事物差别有统计学意义的界限,

统计学中的基本概念

. 1.2 统计学的几个基本概念 1.2.1 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们

设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中;.. . 才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的;

临床试验中的统计学知识

数据统计方法与临床试验方案 5.1.1统计在新药临床试验中的重要作用 医药产品的有效性和安全性最终应当由按照GCP原则实施的临床试验来确证。在临床试验的设计和分析中,统计学家起着必不可少的重要作用。GCP、GMP、GLP、GRP和GVP都与统计有关。统计学是一门处理来自群体或个体的大量资料的科学,也是处理资料中变异性的科学和艺术,其目的在于取得可靠的结果。例如,一个医生偶然发现一例患偏头痛病人在喝了橙汁以后感觉有所改善,但这并不是说从这单一个病例观察就可以认为橙汁是治疗偏头痛的有效方法。医生需要统计学资料证明,是否有一组病人在服橙汁后报告症状改善者比采用其他治疗后更多。又如一个每天吸烟50支且嗜酒的人活了95岁并健康良好,但人们不能相信他的习惯能导致健康和长寿。个体对疾病的敏感性变异很大。要研究这些问题,就应当研究不同生活习惯的人群组的发病率和死亡率;也就是说应当进行统计学研究。收集数据、并用统计图表或简单统计量来描述资料的特征称之为描述性统计。但统计学的任务远不止于此,统计学可以通过仔细制订试验计划来提高数据质量;统计推断方法则是从所研究问题的大量数据中得出结论的主要客观手段。应当明白,统计学是在收集、归类、分析和解释大量数据的过程中完成使命的。如果在试验设计阶段不考虑统计原则,所获结果的统计分析不管做的如何精巧都挽救不了一个设计糟糕的临床研究这是一个必须执行的基本原则。 表8 可能导致临床试验失败的原因 在新药研制过程中,按科学原则进行的临床试验是评价一种新治疗方法的有效性和安全性的惟一可靠的基础。一个临床试验,如果不能恰当地评价试验药物的安全性和/或效性,不能提供关于新药的最好使用方式的充分信息或者提供了误导信息,因而不能对药物的研制、管理、上市和安全有效地使用做出有益贡献,那么这就是一个失败的临床试验。可能导致临床试验失败的原因很多,有些原因是可以控制的,有些则是较难控制的。其中试验设计对于临床试验的成功与否起着极其重要的作用。试验假设(阳性对照)选择不当,随机化及盲法

统计学基本概念与EXCEL函数

统计学基本概念与EXCEL函数 编辑自CSDN zxca368 对于一维数据的分析,最常见的就是计算平均值(Mean)、方差(Variance)和标准差(Standard Deviation)。在做【特征工程】的时候,会出现缺失值,那么经常会用到使用平均值或者中位数等进行填充。 一,平均值(Mean) 1,平均值的概念很简单:所有数据之和除以数据点的个数,以此表示数据集的平均大小; 2,平均值的EXCEL函数:AVERAGE 二,方差(Variance),这一概念的目的是为了表示数据集中数据点的离散程度; 1,总体方差 (为总体方差,为变量,为总体均值,为总体例数。)2,样本中各数据与样本平均数的差的平方和的平均数叫做样本方差S2 样本方差的EXCEL函数:VARPA函数 3,样本方差的算术平方根叫做样本标准差。标准差(Standard Deviation,缩写SD),中文环境中又常称均方差,是离均差平方的算术平均数的平方根。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。 标准差的EXCEL函数: STDEV:用途:估算样本的标准偏差。它不计算文本值和逻辑值(如TRUE和FALSE)。它反映了数据相对于平均值(mean)的离散程度。 2.STDEVA:基于样本估算标准偏差。标准偏差反映数值相对于平均值(mean)的离散程度。文本值和逻辑值(如TRUE和FALSE)也将计算在内。 3.STDEVP:用途:返回整个样本总体的标准偏差。它反映了样本总体相对于平均值(mean)的离散程度。 简单说函数stdev的根号里面的分母是n-1,而stdevp是n,如果是抽样当然用stdev.在十个数据的标准偏差如果是总体时就用STDEVP,如果是样本是就用STDEV。

统计学中的基本概念

1.2统计学的几个基本概念 1.2.1总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的 学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等0划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我

相关主题
文本预览
相关文档 最新文档