管理统计学第四章组距数列中位数
- 格式:ppt
- 大小:146.50 KB
- 文档页数:5
第四章综合指标一、单项选择题1.统计指标按其反映总体现象内容的特征不同可分为( B )。
A.客观指标和主观指标B.数量指标和质量指标C.时期指标和时点指标D.实体指标和行为指标2.总量指标按其反映的时间状况不同可以分为( )。
A. 时期指标和时点指标B. 数量指标和质量指标C. 总体单位总量指标和总体标志总量指标D. 实物指标和价值指标3.下面属于总量指标的有( )。
A. 出勤率B. 及格率C. 达标率D. 学生人数4.具有广泛综合能力和概括能力的指标是)。
A.标准实物量指标B. 实物量指标C. 价值指标D. 劳动量指标5.时期指标和时点指标的共同点是)。
A. 都是总量指标B. 其数值都是连续计数C. 其指标数值的大小与时间间隔长短无关D. 各时期数值可直接相加6.某工业企业产品年产量为10万件,其年末库存量为3万件,它们是( )。
A. 时期指标B. 时点指标C. 前者是时点指标,后者是时期指标D. 前者是时期指标,后者是时点指标7.某市对所有医院进行调查,其中该市妇幼保健医院医生护士共有460人,其中中医100人,护士250人,该院化验室有医生12人,护士5人,上述资料中总体指标有( )。
A. 1个B. 3个C. 0个D. 6个8.当考察某地区工业企业整个工人状况时,总体单位总量是( )。
A. 工人的劳动定额B.全体工人总数C. 全部工资总额D. 工人的日产量9. 净产值占总产值的比重是( )。
A. 结构相对指标B. 比较相对指标C.比例相对指标 D 强度相对指标10.甲企业人数为乙企业人数的倍数是( )。
A. 结构相对指标B. 比较相对指标C. 比例相对指标D. 强度相对指标11. 我国人均占有粮食产量是( )。
A. 结构相对指标B. 比较相对指标C. 比例相对指标D. 强度相对指标12.计划规定成本降低5%,实际上提高了2%,则计划完成程度指标为( )。
A. 107%B. 107.4%C. 93.1%D. 110%13.计划规定成本降低3%,实际上降低了5%,则计划完成程度指标为( )。
《统计学原理》第四章习题及答案一.判断题部分题目1:同一个总体,时期指标值的大小与时期长短成正比,时点指标值的大小与时点间隔成反比。
()题目2:全国粮食总产量与全国人口对比计算的人均粮食产量是平均指标。
()题目3:根据分组资料计算算术平均数,当各组单位数出现的次数均相等时,按加权算数平均数计算的结果与按简单算数平均数计算的结果相同。
()题目4:同一总体的一部分数值与另一部分数值对比得到的相对指标是比较相对指标。
()题目5:某年甲、乙两地社会商品零售额之比为1:3,这是一个比例相对指标。
()题目6:某企业生产某种产品的单位成本,计划在上年的基础上降低2%,实际降低了3%,则该企业差一个百分点,没有完成计划任务。
()题目7:标准差系数是标准差与平均数之比,它说明了单位标准差下的平均水平。
()题目8:1999年与1998年相比,甲企业工人劳动生产率是乙企业的一倍,这是比较相对指标。
()题目9:中位数与众数都是位置平均数,因此用这两个指标反映现象的一般水平缺乏代表性。
()题目10:对两个性质相同的变量数列比较其平均数的代表性,都可以采用标准差指标。
()题目11:利用变异指标比较两总体平均数的代表性时,标准差越小,说明平均数的代表性越大;标准差系数越小,则说明平均数的代表性越小。
()题目12:标志变异指标数值越大,说明总体中各单位标志值的变异程度越大,则平均指标的代表性越小。
()题目13:权数对算数平均数的影响作用只表现为各组出现次数的多少,与各组次数占总次数的比重无关。
()题目14;能计算总量指标的总体必须是有限总体。
()二.单项选择题题目1:反映社会经济现象发展总规模、总水平的综合指标是()。
A、质量指标B、总量指标C、相对指标D、平均指标题目2:总量指标按反映时间状况的不同,分为()。
A、数量指标和质量指标B、时期指标和时点指标C、总体单位总量和总体标志总量D、实物指标和价值指标题目3:总量指标是用()表示的。
第四章 综合指标一、单选题1.某企业某种产品计划规定单位成本降低5%,实际降低了7%,则实际生产成本为计划的( ) A. 97.9% B. 140% C. 102.2% D. 2%2.某月份甲工厂的工人出勤率属于( ) A. 结构相对数 B. 强度相对数 C. 比例相对数 D. 计划完成相对数3.按全国人口平均的粮食产量是( ) A. 平均指标 B. 强度相对指标 C. 比较相对指标 D. 结构相对指标4.受极大值影响较大的平均数是( ) A. 位置平均数 B. 几何平均数 C. 算术平均数 D. 调和平均数5.若某总体次数分布呈轻微左偏分布,则有( )成立。
A.x > e M >o M B. x <e M <o M C. x >o M >e M D. x <o M <e M6.已知某企业职工消费支出,年支出6000元人数最多,平均年支出为5500元,该企业职工消费支出分布属于( ) A. 左偏分布 B. 右偏分布 C. 对称分布 D. J 形分布7.用组中值代表组内变量值的一般水平有一定的假定性,即( ) A. 各组的次数必须相等B. 变量值在本组内的分布是均匀的C. 组中值能取整数D. 各组必须是封闭组8.加权算术平均数不但受标志值大小的影响,而且也受标志值出现的次数多少的影响。
因此,下列情况中对平均数不发生影响的是()A.标志值比较小而次数较多时B.标志值较大而次数较小时C.标志值较大而次数较多时D.标志值出现的次数相等时9.已知某市场某种蔬菜早市、午市、晚市的每公斤价格,在早市、午市、晚市的销售额基本相同的情况下,计算平均价格可采取的平均数形式是()A.简单算术平均数B.加权算术平均数C.简单调和平均数D.加权调和平均数10.若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数()A.扩大2倍B.减少到1/3C.不变D.不能预期平均值的变化11.假定各个标志值都减去20个单位,那么平均值就会()A.减少20B.减少到1/20C.不变D.不能预期平均值的变化12.如果单项式分配数列的各个标志值和它们的频数都缩小到原来的1/2,那么众数()A.缩小到原来的1/2B.缩小到原来的1/4C.不变D.不能预期其变化13.如果单项式分配数列的各个标志值都增加一倍,而频数均减少一半,那么中位数()A.增加一倍B.减少一半C.不变D.不能预期其变化14.如果变量值中有一项为零,则不能计算()A.算术平均数B.调和平均数和几何平均数C.众数D.中位数15.计算标准差时,如果从每个变量值中都减去任意数a,计算结果与原标准差相较()A.变大B.变小C.不变D.可能变大也可能变小16.假如把分配数列的频数换成频率,则标准差()A.减少B.增加C.不变D.无法确定17.标准差与平均差的区别主要在于()A.意义不同B.计算结果不同C.计算条件不同D.对离差的数学处理方式不同18.为了测定组平均数变异,应计算()A.组内方差B.组间方差C.总方差D.组内方差平均数19.不同总体间的标准差不能进行简单对比,这是因为()A.平均数不一致B.离散程度不一致C.总体单位不一致D.离差平方和不一致20.两个总体的平均数不等,但标准差相等,则()A.平均数小,代表性大B.平均数大,代表性大C.两个平均数代表性相同D.无法加以判断21.如果两个数列是以不同的计量单位来表示的,则比较其离差的计量方法是()A.极差B.标准差C.平均差D.标准差系数22.在下列成数数值中,哪一个成数数值的方差最小()A.0.8B.0.5C.0.3D.0.123.如果偏度值a小于零,峰度值β小于3,可判断次数分布曲线为()A.左偏分布,呈尖顶峰度B.右偏分布,呈尖顶峰度C.左偏分布,呈平顶峰度D.右偏分布,呈平顶峰度二、多选题1. 总量指标( )A.是计算相对指标和平均指标的基础B.是反映国情和国力的重要指标C.是实行社会管理的重要依据D.可用来比较现象发展的结构和效益水平E.只能根据有限总体计算2. 某银行1999年底的居民储蓄存款额是( )A.综合指标B.单位总量指标C.标志总量指标D.时期指标E.时点指标3. 下列指标中属于时期指标的是( )A.产品产量B.销售收入C.职工人数D.设备台数E.固定资产原值4. 下列指标中属于强度相对数的是( )A.1992年末我国乡村总人口占全国总人口的72.37%B.1992年我国农民家庭平均每百户拥有电冰箱2.17台C.1992年我国人口密度122人/平方公里D.1992年我国全部职工平均货币工资2711元E.1992年我国钢产量为美国同期的81.2%5. 分子与分母不可互换计算的相对指标是( )A.计划完成情况相对指标B.动态相对指标C.结构相对指标D.强度相对指标E.比较相对指标6. 平均指标( )A.是总体一般水平的代表值B.是反映总体分布集中趋势的特征值C.是反映总体分布离中趋势的特征值D.可用来分析现象之间的依存关系E.只能根据同质总体计算7. 下列属于平均指标的有( )A.人均国民收入B.人口平均年龄C.粮食单位面积产量D.人口密度E.人口自然增长率8. 正确应用平均指标的原则是( )A.社会经济现象的同质性是应用平均数指标的前提条件B.用组平均数补充说明总平均数C.用分配数列补充说明平均数D.把平均数和典型事例相结合E.用各标志值补充说明平均数s-与1m s+的涵义表示( ) 9. 组距数列中位数的计算公式中,1mA.中位数组的累计次数B.中位数组前一组的较小制累计次数C.中位数组前一组的较大制累计次数D.中位数组后一组的较小制累计次数E.中位数组后一组的较大制累计次数10. 根据全距说明标志变异程度( )A.没有考虑中间标志值的变异程度B.没有考虑总体各单位的分布状况C.能反映所有标志值的变异程度D.取决于平均数的大小E.仅考虑最大标志值与最小标志值的影响11. 不同总体间各标志值的差异程度可以通过标准差系数进行比较,因为( )A.消除了不同总体各标志值测量单位的影响B.消除了不同数列平均水平高低的影响C.消除了不同数列各标志值差异的影响D.数值的大小与数列的差异水平无关E.数值的大小与数列的平均数大小无关12. 标志变异绝对指标( )A.可反映总体各标志值分布的集中趋势B.可说明变量数列中变量值的离中趋势C.是衡量平均数代表性大小的尺度D.要受到数列平均水平高低的影响E.是衡量经济活动过程均衡性的重要指标13. 比较两组工作成绩发现σ甲>σ乙,x甲>x乙,由此可推断( )A.乙组x的代表性高于甲组B.甲组x的代表性高于乙组C.乙组的工作均衡性好于甲组D.甲组的工作均衡性好于乙组E.甲组的标志变动度比乙组大14. 对比两个计量单位不同的变量数列标志值的离散程度,应使用( )A.平均差B.全距C.均方差系数D.标准差E.平均差系数15. 应用动差法测定偏度的峰度,需要计算( )A.一阶中心动差B.二阶中心动差C.三阶中心动差D.四阶中心动差E.五阶中心动差三、填空题1.总量指标按反映总体内容的不同,分为和;按反映的不同,可分为时期指标和时点指标。
x= ———- — = =8.6. 一组的累积频数四分位数位置的确定:下四分位数:Q A =苇一 上I 甲分位数:% = 3山:1)未分组数据:;组距分组数据:7. 简单均值:JIr + r ■+ + [_ r 〒叫T …T f : L x = -------------ny Mf.,_晒斤+叫&—+出血自叭'r i加权均值: 各组组中值,其中,统计学各章计算题公式及解题方法第四章数据的概括性度量组距式数值型数据众数的计算:确定众数组后代入公式计算: 单变量数列的中位数:先计算各组的累积次数(或累积频率)一根据位置公式确定中位 数所在的组一对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在 该组内均匀分布) 组距式数列的中位数计算公式:位数所在组的频数, 1. 下限公式:;上限公式:,其中,L 为众数所在组下限,U 为众数所在组上限,卜I 为众数所在组次数与前一组次数之差,阪为众数所在组次数与后一组次数之差, d 为众数所在组组距 2. 中位数位置的确定:未分组数据为n+ 1~T~ ;组距分组数据为3. 未分组数据中位数计算公式:4.5.下限公式: n 2 -几-1 二匕 ------ ---- X d* m n2+^i+l= U -;上限公式:,其中,为中,门为偶数几何均值(用于计算平均发展速度) 四分位差(用于衡量中位数的代表性)异众比率(用于衡量众数的代表性)离散系数:叫-丘第七章参数估计的估计值:置信水平9. 10.11.12. 13. 14. 15.16.17. 18.19.1.2 (策一三)£z i=l2 f = 1 样本方差:未分组数据:斥-1;分组数据:SAn -1n - 1总体标准差:未分组数据:90% 0.1 0.05 1.654 95%0.050.0251.96极差:未分组数据:' -;组距分组数据:R =最高组上限-Kttfi 下限 平均差(离散程度)= ---------------:未分组数据:““kY 网Tt ; .0= 1M J = --------------------dn£ (叼-MF 一2 _ ' = 1£ (叫-心 z 上=】N;分组数据:a-N\i = 1a =N;分组数据:4N样本标准差:未分组数据:: ';组距分组数据:总体方差:未分组数据:;分组数据:99% 0.01 0.005 2.58其中,】查,查找时需查的数值bfl -p)3. 大样本总体比例的区间估计:(n - 1}s22(n- 1)s24. 总体方差■在--置信水平下的置信区间为:5. 估计总体均值的样本量:■' ,其中,E为估计误差(勺-刃口=-------- ---------6. 重复抽样或无限总体抽样条件下的样本量:,其中n为总体比例第八章假设检验1. 总体均值的检验(已知或未知的大样本)[总体服从正态分布,不服从正态分布的用正态分布近似总体均值检验(未知,小样本,总体正态分布)假设双侧检验左侧检验右侧检验假设形式心p>p u%:咗弘g p<p u"i:。
浙大考试:2管理统计学——在线作业管理统计学在线作业单选题1.用于描述样本特征的概括性数字称为:A 参数;B 统计量;C 变量D 变量值;2.某班学生数学考试成绩分别为65分、71分、80分和87分,那末,这四个数字是:A 指标;B 标志;C 变量;D 标志值3.对50名职工的工资收入情况进行调查,则总体单位是:A 50名职工;B 50名职工的工资总额;C 每一名职工;D 每一名职工的工资4.统计总体的基本特征是:A 同质性,数量性,变异性;B 大量性,变异性,C 数量性,具体性,综合性;D 总体性,社会性,大量性5.一个管理统计总体:A 只能有一个标志;B 只能有一个指标;C 可以有多个标志;D 可以有多个指标6.下列属于品质标志的是:A 工人年龄;B 工人性别;C 工人体重;D 工人工资7.统计工作的成果是:A 统计学;B 统计工作;C 统计资料;D 统计分析与预测8.以下属于定距尺度的数据资料是:A 温度;B 受教育年限;C 职业技能等级;D ISBN号(书号)9.按调查的范围不同。
统计调查可以分为:A 统计报表和专门调查;B 全面调查和非全面调查;C 经常性调查和一次性调查;D 普查和抽样调查10.如果数据分布很不均匀,则应编制:A 开口组;B 闭口组;C 等距数列;D 异距数列11.某工人月工资为2000元,工资属于:A 品质标志;B 数量标志;C 变量值;D 指标12.一份报告称:“由200部新车组成的一个样本表明,外国新车的油耗明显少于本国生产的新车”。
这一结论属于:A 对于样本的描述;B 对于样本的推断;C 对于总体的描述;D 对于总体的推断13.在组距式数列中,用组中值来代表组内的一般水平的假定条件:A 各个组的次数相等;B 各个组的组距相等;14.以下属于数值型变量的是:A 体重;B 性别;C 工作岗位级别;D 居民对某项改革措施的态度(支持、中立、反对)15.划分连续变量的组限时,相邻的组限必须:A 重叠;B 相近;C 间断;D 不等16.研究者想要了解的关于总体的某些特征值,称为:A 参数;B 统计量;C 变量;D 变量值17.对连续型变量值分为五组:第一组为40一50,第二组为50-60,第三组为60-70,第四组为70-80,第五组为80以上。
第四章 静态指标分析法(一)一、填空题1、数据分布集中趋势的测度值(指标)主要有、和。
其中和用于测度品质数据集中趋势的分布特征,用于测度数值型数据集中趋势的分布特征。
2、标准差是反映的最主要指标(测度值)。
3、几何平均数是计算和的比较适用的一种方法。
4、当两组数据的平均数不等时,要比较其数据的差异程度大小,需要计算。
5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈分布。
6、当一组工人的月平均工资悬殊较大时,用他们工资的比其算术平均数更能代表全部工人工资的总体水平。
二.选择题单选题:1.反映的时间状况不同,总量指标可分为( )A 总量指标和时点总量指标B 时点总量指标和时期总量指标C 时期总量指标和时间指标D 实物量指标和价值量指标2、某厂1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( )A 5.5%B 5%C 115.5%D 15.5%3、在同一变量数列中,当标志值(变量值)比较大的次数较多时,计算出来的平均数( )A 接近标志值小的一方B 接近标志值大的一方C 接近次数少的一方D 接近哪一方无法判断4、在计算平均数时,权数的意义和作用是不变的,而权数的具体表现( )A 可变的B 总是各组单位数C 总是各组标志总量D 总是各组标志值 5、1998年某厂甲车间工人的月平均工资为520元,乙车间工人的月平均工资为540元,1999年各车间的工资水平不变,但甲车间的工人占全部工人的比重由原来的40%提高到了60%,则1999年两车间工人的总平均工资比1998年( )A 提高B 不变C 降低D 不能做结论 6、在变异指标(离散程度测度值)中,其数值越小,则( )A 说明变量值越分散,平均数代表性越低B 说明变量值越集中,平均数代表性越高C 说明变量值越分散,平均数代表性越高D 说明变量值越集中,平均数代表性越低7、有甲、乙两数列,已知甲数列:07.7,70==甲甲σX ;乙数列:41.3,7==乙乙σX 根据以上资料可直接判断( )A 甲数列的平均数代表性大B 乙数列的平均数代表性大C 两数列的平均数代表性相同D 不能直接判别8、杭州地区每百人手机拥有量为90部,这个指标是 ( )A 、比例相对指标B 、比较相对指标C 、结构相对指标D 、强度相对指标 9、某组数据呈正态分布,计算出算术平均数为5,中位数为7,则该数据分布为 ( ) A 、左偏分布 B 、右偏分布 C 、对称分布 D 、无法判断10、加权算术平均数的大小 ( )A 主要受各组标志值大小的影响,与各组次数多少无关;B 主要受各组次数多少的影响,与各组标志值大小无关;C 既与各组标志值大小无关,也与各组次数多少无关;D 既与各组标志值大小有关,也受各组次数多少的影响11、已知一分配数列,最小组限为30元,最大组限为200元,不可能是平均数的为 ( ) A 、50元 B 、80元 C 、120元 D 、210元12、比较两个单位的资料,甲的标准差小于乙的标准差,则 ( ) A 两个单位的平均数代表性相同 B 甲单位平均数代表性大于乙单位C 乙单位平均数代表性大于甲单位D 不能确定哪个单位的平均数代表性大 13、若单项数列的所有标志值都增加常数9,而次数都减少三分之一,则其算术平均数 ( ) A 、增加9 B 、增加6C 、减少三分之一 D 、增加三分之二 14、如果数据分布很不均匀,则应编制( )A 开口组B 闭口组C 等距数列D 异距数列 15、计算总量指标的基本原则是:( ) A 总体性B 全面性C 同质性D 可比性16、某企业的职工工资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为()A1500元 B 1600元 C 1750元D 2000元 17、统计分组的首要问题是( )A 选择分组变量和确定组限B 按品质标志分组C 运用多个标志进行分组,形成一个分组体系D 善于运用复合分组18、某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( )A 230B 260C 185D 215 19、分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是( )A 钟型分布B U 型分布C J 型分布D 倒J 型分布 20、要了解上海市居民家庭的开支情况,最合适的调查方式是:() A 普查B 抽样调查C 典型调查D 重点调查21、已知两个同类企业的职工平均工资的标准差分别为5元和6元,而平均工资分别为3000元,3500元则两企业的工资离散程度为 ( )A 甲大于乙B 乙大于甲C 一样的D 无法判断 22、加权算术平均数的大小取决于( )A 变量值B 频数C 变量值和频数D 频率23、如果所有标志值的频数都减少为原来的1/5,而标志值仍然不变.那么算术平均数( ) A 不变 B 扩大到5倍 C 减少为原来的1/5 D 不能预测其变化 24、 计算平均比率最好用 ( )A 算术平均数B 调和平均数C 几何平均数D 中位数25、若两数列的标准差相等而平均数不同,在比较两数列的离散程度大小时,应采用() A 全距 B 平均差 C 标准差 D 标准差系数26、若n=20,∑∑==2080,2002x x ,标准差为( )A 2B 4C 1.5D 327、已知某总体3215,3256==eMM,则数据的分布形态为( )A左偏分布B正态分布 C 右偏分布DU型分布28、一次小型出口商品洽谈会,所有厂商的平均成交额的方差为156.25万元,标准差系数为14.2%,则平均成交额为( )万元A11 B 177.5 C 22.19 D 8826、欲粗略了解我国钢铁生产的基本情况,调查了上钢、鞍钢等十几个大型的钢铁企业,这是()A普查B重点调查C典型调查D抽样调查多选题:1.某企业计划2000年成本降低率为8%,实际降低了10%。
组距中位数计算公式
组距中位数是指在一定区间内,数据分布的中位数所在的区间的中点位置,它是统计分析中常用的一种指标,可用于测量数据的集中趋势。
组距中位数的计算公式是:中位数=L+(n/2-F)×h,其中L为组距的下限值,n为数据总数,F为小于中位数所在组距的频数和,h为组距的跨度。
为了更好地理解组距中位数的计算方法,我们可以通过以下的例子进行说明:
假设有一组统计数据如下:
区间|频数
20-30|5
30-40|8
40-50|12
50-60|10
60-70|5
70-80|2
首先需要计算出数据的总数n,这里n=42。
然后需计算出中位数所在的组距。
由于n/2=21,所以中位数在第三个组距40-50中。
该组距的下限L为40。
接着需要计算出小于中位数所在组距的频数和F,由于前两个组距的频数和为5+8=13,小于21,因此F=13。
最后需要计算出组距的跨度h,该组距的跨度为10。
将L、n、F和h代入计算公式中,得到:中位数=40+(21-13)×10=460。
因此,该数据集的组距中位数为460,表示数据分布的中心位置在区间40-50的中间位置。
总之,组距中位数是数据集中重要的指标之一,通过计算组距中位数能够更加准确的描述数据的中心位置,帮助我们更好地了解数据的分布情况,为随后的数据分析提供更加可靠的依据。
组距数列求中位数的计算方法研究
中位数是一个十分重要的概念,在教学和研究中,它都被大量使用,比较熟悉中位数的计算方法也就变得格外重要。
组距数列是一种处理和统计数据的重要方式,求中位数是求组距数列中位数的基础。
研究表明,对于组距数列求中位数,一般会按照下面的步骤进行:
第一步,计算组左边界和右边界,将划分的组距数列按升序和降序排序,从而确定组的范围。
第二步,计算数据的总数和几何中位数,即统计总量的一半在哪个组中,以此作为基准。
第三步,计算组的跨度,即组的高级跨度。
第四步,找到中位数,根据总数和组内跨度,按字典方式把前面组合成一个数,就是中位数。
第五步,检验中位数,采用抽样分析,确保中位数的准确性。
本文简单介绍了组距数列求中位数的计算方法,包括组左边界和右边界的计算、数据总数和几何中位数的计算、组的跨度计算、中位数的求解等步骤,尽管问题有一定的复杂性,但熟练掌握计算方法可以比较容易地计算出中位数。
组距中位数计算公式
在统计学中,组距是指数据分组时每组所含范围的大小。
组距中
位数是指数据样本中每组的中间值,是衡量数据集合中数值分布集中
程度的一种指标。
那么,如何计算组距中位数呢?
首先,确定数据集合分组的组数和组距大小。
组数的确定可以根
据数据集合的大小和需要分析的具体问题进行决定。
组距大小通常是
根据数据集合中最大值和最小值的 range(即最大值减去最小值)来
确定。
一般来说,组距大小不宜过大或过小,以保证数据分布的平稳
和合理。
接下来,将数据集合按照组距分成若干组,并计算每组的中位数。
组的中位数可以通过对每组数值进行排序,然后找出中间的那个数值
来确定。
当组内数据个数为奇数时,中位数就是排序后的中间值;当
组内数据个数为偶数时,中位数是排序后中间两个数值的平均数。
而
组距中位数则是所有组中的中位数的平均数。
当数据集合较大时,计算组距中位数可能会比较繁琐,此时可以
使用工具进行自动化计算,如Excel等数据处理软件。
在使用工具进
行计算时,需要保证数据集合的数据正确无误,并严格按照数据分组
的标准进行操作,以获取准确的计算结果。
总之,在统计分析中,组距中位数是一种反映数据集合中数值分
布集中程度的重要指标,可以帮助分析人员更全面、准确地了解数据
的特征和规律,从而为决策和管理提供有力支持。
利用插补法求解组距数列的中位数和众数一、中位数(Median)中位数是一组数据按从小到大排序后,处在中间位置上的变量值,用Me 表示。
中位数将全部数据等分成两部分,使一部分数据比中位数大,另一部分数据则比中位数小。
中位数是一个位置代表值,它主要用于测定数据的集中趋势,且不受极端数值的影响。
此外,中位数还具有一个性质,就是各变量值与中位数的离差绝对值之和最小,即)m i n (1最小=-∑=ni ei Mx (1)根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,其公式为:中位数的位置=21+n ,式中的n 为数据的个数,凭此确定中位数的具体数值。
设有一组数据从小到大排序后为n x x x x ,,,,321⋅⋅⋅。
若n 为奇数,则中位数为21+n x ;若n 为偶数,则中位数是2nx 与12+nx 的平均数。
即⎪⎩⎪⎨⎧+=++为偶数时当为奇数时当n x x x Me n n n )(21n 12221 (2)根据分组数据计算中位数时,要先根据公式2∑f确定中位数的位置,并确定中位数所在的组。
如果是单项数列,则中位数就取中位数所在组的组值(即标志值);如果是组距数列,则采用下面的公式计算中位数的近似值:if S fL Me mm ⨯-+=-∑12(3)式(3)中,∑ƒ为数据的个数(总次数);L 为中位数所在组的下限值;1-m S 为中位数所在组以前各组的累积频数;m f 为中位数所在组的频数;i 为中位数所在组的组距。
式(3)中,假定中位数所在组的频数在该组内是均匀分布的。
图-1 组距数列中位数的分布图那么,我们接下来要讨论的是如何求证式(3),即组距数列中位数的计算公式。
假设上面图-1是某组距数列次数分布图。
利用插补法进行比例推算。
图-1中,A 点表示中位数所在组的下限,其值为L ;B 点表示中位数所在组的上限;C 点表示中位数所处的位置,其值为Me ;A 点到B 点所夹的距离,也就是中位数所在组的组距,其值为i ;A 点到C 点所夹的距离,就是中位数所在组的下限到中位数位置的距离,其值设为X 。