当前位置:文档之家› 信息论上机实验报告

信息论上机实验报告

信息论上机实验报告
信息论上机实验报告

信息论与编码实验报告

实验一:计算离散信源的熵

一、实验设备: 1、计算机

2、软件:Matlab 二、实验目的:

1、熟悉离散信源的特点;

2、学习仿真离散信源的方法

3、学习离散信源平均信息量的计算方法

4、熟悉 Matlab 编程; 三、习题:

1. 甲地天气预报构成的信源空间为:

1111(),,,8482

X p x ?????

?=??????

?? 小雨

云 大雨晴 乙地信源空间为:

17(),88

Y p y ?????

?=??????

??

小雨晴 求此两个信源的熵。求各种天气的自信息量。

代码:

x=[1/2,1/4,1/8,1/8]; y=[7/8,1/8];

HX=sum(-x.*log2(x)) HY=sum(-y.*log2(y)) IX=-log2(x) IY=-log2(y) 答案:() 1.75;

()0.5436H X H Y ==

2、 某信息源的符号集由A 、B 、C 、D 、E 组成,设每一符号独立出现,其出现的概率分别为,1/4,1/8,1/8,3/16,5/16,

试求该信源符号的平均信息量。

代码:

x=[1/4,1/8,1/8,3/16,5/16]; HX=sum(-x.*log2(x))

答案:H(X) = 2.2272bit/符号

3、设有四个消息分别以概率1/4,1/8,1/8,1/2传送,每一消息的出现是相互独立的。试计算其平均信息量。

代码:

x=[1/4,1/8,1/8,1/2]; HX=sum(-x.*log2(x)) 答案:H(X) =1.75bit/符号

4. 设一个二元信源(只有0和1两种符号)其概率空间为:

(),1X p x p p ????=????-????

0 1

编程画出H 与p 的关系,并说明当P 呈什么分布时,平均信息量达到最大值。

(说明:H=-p.*log2(p)-(1-p).log2(1-p);) 代码:

p= 1/1000000:1/1000:1;

H=-p.*log2(p)-(1-p).*log2(1-p); plot(p,H) grid on xlabel('p'); ylabel('HP'); 图:

实验二:验证熵的可加性与强可加性

1. 【例

2.6】

有一离散无记忆信源

123111(),,244a a a X p x ??????=????

??

??

验证二次扩展信源2

X 的熵等于离散信源X 的熵的2倍,即

2()2()H X H X =

代码:

x=[1/2,1/4,1/4];

hx=sum(x.*log2(1./x))

x2=[1/4,1/16,1/16,1/8,1/8,1/8,1/16,1/8,1/16] hx2=sum(x2.*log2(1./x2)) 答案:2() 1.5;

() 3.0H X H X ==

2. 验证两个统计独立的信源,X Y ,验证:

()()()H XY H X H Y =+

其中:

123111(),,244a a a X p x ??????=????

??

??

123

111(),,333b b b Y p y ??????=??????

??

代码:

x=[1/2,1/4,1/4]; y=[1/3,1/3,1/3];

xy=[1/6,1/6,1/6,1/12,1/12,1/12,1/12,1/12,1/12] hx=sum(x.*log2(1./x)) hy=sum(y.*log2(1./y)) Hxy=sum(xy.*log2(1./xy)) 答案:() 1.5,() 1.585() 3.085H X H Y H XY ===

3、条件熵的计算与熵的强可加性 验证离散二维平稳信源,满足:12121()()(|)

H X X H X H X X =+

某一离散二维平稳信源

0121141(),,3694X p x ??????=??????

??

12

X X 其联合概率分布

12()

p X X 为:

编程计算:

1) 联合熵12()

H X X 2) 条件熵

21(|)

H X X

3) 验证:

12121()()(|)

H X X H X H X X =+

代码:

x1=[11/36,4/9,1/4]; x2=[11/36,4/9,1/4];

b=[1/4,1/18,0;1/18,1/3,1/18;0,1/18,7/36]; HXY=0;

for i=1:size(b,1) for j=1:size(b,2) if b(i,j)>0

HXY=HXY-b(i,j).*log2(b(i,j)); end end end HXY

Hx1=sum(x1.*log2(1./x1)) Hx2=sum(x2.*log2(1./x2))

b0=b(1,:); b1=b(2,:); b2=b(3,:);

x1x2=[b0./x2;b1./x2;b2./x2]; Hx1x2=0;

for i=1:size(x1x2,1) for j=1:size(x1x2,2) if x1x2(i,j)>0

Hx1x2=Hx1x2-b(i,j).*log2(x1x2(i,j)); end end end Hx1x2 答案:

12112121() 1.5426;(|)0.8717

() 2.4144

()(|) 2.4144

H X H X X H X X H X H X X ===+=

实验三:离散信道的平均互信息的计算

1. 【习题3.1】 设信源

12()0.6,0.4X x x p x ????=????????

通过一干扰信道,接收到符号为

12[,]

Y y y =,其信道矩阵为:

5

16631,44P ??

??=?

???????

1) 求信源X 中事件1

x 和

2

x 分别含有的自信息;

2) 收到消息

(1,2)

j y j =后,获得的关于

(1,2)

i x i =的信息量;

3) 求信源X 和输出变量Y 的信息熵; 4) 信道疑义度(|)H X Y 和噪声熵(|)H Y X ; 5) 接收到消息Y 后获得的平均互信息;

代码:

x=[0.6,0.4];

p=[5/6,1/6;3/4,1/4]; Ix1=log2(1./(x(1,1))) Ix2=log2(1./(x(1,2)))

pxy=[x(1,1)*p(1,:);x(1,2)*p(2,:)]; py=[x*p(:,1),x*p(:,2)];

px_y=[pxy(:,1)/py(1,1),pxy(:,2)/py(1,2)]; I=log2(p./[py;py]) Hx=sum(x.*log2(1./x)) Hy=sum(py.*log2(1./py))

Hx_y=sum(sum(pxy.*log2(1./px_y))) Hy_x=sum(sum(pxy.*log2(1./p)))

Ixy=sum(sum(pxy.*log2(p./[py;py])))

答案:12111221221.()0.737() 1.3219

2.

(;)0.0589,(;)0.263,(;)0.0931,(;)0.32193.()0.971,()0.7219

4.(|)0.9635(|)0.7145

5.(;)0.0074

I x I x I x y I x y I x y I x y H X H Y H X Y H Y X I X Y ====-=-======

2. 二元信道的互信息与信源分布的关系 有二元信源:

01()1X p x ωω????=????-????

有二元信道,其传递矩阵为:

11p p P p p -??=??-??, 其中0.2p =,即传递矩阵0.80.20.20.8P ??=??

??

编程实现下面题目:

1) 画出平均互信息(;)I X Y 随信源分布ω的关系曲线,并求出最大平均互信息。

验证:信道容量C (最大平均互信息)满足:1()C H p =-

2)验证:信道容量C (最大平均互信息)满足:1()C H p =-

代码:

syms w; x=[w,1-w];

p=[0.8,0.2;0.2,0.8];

pxy=[x(1,1)*p(1,:);x(1,2)*p(2,:)]; py=[x*p(:,1),x*p(:,2)];

px_y=[pxy(:,1)/py(1,1),pxy(:,2)/py(1,2)]; Ix_y=sum(sum(pxy.*log2(p./[py;py]))); ezplot(w,Ix_y,[0,1,0,1]); xlabel('变量w');

ylabel('平均互信息量I')

title('平均互信息量与w 的函数关系') grid on; 图:

0.1

0.2

0.3

0.4

0.50.6

0.7

0.8

0.9

1

-0.2

-0.100.10.20.3

0.4

0.5变量 w

平均互信息量 I

平均互信息量与w 的函数关系

实验四:离散信道及其信道容量

一、实验设备: 1、计算机

2、软件:Matlab

二、实验目的:

1、了解信道传输概率的状态图和信道转移概率矩阵特点;

2、了解什么是信道容量和最佳输入概率分布;

3、列出计算信道容量和平均互信息的计算步骤;

4、熟悉 Matlab 编程; 三、习题:

计算下面几类信道的信道容量C : 1 无损信道

1/21/20

000003/53/101/100000001P ????=??

???? l o g

C r = 代码:

p1=[1/2,1/2,0,0,0,0;0,0,3/5,3/10,1/10,0;0,0,0,0,0,1]; C1=sum(log2(size(p1(:,1))))

答案:c=1.585 2 无噪有损信道

101

00

1P ??

??=??????

log C s = 代码:

p2=[1,0;1,0;0,1];

C2=sum(log2(size(p2(1,:))))

答案:c=1

3 对称离散信道【例3.6】

11

11336611116

633P ????

=?

???????

1log ()s C s H p p =- 代码:

p3=[1/3,1/3,1/6,1/6;1/6,1/6,1/3,1/3];

C3=sum(log2(size(p3(1,:))))-sum(p3(1,:).*log2(1./p3(1,:)))

答案:c=0.0817

4 一般信道,其信道矩阵为:

11

12441216361138

8

4P ???????

?=??????????

求1)其信道容量C ,2)最佳输入分布()i p a 代码:

答案:4. 0.3109,

()(0.1702,0.3955,0.4343)C p a ==

beta =-1.9732 -1.1610 -0.8927 pb =0.2053

0.3605 0.4342 pa =0.1702

0.3955 0.4343

实验五:连续信源的差熵与波形信道的信道容量

一、实验设备: 1、计算机

2、软件:Matlab 二、实验目的:

1、熟悉连续信源的特点;

2、学习仿真连续信源的方法

3、学习连续信源平均信息量的计算方法

4、熟悉 Matlab 编程; 三、习题

1、设在平均功率受限高斯加性波形信道中,信道带宽为3kHz, 又设(信号功率+噪声功率)/噪声功率=10dB 。(即

10lg(1)10s

n

P dB P +

=,其中lg 是以10为底的对数)。

1) 试计算该信道传送的最大信息率(单位时间);

2) 若信噪比降为5dB ,要达到相同的最大信息传输率,信道带宽应是多少?

代码:

syms x,a=4;b=8; p=1/(b-a);

f=p*(log2(p)/log2(2)); hx=-int(f,x,a,b); hx=double(hx); hx;

m=3;o=2;

p2=(1/(2*pi*o^2)^(1/2))*exp(-(x-m)^2/(2*o^2)); hx2=log2(2*pi*exp(1)*o^2)/2; hx2=double(hx2);

p3=exp(-x/4)/4;

hx3=log2(4*exp(1)); p4=exp(-abs(x)/4)/8; hx4=log2(4*2*exp(1)); hx hx2 hx3 hx4

W=3000;

C=W*log2(10); Rt=C/1

W2=Rt/log2(1+10^(5/10))

答案:

1. 最大信息传输率9965.784(/)t R bit s =

2. 带宽应为: W = 4.8439e+003

实验六:无失真信源编码与保真度准则下的信源编码

一、实验设备: 1、计算机

2、软件:Matlab 二、实验目的:

1、理解无失真信源编码与保真度准则下的信源编码的物理意义;

2、理解无失真信源编码与保真度准则下的信源编码的区别;

3、熟悉 Matlab 编程; 三、习题:

1、(习题5.4)若有一信源,

1

241()55s s S P s ??

????=????

??

??,每秒钟发出2.66个信源符号。将此信源的输出符号送入某一个二

元信道中进行传输(假设信道是无噪无损的),而信道每秒钟只传递两个二元符号。试问信源不通过编码能否直接与信道连接?若通过适当编码能否在此信道中进行无失真传输?若能连接,试说明如何编码并说明原因。

代码:

Ps=[4/5,1/5];

Is=sum(log2(1./Ps)) C=log2(2); Ix=2*C

答案:Is =2.6439 Ix =2

2、(习题7.1)一个四元对称信源 0,

1,2,31111()44

4

4U P u ??????=????

??

??,接收符号为{0,1,2,3}V =,其失真矩阵为

111101111011

1

1

0D ?????

?=??????

,求max D 和min D 。 代码:

r=2; q=2.66; L=log2(q)

pu=[1/4 1/4 1/4 1/4];

D=[0 1 1 1;1 0 1 1;1 1 0 1;1 1 1 0]; V=[0 1 2 3];

for i=1:size(pu,1); j=1:size(D,2);

Dmin=sum(pu(1,i)*min(D(j,:))); Dmax=min(sum(pu(1,i)*D(:,j))); end Dmin Dmax

答案:L =1.4114 Dmin =0

Dmax =0.7500

中北大学概率论实验报告四

实验四方差分析和回归分析 四、实验结果 1、用5种不同的施肥方案分别得到某种农作物的收获量(kg)如右: 在显著性水平= 对农作物的收获量是否有显著影响. >> X=[67 67 55 42 98 96 91 66 60 69 50 35 79 64 81 70 90 70 79 88]; group=[ones(1,4),2*ones(1,4),3*ones(1,4),4*ones(1,4),5*ones(1,4)]; [p,table,stats] = anova1(X,group,'on') p = table = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Groups' [+03] [ 4] [] [] [] 'Error' [+03] [15] [] [] [] 'Total' [+03] [19] [] [] []

stats = gnames: {5x1 cell} n: [4 4 4 4 4] source: 'anova1' means: [ ] df: 15 s: 因为p=<,所以施肥方案对农作物的收获量有显著影响。且由箱型图可知:第2种施肥方案对对农作物的收获量的影响最好,即产量最高。 2、某粮食加工产试验三种储藏方法对粮食含水率有无显著影响,现取一批粮食分成若干份,分别用三种不同的方法储藏,过段时间后测得的含水率如右表:

在显著性水平=α下,i x 检验储藏方法对含水率有无显著的影响. >> X=[ 10 ]; group=[ones(1,5),2*ones(1,5),3*ones(1,5)]; [p,table,stats] = anova1(X,group,'on') p = table = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Groups' [] [ 2] [] [] [] 'Error' [ ] [12] [] [] [] 'Total' [] [14] [] [] [] stats = gnames: {3x1 cell} n: [5 5 5] source: 'anova1'

数据挖掘试验指导书

《商务数据分析》实验指导书(适用于国际经济与贸易专业) 江西财经大学国际经贸学院 编写人:戴爱明

目录 前言 (1) 实验一、SPSS Clementine 软件功能演练 (5) 实验二、SPSS Clementine 数据可视化 (9) 实验三、决策树C5.0 建模 (17) 实验四、关联规则挖掘 (30) 实验五、聚类分析(异常值检测) (38)

前言 一、课程简介 商务数据分析充分利用数据挖掘技术从大量商务数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信息库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘,又称为数据库中知识发现(Knowledge Discovery in Database, KDD),因此,数据挖掘和数据仓库的协同工作,一方面,可以迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。另一方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。 数据挖掘有机结合了来自多学科技术,其中包括:数据库、数理统计、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像与信号处理、空间数据分析等,这里我们强调商务数据分析所处理的是大规模数据,且其算法应是高效的和可扩展的。通过数据分析,可从数据库中挖掘出有意义的知识、规律,或更高层次的信息,并可以从多个角度对其进行浏览察看。所挖掘出的知识可以帮助进行商务决策支持。当前商务数据分析应用主要集中在电信、零售、农业、网络日志、银行等方面。

1_概率统计上机练习(给学生1)2017级

Matlab 概率论与数理统计一、matlab基本操作 1.画图 【例01.01】简单画图 【例01.02】填充,二维均匀随机数 hold off; x=[0,60];y0=[0,0];y60=[60,60]; x1=[0,30];y1=x1+30;

2. 排列组合 C=nchoosek(n,k):k n C C =,例nchoosek(5,2)=10, nchoosek(6,3)=20. prod(n1:n2):从n1到n2的连乘 【例01.03】至少有两个人生日相同的概率 公式计算n n n n N N n N N N N n N N N C n p )1()1(1)! (! 1!1+--?-=--=- = 365364 (3651)365364 3651 11365365365 365 rs rs rs ?-+-+=- =-?

二、随机数的生成 3.均匀分布随机数 rand(m,n); 产生m行n列的(0,1)均匀分布的随机数rand(n); 产生n行n列的(0,1)均匀分布的随机数 【练习】生成(a,b)上的均匀分布 4.正态分布随机数 randn(m,n); 产生m行n列的标准正态分布的随机数【练习】生成N(nu,sigma.^2)上的正态分布 5.其它分布随机数

三、一维随机变量的概率分布 1. 离散型随机变量的分布率 (1) 0-1分布 (2) 均匀分布 (3) 二项分布:binopdf(x,n,p),若~(,)X B n p ,则{}(1)k k n k n P X k C p p -==-, y=[ 0.0404, 0.1556, 0.2668, 0.2668, 0.1715, 0.0735, 0.0210, 0.0039, 0.0004, 0.0000 ] ‘当n 较大时二项分布近似为正态分布 x=0:100;n=100;p=0.3; y= binopdf(x,n,p); plot(x,y,'b-',x,y,'r*')

中北大学概率论实验报告四

实验四 方差分析和回归分析 四、实验结果 1、用5种不同的施肥方案分别得到某种农作物的收获量(kg )如右: 在显著性水平=α下,检验施肥方案对农作物的收获量是否有显著影 响. >> X=[67 67 55 42 98 96 91 66 60 69 50 35 79 64 81 70 90 70 79 88]; group=[ones(1,4),2*ones(1,4),3*ones(1,4),4*ones(1,4),5*ones(1,4)]; [p,table,stats] = anova1(X,group,'on') p = table = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Groups' [+03] [ 4] [] [] [] 'Error' [+03] [15] [] [] [] 'Total' [+03] [19] [] [] [] 5 9 778

stats = gnames: {5x1 cell} n: [4 4 4 4 4] source: 'anova1' means: [ ] df: 15 s: 因为p=<,所以施肥方案对农作物的收获量有显著影响。且由箱型图可知:第2种施肥方案对对农作物的收获量的影响最好,即产量最高。 2、某粮食加工产试验三种储藏方法对粮食含水率有无显著影响,现取一批粮食分成若干份,分别用三种不同的方法储藏,过段时间后测得的含水率如右表:

在显著性水平=α下,i x 检验储藏方法对含水率有无显著的影 响. >> X=[ 10 ]; group=[ones(1,5),2*ones(1,5),3*ones(1,5)]; [p,table,stats] = anova1(X,group,'on') p = table = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Groups' [] [ 2] [] [] [] 'Error' [ ] [12] [] [] [] 'Total' [] [14] [] [] [] stats = gnames: {3x1 cell} n: [5 5 5]

西安交通大学概率论上机实验报告总结计划.docx

西安交通大学一、试验目的

概率论部分 1.了解 matlab 软件的基本命令与操作; 2.熟悉 matlab 用于描述性统计的基本菜单操作及命令; 3.会用 matlab 求密度函数值、分布函数值、随机变量分布的上 下侧分位数。 数理统计部分 1.熟悉 matlab 进行参数估计、假设检验的基本命令与操作. 2.掌握用 matlab 生成点估计量值的模拟方法 3.会用 matlab 进行总体数学期望和方差的区间估计。 4.会用 matlab 进行单个、两个正态总体均值的假设检验。 5.会用 matlab 进行单个、两个正态总体方差的假设检验。 二、试验问题 实验五、随机变量综合试验 实验内容 1.产生 ?(6),?(10), F(6,10) 和 t (6)四种随机数,并画出相应的频 率直方图; 2.在同一张图中画出了 N(0,1)和 t (6)随机数频率直方图,比较它 们的异同; 3.写出计算上述四种分布的分布函数值和相应上侧分位点命 令.

实验七、对统计中参数估计进行计算机模拟验 证实验内容: 1.产生服从给定分布的随机数,模拟密度函数或概率分布; 2.对分布包含的参数进行点估计,比较估计值与真值的误差; 3.对分布包含的参数进行区间估计,行区间估计,可信度。 三、实验源程序及结果 实验 5 源程序: %清空内存,清空输出屏幕 clc;clear; %首先是指数分布 n = normpdf(-2::14,6); %绘制频率直方图 plot(-2::14,n,'color','r','linewidth',2); ylabel(' 概率密度 '); title('正态分布概率密度'); %t 分布 h1 = figure; t = tpdf(-3::3,6); plot(-3::3,t,'color','g','linewidth',2); ylabel(' 对应频率 '); title('t分布频率密度'); %F 分布 h2 = figure; f = fpdf(0::10,6,10); plot(0::10,f,'color','k','linewidth',2); ylabel(' 对应频率 '); title('F分布频率直方图'); %卡方分布 h3 = figure; ka = chi2pdf(0::15,6); plot(0::15,ka,'color','y','linewidth',2); ylabel(' 对应频率 '); title('卡方分布频率直方图'); %再来绘图 h4 = subplot(2,1,1); y1=normpdf(-10::10,0,1);

信息论与编码实验报告.

本科生实验报告 实验课程信息论与编码 学院名称信息科学与技术学院 专业名称通信工程 学生姓名 学生学号 指导教师谢振东 实验地点6C601 实验成绩 二〇一五年十一月二〇一五年十一月

实验一:香农(Shannon )编码 一、实验目的 掌握通过计算机实现香农编码的方法。 二、实验要求 对于给定的信源的概率分布,按照香农编码的方法进行计算机实现。 三、实验基本原理 给定某个信源符号的概率分布,通过以下的步骤进行香农编码 1、将信源消息符号按其出现的概率大小排列 )()()(21n x p x p x p ≥≥≥ 2、确定满足下列不等式的整数码长K i ; 1)(l o g )(l o g 22+-<≤-i i i x p K x p 3、为了编成唯一可译码,计算第i 个消息的累加概率 ∑ -== 1 1 )(i k k i x p p 4、将累加概率P i 变换成二进制数。 5、取P i 二进制数的小数点后K i 位即为该消息符号的二进制码。 四、源程序: #include #include #include #include #include using namespace std; int main() { int N; cout<<"请输入信源符号个数:";cin>>N; cout<<"请输入各符号的概率:"<

int i,j; for(i=0;i

西安交大概率论上机实验报告材料

概率论上机实验报告 实验目的 1. 学习使用MATLAB 中常见分布相关的命令; 2. 学习绘制概率分布律与分布函数图形; 3. 利用随机数对随机事件进行模拟; 4. 体会随机事件发生频率与概率的关系,加深对概率论的理解。 实验内容 1. 列出常见分布的概率密度及分布函数的命令,并操作。 2. 掷硬币150次,其中正面出现的概率为0.5,这150次中正面出现的次数记为X , (1) 试计算45=X 的概率和45≤X 的概率; (2)绘制分布函数图形和概率分布律图形。 3. 用Matlab 软件生成服从二项分布的随机数,并验证泊松定理。 4. 设22221),(y x e y x f +-=π是一个二维随机变量的联合概率密度函数,画出这一函数的联合概率密度图像。 5. 来自某个总体的样本观察值如下,计算样本的样本均值、样本方差、画出频率直方图。 A=[16 25 19 20 25 33 24 23 20 24 25 17 15 21 22 26 15 23 22 20 14 16 11 14 28 18 13 27 31 25 24 16 19 23 26 17 14 30 21 18 16 18 19 20 22 19 22 18 26 26 13 21 13 11 19 23 18 24 28 13 11 25 15 17 18 22 16 13 12 13 11 09 15 18 21 15 12 17 13 14 12 16 10 08 23 18 11 16 28 13 21 22 12 08 15 21 18 16 16 19 28 19 12 14 19 28 28 28 13 21 28 19 11 15 18 24 18 16 28 19 15 13 22 14 16 24 20 28 18 18 28 14 13 28 29 24 28 14 18 18 18 08 21 16 24 32 16 28 19 15 18 18 10 12 16 26 18 19 33

信息论与编码实验报告材料

实验报告 课程名称:信息论与编码姓名: 系:专 业:年 级:学 号:指导教 师:职 称:

年月日 目录 实验一信源熵值的计算 (1) 实验二Huffman 信源编码. (5) 实验三Shannon 编码 (9) 实验四信道容量的迭代算法 (12) 实验五率失真函数 (15) 实验六差错控制方法 (20) 实验七汉明编码 (22)

实验一信源熵值的计算 、实验目的 1 进一步熟悉信源熵值的计算 2 熟悉Matlab 编程 、实验原理 熵(平均自信息)的计算公式 q q 1 H(x) p i log2 p i log2 p i i 1 p i i 1 MATLAB实现:HX sum( x.* log2( x));或者h h x(i)* log 2 (x(i )) 流程:第一步:打开一个名为“ nan311”的TXT文档,读入一篇英文文章存入一个数组temp,为了程序准确性将所读内容转存到另一个数组S,计算该数组中每个字母与空格的出现次数( 遇到小写字母都将其转化为大写字母进行计数) ,每出现一次该字符的计数器+1;第二步:计算信源总大小计算出每个字母和空格出现的概率;最后,通过统计数据和信息熵公式计算出所求信源熵值(本程序中单位为奈特nat )。 程序流程图: 三、实验内容 1、写出计算自信息量的Matlab 程序 2、已知:信源符号为英文字母(不区分大小写)和空格输入:一篇英文的信源文档。输出:给出该信源文档的中各个字母与空格的概率分布,以及该信源的熵。 四、实验环境 Microsoft Windows 7

五、编码程序 #include"stdio.h" #include #include #define N 1000 int main(void) { char s[N]; int i,n=0; float num[27]={0}; double result=0,p[27]={0}; FILE *f; char *temp=new char[485]; f=fopen("nan311.txt","r"); while (!feof(f)) { fread(temp,1, 486, f);} fclose(f); s[0]=*temp; for(i=0;i='a'&&s[i]<='z') num[s[i]-97]++; else if(s[i]>='A'&&s[i]<='Z') num[s[i]-65]++; } printf(" 文档中各个字母出现的频率:\n"); for(i=0;i<26;i++) { p[i]=num[i]/strlen(s); printf("%3c:%f\t",i+65,p[i]); n++; if(n==3) { printf("\n"); n=0; } } p[26]=num[26]/strlen(s); printf(" 空格:%f\t",p[26]);

统计学上机实习心得体会

统计学上机实习心得体会 在本学期的统计学实验课上你一定做了许多类型的实验让你受益菲浅吧!小编收集了统计学上机实习心得体会欢迎阅读为期半个学期的统计学实验就要结束了这段以来我们主要通过excl软件对一些数据进行处理比如抽样分析方差分析等经过这段时间的学习我学到了很多掌握了很多应用软件方面的知识真正地学与实践相结合加深知识掌握的同时也锻炼了操作能力回顾整个学习过程我也有很多体会 统计学是比较难的一个学科作为工商专业的一名学生统计学对于我们又是相当的重要因此每次实验课我都坚持按时到实验室试验期间认真听老师讲解看老师操作然后自己独立操作数遍不懂的问题会请教老师和同学有时也跟同学商量找到更好的解决方法几次实验课下来我感觉我的能力确实提高了不少统计学是应用数学的一个分支主要通过利用概率论建立数学模型收集所观察系统的数据进行量化的分析、总结并进而进行推断和预测为相关决策提供依据和参考它被广泛的应用在各门学科之上从物理和社会科学到人文科学甚至被用来工商业及政府的情报决策之上可见统计学的重要性认真学习显得相当必要为以后进入社会有更好的竞争力也为多掌握一门学科对自己对社会都有好处 几次的实验课我每次都有不一样的体会个人是理科出来的对这种数理类的课程本来就很感兴趣经过书本知识的学习和实验的实践操作更加加深了我的兴趣每次做实验后回来我还会不定时再独立操

作几次为了不忘记操作方法这样做可以加深我的记忆根据记忆曲线的理论学而时习之才能保证对知识和技能的真正以及掌握更久的掌握就拿最近一次实验来说吧我们做的是“平均发展速度”的问题这是个比较容易的问题但是放到软件上进行操作就会变得麻烦书本上只是直接给我们列出了公式但是对于其中的原理和意义我了解的还不够多在做实验的时候难免会有很多问题不奇怪的是这次试验好多人也都是不明白操作不好不像以前几次试验老师讲完我们就差不多掌握了但是这次似乎遇到了大的麻烦因为内容比较多又是一些没接触过的东西我个人感觉最有挑战性也最有意思的就是编辑公式这个东西必须认真听认真看稍微走神就会什么都不知道很显然刚开始我是遇到了麻烦还好在老师的再次讲解下我终于大致明白了回到寝室立马独自专研了好久到现在才算没什么问题了 实验的时间是有限的对于一个文科专业来说能有操作的机会不是很多而真正利用好这些难得的机会对我们的大学生涯有很大意义不仅是学习上能掌握具体的应用方法我感觉更大的意义是对以后人生路的作用我们每天都在学习理论久而久之就会变成书呆子问什么都知道但是要求做一次就傻了眼这肯定是教育制度的问题和学校的设施问题但是如果我们能利用好很少的机会去锻炼自己得到的好处会大于他自身的价值很多倍例如在实验过程中如果我们要做出好的结果就必须要有专业的统计人才和认真严肃的工作态度这就在我们的实践工作中不知觉中知道一丝不苟的真正内涵以后的工作学习我们再把这些应用于工作学习肯定会很少被挫折和浮躁打败因为统计

西安交大概率论上机实验报告 西安交通大学概率论实验报告

概率论与数理统计上机实验报告

一、实验内容 使用MATLAB 软件进行验证性实验,掌握用MATLAB 实现概率统计中的常见计算。本次实验包括了对二维随机变量,各种分布函数及其图像以及频率直方图的考察。 1、列出常见分布的概率密度及分布函数的命令,并操作。 2、掷硬币150次,其中正面出现的概率为0.5,这150次中正面出现的次数记为X , (1) 试计算45=X 的概率和45≤X 的概率; (2) 绘制分布函数图形和概率分布律图形。 3、用Matlab 软件生成服从二项分布的随机数,并验证泊松定理。 4、设2 2221),(y x e y x f +-=π是一个二维随机变量的联合概率密度函数,画出这 一函数的联合概率密度图像。 5、来自某个总体的样本观察值如下,计算样本的样本均值、样本方差、画出频率直方图。 A=[16 25 19 20 25 33 24 23 20 24 25 17 15 21 22 26 15 23 22 20 14 16 11 14 28 18 13 27 31 25 24 16 19 23 26 17 14 30 21 18 16 18 19 20 22 19 22 18 26 26 13 21 13 11 19 23 18 24 28 13 11 25 15 17 18 22 16 13 12 13 11 09 15 18 21 15 12 17 13 14 12 16 10 08 23 18 11 16 28 13 21 22 12 08 15 21 18 16 16 19 28 19 12 14 19 28 28 28 13 21 28 19 11 15 18 24 18 16 28 19 15 13 22 14 16 24 20 28 18 18 28 14 13 28 29 24 28 14 18 18 18 08 21 16 24 32 16 28 19 15 18 18 10 12 16 26 18 19 33 08 11 18 27 23 11 22 22 13 28 14 22 18 26 18 16 32 27 25 24 17 17 28 33 16 20 28 32 19 23 18 28 15 24 28 29 16 17 19 18] 6. 利用Matlab 软件模拟高尔顿板钉试验。 7. 自己选择一个与以上问题不同类型的概率有关的建模题目,并解决。 二、实验目的 1.要求能够利用MATLAB 进行统计量的运算。 2.要求能够使用常见分布函数及其概率密度的命令语句。 3.要求能够利用MATLAB 计算某随机变量的概率。 4.要求能够利用MATLAB 绘制频率直方分布图。

《信息论与信源编码》实验报告

《信息论与信源编码》实验报告 1、实验目的 (1) 理解信源编码的基本原理; (2) 熟练掌握Huffman编码的方法; (3) 理解无失真信源编码和限失真编码方法在实际图像信源编码应用中的差异。 2、实验设备与软件 (1) PC计算机系统 (2) VC++6.0语言编程环境 (3) 基于VC++6.0的图像处理实验基本程序框架imageprocessing_S (4) 常用图像浏览编辑软件Acdsee和数据压缩软件winrar。 (5) 实验所需要的bmp格式图像(灰度图象若干幅) 3、实验内容与步骤 (1) 针对“图像1.bmp”、“图像2.bmp”和“图像3.bmp”进行灰度频率统计(即计算图像灰度直方图),在此基础上添加函数代码构造Huffman码表,针对图像数据进行Huffman编码,观察和分析不同图像信源的编码效率和压缩比。 (2) 利用图像处理软件Acdsee将“图像1.bmp”、“图像2.bmp”和“图像 3.bmp”转换为质量因子为10、50、90的JPG格式图像(共生成9幅JPG图像),比较图像格式转换前后数据量的差异,比较不同品质因素对图像质量的影响; (3) 数据压缩软件winrar将“图像1.bmp”、“图像2.bmp”和“图像3.bmp”分别生成压缩包文件,观察和分析压缩前后数据量的差异; (4) 针对任意一幅图像,比较原始BMP图像数据量、Huffman编码后的数据量(不含码表)、品质因素分别为10、50、90时的JPG文件数据量和rar压缩包的数据量,分析不同编码方案下图像数据量变化的原因。 4、实验结果及分析 (1)在VC环境下,添加代码构造Huffman编码表,对比试验结果如下: a.图像1.bmp:

大学概率论与数理统计上机报告

概率论与数理统计 第一次上机 专业:信息与计算科学 班级:信计1502(35组) 学生姓名:吕瑞杰陈炎睿何芝芝指导教师:张志刚 完成时间:2020年3月23日

Matlab 概率论与数理统计(LX1) 【练习1.1】二项分布、泊松分布、正态分布 (1) 对10,0.2n p ==二项分布,画出(,)b n p 的分布律点和折线; (2) 对np λ=,画出泊松分布()πλ的分布律点和折线; (3) 对2,(1)np np p μσ==-,画出正态分布2(,)N μσ的密度函数曲线; (4) 调整,n p ,观察折线与曲线的变化趋势。 理论分析: (1)因为x 为二项分布,所以有:; )2.01(2.0)(); 2.010(~k k k n C k Pn B X -=, (2)根据泊松分布公式得:); 2(~; 22.0*10np P X ===λ (3)由题意得正态分布有:); 6.1,2(~; 6.1)1(,22N X p np np =-===σμ (4)改变n 和p 的取值。 Matlab 程序: x=0:10;n=10;p=0.2; y=binopdf(x,n,p); y1=poisspdf(x,n*p); x1=-4:0.1:10; y2=normpdf(x1,n*p,sqrt(n*p*(1-p))); plot(x,y,'b-',x,y,'b.',x,y1,'r-',x,y1,'r.',x1,y2,'k-');

(4) 设n=20,p=0.3; 则λ=6;μ=6,; (新代码) x=0:10;n=20;p=0.3; y=binopdf(x,n,p); y1=poisspdf(x,n*p); x1=-2:0.1:12; y2=normpdf(x1,n*p,sqrt(n*p*(1-p))); plot(x,y,'b-',x,y,'b.',x,y1,'r-',x,y1,'r.',x1,y2,'k-'); (图形)

概率论上机实验报告资料

西安交通大学 概率论实验报告 计算机36班 南夷非 2130505135 2014年12月13日

一、实验目的 1.熟练掌握MATLAB 软件关于概率分布作图的基本操作,会进行常用的概率密度函数和分布函数的作图,绘出分布律图形。 2.利用MATLAB 软件解决一些概率论问题在实际生活中的应用。 二、实验内容 1.二项分布的泊松分布与正态分布的逼近 设 X ~ B(n ,p) ,其中np=2 1) 对n=101,…,105,讨论用泊松分布逼近二项分布的误差。 画处逼近的图形 2) 对n=101,…,105, 计算 )505(≤

纸的需求量X的分布律为 试确定报纸的最佳购进量n。(要求使用计算机模拟) 4.蒲丰投针实验 取一张白纸,在上面画出多条间距为d的平行直线,取一长度为r(r

信息论与编码实验报告

实验一 绘制二进熵函数曲线(2个学时) 一、实验目的: 1. 掌握Excel 的数据填充、公式运算和图表制作 2. 掌握Matlab 绘图函数 3. 掌握、理解熵函数表达式及其性质 二、实验要求: 1. 提前预习实验,认真阅读实验原理以及相应的参考书。 2. 在实验报告中给出二进制熵函数曲线图 三、实验原理: 1. Excel 的图表功能 2. 信源熵的概念及性质 ()()[] ()[]())(1)(1 .log )( .) ( 1log 1log ) (log )()(10 , 110)(21Q H P H Q P H b n X H a p H p p p p x p x p X H p p p x x X P X i i i λλλλ-+≥-+≤=--+-=-=≤≤? ?????-===??????∑ 单位为 比特/符号 或 比特/符号序列。 当某一符号xi 的概率p(xi)为零时,p(xi)log p(xi) 在熵公式中无意义,为此规定这时的 p(xi)log p(xi) 也为零。当信源X 中只含有一个符号x 时,必有p(x)=1,此时信源熵H (X )为零。 四、实验内容: 用Excel 和Matlab 软件制作二进熵函数曲线。根据曲线说明信源熵的物理意义。 (一) Excel 具体步骤如下: 1、启动Excel 应用程序。 2、准备一组数据p 。在Excel 的一个工作表的A 列(或其它列)输入一组p ,取步长为0.01,从0至100产生101个p (利用Excel 填充功能)。

3、取定对数底c,在B列计算H(x) ,注意对p=0与p=1两处,在B列对应位置直接输入0。Excel中提供了三种对数函数LN(x),LOG10(x)和LOG(x,c),其中LN(x)是求自然对数,LOG10(x)是求以10为底的对数,LOG(x,c)表示求对数。选用c=2,则应用函数LOG(x,2)。 在单元格B2中输入公式:=-A2*LOG(A2,2)-(1-A2)*LOG(1-A2,2) 双击B2的填充柄,即可完成H(p)的计算。 4、使用Excel的图表向导,图表类型选“XY散点图”,子图表类型选“无数据点平滑散点图”,数据区域用计算出的H(p)数据所在列范围,即$B$1:$B$101。在“系列”中输入X值(即p值)范围,即$A$1:$A$101。在X轴输入标题概率,在Y轴输入标题信源熵。 (二)用matlab软件绘制二源信源熵函数曲线 p = 0.0001:0.0001:0.9999; h = -p.*log2(p)-(1-p).*log2(1-p); plot(p,h) 五、实验结果

概率统计实验报告

概率统计实验报告 班级16030 学号16030 姓名 2018 年1 月3 日

1、 问题概述和分析 (1) 实验内容说明: 题目12、(综合性实验)分析验证中心极限定理的基本结论: “大量独立同分布随机变量的和的分布近似服从正态分布”。 (2) 本门课程与实验的相关内容 大数定理及中心极限定理; 二项分布。 (3) 实验目的 分析验证中心极限定理的基本结论。 2、实验设计总体思路 2.1、引论 在很多实际问题中,我们会常遇到这样的随机变量,它是由大量的相互独立的随机 因素的综合影响而形成的,而其中每一个个别因素在总的影响中所起的作用是微小的,这种随机变量往往近似的服从正态分布。 2.2、 实验主题部分 2.2.1、实验设计思路 1、 理论分析 设随机变量X1,X2,......Xn ,......独立同分布,并且具有有限的数学期望和方差:E(Xi)=μ,D(Xi)=σ2(k=1,2....),则对任意x ,分布函数 满足 该定理说明,当n 很大时,随机变量 近似地服从标准正 态分布N(0,1)。因此,当n 很大时, 近似地服从正 态分布N(n μ,n σ2). 2、实现方法(写清具体实施步骤及其依据) (1) 产生服从二项分布),10(p b 的n 个随机数, 取2.0=p , 50=n , 计算n 个随 机数之和y 以及 ) 1(1010p np np y --; 依据:n 足够大,且该二项分布具有有限的数学期望和方差。 (2) 将(1)重复1000=m 组, 并用这m 组 ) 1(1010p np np y --的数据作频率直方图进 行观察. 依据:通过大量数据验证随机变量的分布,且符合极限中心定理。

信息论与编码实验报告

信息论与编码实验报告-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

实验一关于硬币称重问题的探讨 一、问题描述: 假设有N 个硬币,这N 个硬币中或许存在一个特殊的硬币,这个硬币或轻 或重,而且在外观上和其他的硬币没什么区别。现在有一个标准天平,但是无刻度。现在要找出这个硬币,并且知道它到底是比真的硬币重还是轻,或者所有硬币都是真的。请问: 1)至少要称多少次才能达到目的; 2)如果N=12,是否能在3 次之内将特殊的硬币找到;如果可以,要怎么称? 二、问题分析: 对于这个命题,有几处需要注意的地方: 1)特殊的硬币可能存在,但也可能不存在,即使存在,其或轻或重未知; 2)在目的上,不光要找到这只硬币,还要确定它是重还是轻; 3)天平没有刻度,不能记录每次的读数,只能判断是左边重还是右边重,亦或者是两边平衡; 4)最多只能称3 次。 三、解决方案: 1.关于可行性的分析 在这里,我们把称量的过程看成一种信息的获取过程。对于N 个硬币,他们 可能的情况为2N+1 种,即重(N 种),轻(N 种)或者无假币(1 种)。由于 这2N+1 种情况是等概率的,这个事件的不确定度为: Y=Log(2N+1) 对于称量的过程,其实也是信息的获取过程,一是不确定度逐步消除的过程。 每一次称量只有3 种情况:左边重,右边重,平衡。这3 种情况也是等概率 的,所以他所提供的信息量为: y=Log3 在K 次测量中,要将事件的不确定度完全消除,所以 K= Log(2N+1)/ Log3 根据上式,当N=12 时,K= 2.92< 3 所以13 只硬币是可以在3 次称量中达到

概率论与数理统计实验报告

概率论与数理统计实验报告 一、实验目的 1.学会用matlab求密度函数与分布函数 2.熟悉matlab中用于描述性统计的基本操作与命令 3.学会matlab进行参数估计与假设检验的基本命令与操作 二、实验步骤与结果 概率论部分: 实验名称:各种分布的密度函数与分布函数 实验内容: 1.选择三种常见随机变量的分布,计算它们的方差与期望<参数自己设 定)。 2.向空中抛硬币100次,落下为正面的概率为0.5,。记正面向上的次数 为x, (1)计算x=45和x<45的概率, (2)给出随机数x的概率累积分布图像和概率密度图像。 3.比较t(10>分布和标准正态分布的图像<要求写出程序并作图)。 程序: 1.计算三种随机变量分布的方差与期望 [m0,v0]=binostat(10,0.3> %二项分布,取n=10,p=0.3 [m1,v1]=poisstat(5> %泊松分布,取lambda=5 [m2,v2]=normstat(1,0.12> %正态分布,取u=1,sigma=0.12 计算结果: m0 =3 v0 =2.1000 m1 =5 v1 =5 m2 =1 v2 =0.0144 2.计算x=45和x<45的概率,并绘图 Px=binopdf(45,100,0.5> %x=45的概率 Fx=binocdf(45,100,0.5> %x<45的概率 x=1:100。 p1=binopdf(x,100,0.5>。 p2=binocdf(x,100,0.5>。 subplot(2,1,1>

plot(x,p1> title('概率密度图像'> subplot(2,1,2> plot(x,p2> title('概率累积分布图像'> 结果: Px =0.0485 Fx =0.1841 3.t(10>分布与标准正态分布的图像 subplot(2,1,1> ezplot('1/sqrt(2*pi>*exp(-1/2*x^2>',[-6,6]> title('标准正态分布概率密度曲线图'> subplot(2,1,2> ezplot('gamma((10+1>/2>/(sqrt(10*pi>*gamma(10/2>>*(1+x^2/10>^(-(10+1>/2>',[-6,6]>。b5E2RGbCAP title('t(10>分布概率密度曲线图'> 结果:

《非参数统计》实验教学大纲

《非参数统计》课程实验教学大纲 大纲制定(修订)时间: 2017 年 6 月 课程名称:《非参数统计》课程编码:090531007 课程类别:专业基础课课程性质:必修 适用专业:应用统计学 课程总学时:40 实验(上机)计划学时:8 开课单位:理学院 一、大纲编写依据 1.应用统计学专业2017版教学计划; 2.应用统计学专业《非参数统计》理论教学大纲对实验环节的要求; 3.近年来《非参数统计》实验教学经验。 二、实验课程地位及相关课程的联系 1. 非参数统计是应用统计学专业学生的一门专业基础必修课。 2.本实验以《概率论与数理统计》为先修课; 3.与《数理统计》课程相辅相成。 三、实验目的、任务和要求 1.开设本课程的目的是为了满足日后学生参加统计调查实践工作的需要。 2.掌握单样本模型、两样本位置模型、多样本分类数据模型中的各种非参数统计检验方法,以及检验尺度参数是否相等的各种非参数方法,掌握各种回归的方法,掌握分布检验的各种方法,通过利用各种统计软件(包括SPSS、R软件)实现对样本调查数据的处理与分析,能在真实案例中应用相应的方法。 四、教学方法、教学形式、教学手段的特色 1.每个实验由教师指定实验内容及要求,由学生独立完成上机操作,得出正确的结果。 2.学生要书写实验报告,记录式样结果。 五、实验内容和学时分配

实验一位置参数的检验在统计软件中的实现 1、实验目的:掌握单样本、两样本和多样本位置参数的检验在统计软件中的实现过程。 2、实验要求:将操作过程及结果书写出来,并且将结果截图后贴在实验报告上。 3、实验内容:根据实际问题,个人设计检验总体,获取数据,进行检验。 4、主要仪器设备及试剂:(据实选填)计算机·50台·SPSS/EXCEL软件 实验二尺度参数的检验在统计软件中的实现 1、实验目的:掌握两样本和多样本尺度参数的检验在统计软件中的实现过程。 2、实验要求:把操作过程及结果书写出来,并且上交实验报告。 3、实验内容:根据实际问题,个人设计检验总体,获取数据,进行检验。 4、主要仪器设备及试剂:(据实选填)计算机·50台·SPSS/EXCEL软件 实验三相关与回归分析在统计软件中的实现 1、实验目的:掌握Spearman秩相关检验、Kendall协同检验与Theil回归在统计软件中的实现过程,并与Pearson相关系数与一元线性回归分析比较。 2、实验要求:将各种结果相对照,最后把操作过程及结果书写出来,并且上交实验报告。 3、实验内容:根据实际问题,个人设计检验总体,获取数据,进行检验。 4、主要仪器设备及试剂:(据实选填)计算机·50台·SPSS/EXCEL软件 实验四Kolmogorov-Smirnov检验在统计软件中的实现 1、实验目的:掌握Kolmogorov-Smirnov检验在统计软件中的实现过程,并与卡方检验结果对照。 2、实验要求:将结果相对照,最后把操作过程及结果书写出来,上交实验报告。 3、实验内容:根据实际问题,个人设计检验总体,获取数据,进行检验。 4、主要仪器设备及试剂:(据实选填)计算机·50台·SPSS/EXCEL软件 六、教材(讲义、指导书) 《非参数统计》,吴喜之,赵博娟,中国统计出版社,2013. 七、考核方法和评分标准 1.按照大纲要求,根据每个学生实验前的预习准备,实验过程的考查,实验操作情况及实验报告的质量,综合给出实验成绩。 2.评分等级 评分成绩分优、良、中、及格和不及格五个等级。 优:90分以上 良:80-89分 中:70-79分 及格:60-69分 不及格:59分及以下 具体评定标准如下: 优:实验纪律、预习、操作技能很好,实验报告书写工整无原则错误; 良:实验纪律、预习、操作技能较好,实验报告中原则错误不超过一个; 中:实验纪律、预习、操作技能一般,实验报告中原则错误不超过两个; 及格:实验纪律、预习、操作技能较差,实验报告中原则错误不超过三个; 不及格:实验中严重违章违纪,预习、实验技能均较差,实验报告中数据严重错误。 八、使用说明 1.本实验教学大纲一般随课程进度进行安排,也可集中安排;

相关主题
文本预览
相关文档 最新文档