当前位置:文档之家› 生物数学

生物数学

生物数学
生物数学

第三章生物分类的数学模型

本章开始将讨论生物分类,按照生物分类学家的理解就是指表征分类和分支分类,我们仅研究两种分类概念下的数学理论与方法。这里的分类也是多元统计关于聚类分析的延续,但是已远远超出统计数学的范围。表征分类除经典的系统分类以外还包括图论分类、信息分类、模糊分类;分支分类是以抽象代数为基础,研究生物演化规律的分支学科。因此生物数学中的分类数学模型不能再视作多元统计中的聚类分析,而应称为分类分析。本章专门讨论分类分析中的表征分类数学模型。

第一节分类的基本概念和原始数据的获得

何谓分类?有句俗话“物以类聚”,这句话的意思是说,许多事物依据其类别的特征,相似者归为同一种类。从这个意思去理解,分类有两个要素。第一个要素是被分类的对象,分类对象是由许多被分类的实体所组成,3个以上的实体构成一个基本分类对象。被分类的实体,就是被分类的基本单位,在数量分类学中称为运算分类单位(operational taxonomic unit)简写作分类单位(OTU)。全部被分类的分类单位构成的集合称为被分类群。分类的第二个要素是分类的依据,分类依据取决于被类群中分类单位的性状,所谓性状(character)是一个分类单位区分于其他分类单位的性质、特征或属性。一个分类单位对某个性状所呈现的状态,称为该性状的性状状态(character state),简称状态(state)。

分类就是将被分类群中所有的分类单位,依据它们的性状状态,遵从一定的原则作出划分或聚合,得到一组新的分类单位集合。通过分类获得的这个分类单位集合称为分类群(taxon)。

世界上一切事物都存在分类的问题。专门研究生物物种的分类,也就是生物分类学中的分类,有表征与分支两个对立的概念。依据生物表现性状相似性全面比较而建立的系统分类称为表征分类(phenetic classification);遵从生物演化的谱系关系而建立的系统分类称为分支分类(cladistic classification)。这两个概念在生物分类学和数量分类学中都很重要,相应的也有两种不同的数学方法,本章将要研究表征分类。

分类单位隶属于一个分类群产生分类单位与分类单位之间的联系。如果A是被考虑的一个分类群,又有分类单位x∈A,且分类单位y∈A,则认为x与y之间建立起同属于一个分类群的联系,称作分类单x与y共分类群,记作

xφy

分类学家在分析比较鉴定被分类对象时,经常要问哪些分类单位属于同一分类群,生物分类工作时时刻刻都在考虑共分类群问题。显然共分类群这个联系成为分类学理论上最基本的概念之一。

分类单位共分类群关系φ具有以下性质:

性质1 自反性(reflexivity),即xφx;

性质2 对称性(symmetry),若xφy,则yφx;

性质3 传递性(transitivity),若xφy且yφz,则xφz。

共分类群,就分类单位的隶属性关系来说,以上3条性质是十分必要的,3条性质正是数学中的所谓等价关系(equivalence relation)。具有等价关系的集合,可以依据等价关系将集合分类,得等价集合类。这是集合论中的一个重要结论。数量分类学中的定量分类方法正是依靠数学中的这个结论去解决分类问题。等价关系下的等价集合类成为表征分类方法的理论根据。

下面我们将开始讨论在表征分类观点下的数量分类方法。

当被分类群一经确定,合适的性状也被挑选出来,生物学工作者就要对调查、观察、测量、实验得到的数据进行整理,获得有关分类单位和性状的原始记录。这些记录收集了来自各方面的信息,是从事分类工作的第一手资料。原始记录的形式尚不能直接进行数学运算。为了能够利用数学工具来从事分类学的研究,必须将所有这些记录改变成适合于数学运算的形式。在数量分类学中这项工作叫做性状编码。

性状编码的一般方法随性状的各种类型分别处理,现叙述如下:

1. 数值性状

以整数或实数所表示的性状称为数值性状(numerical character)。例如生物形态的各种度量、长度、面积、体积、角度和重量等;生物组织器官各部分构成的数量;各种实验数据;各种仪器测量的数据以及基于上述性状而获得的导出性状。这些都是数值性状。

数值性状本身已经是数值,它是天然的最适合于进行数量分类的性状,一般分类方法无须编码处理,就可以转入下一步进行数学运算。需要注意的是有些性状虽然以数值表示,但实质上不属于数值性状。

2. 二元性状

表现为对立面二种状态的性状称为二元性状(binary character)。例如动物是脊椎动物还是无脊椎动物,脊椎动物中是胎生还是卵生,冷血还是温血;有花植物的花冠是合瓣还是离瓣,子房是分离心皮还是合生心皮,果实开裂与否;在微生物学中二元性状尤其多,各种生理、生化、营养性状几乎都出现二元性状;生物地理学的调查资料中,生物种类在指定区域内的有或无也是二元性状。

二元性状的编码很简单,将两个状态分别以“0”和“1”表示,通常肯定的状态为1,否定的性状为0。

3. 有序多态性状

表现为三个状态以上,能排列成一定次序,次序具有分类意义的性状称为有序多态性状(ordered multistate character)。例如对器官某部分长度的描述是短、略长、长、极长;植物体表无毛、微具毛、具毛、多毛、密毛;植物地理学中某植物在某地区的分布调查是无、有、较多、极多。

有序多态性状的状态个数一般都是有限的,由于是有序的,可以将其排列为一定的等级。编码时可以取连续排列的非负整数0, 1, 2, 3, …, n,它们分别表示n + 1个有序多态性状状态。

例如被毛的性状可编码如下:

性状状态:无毛微具毛具毛多毛密毛

编码:0 1 2 3 4

性状状态在不同方向上各自排列为有序的多态性状,不能按上面的编码方法处理。例如关于被毛的性状,如果毛有短毛、长毛,硬毛、柔毛,单一毛、二歧分支毛和多歧星状毛。这种情形属于无序多态性状,可采取分解的方法编码。

4. 无序多态性状

表现在三个状态以上,不能排列成具有分类意义的一条序列的性状称为无序多态性状(disordered multistate character)。例如种子植物的花序有总状、头状、伞形、伞房、穗状……;花冠的类型有唇形、蝶形、钟形、舌形……;昆虫的口器有咀嚼式、针吸式、虹吸式、舐吸式……;生物分布的地理区域也是无序多态性状。在微观世界蛋白质的氨基酸组成和核酸中的核苷酸构成都是无序多态性状。

无序多态性状的编码比较复杂,有以下三种方法,叙述如下:

4.1 分解法

分解法就是将原性状分成多个新性状,再进行编码。有时候无序多态性状包含了多种互相独立的意义,实际上这种性状不符合单位性状的要求,分解成多个相应的单位性状是应该的。例如植物被毛的种类,有短毛、长毛、硬毛、软毛、单一毛、二歧分支毛、多歧星状毛和腺毛等。这一无序多态性状具有多方面的意义,即毛的长短、毛的硬软、毛的分枝状况和毛端是否形成腺状小点。据此,该性状可以分解为4个性状,分别编码如下:

毛的长短性,二元性状。短,0;长,1。

毛的质地,二元性状。软,0;硬,1。

毛的分枝程度,有序多态性状。单一毛,0;二歧分枝毛,1;星状毛,2。

毛端是否具腺状点,二元性状。非腺毛,0;腺毛,1。

4.2 综合评分法

这种方法正好像竞技比赛的记分一样,容易为一般读者所理解。为了尽可能避免主观性,必须在编码之前先确定评分的标准,规定合适的综合计算方法,并且要求评分者深明性状的分类学意义。

具体方法随性状的要求而异,现举例说明。

例1 猪品种的分类研究中,猪耳的形态学性状在育种学和生态学方面具有重要意义。采取综合评分法编码,将该性状纳入猪品种的定量分类研究中。根据猪耳的形态学特征及其生物学意义,先确定耳的大小和下垂程度是评分的两个主要依据,再规定评分标准:

耳大小:耳小,0;一般,1;耳大,2;特大,3;特大遮眼,4。

耳下垂:耳直立,0;耳平伸,1;耳下垂,2。

从这两个方面评出分数,再将两分数相加得综合评分编码。

譬如焦溪猪,耳特大遮眼、下垂,评分编码值6=4+2。

例2 小麦抗锈性是小麦育种学重要特征,根据已有的记录将抗锈性分为五个评分等级。发病特别严重、孢子堆大而普遍,0;有较大孢子堆、发病较普遍,1;有较小孢子堆、发病较轻,2;有抗性斑点,3;从未见发病,4。小麦的抗锈性又有抗条锈、抗杆锈和抗叶锈三种不同的区别。小麦的育种工作抗条锈品种容易获得,抗秆锈品种

较少不易获得,抗叶锈品种很难得到。因此,对三种不同的抗锈性分别给予不同的权重系数,0.091(抗条锈)、0.435(抗秆锈)、0.474(抗叶锈)。

譬如小麦“农大16”品种,对条、秆、叶的抗锈性等级评分分别是4、1、2。该小麦总的综合评分编码为

(0.091×4 + 0.435 + 0.474×2)= 1.747

4.3 演化分析法

生物分类的某些无序多态性状,性状自身呈现出树状的演化过程,可画出其演化关系——树(tree)。树是图的一种,这里涉及图论的一些基本概念。

考虑到演化的特点,有向树图中连接两顶点之间的弧是有方向的,于是图中存在一个顶点,可以它为起点连通到所有其他状态顶点,称为演化起源,而且这样顶点只有一个。除代表演化起源的顶点外,一个顶点,没有一条弧以它为起点,称为演化终点。每一个演化终点代表一个演化方向,把这个演化方向定为新的性状。新性状的编码规定如下,演化起源的顶点编码为0。连接起源顶点到该性状的演化终点的通路称为主通路。从起源顶点开始沿主通路,每经过一条边增加一个单位编码值,于是主通路上所有顶点的状态都赋给编码值,演化终点状态达到该性状编码的最大值。非主通路上顶点状态的编码值这样规定:取出从起源顶点到该顶点的通路,该通路经过主通路的边数是其状态编码值。这样一来,所有的状态都赋给了新性状的编码值。对每一个演化终点照前述方法对所有状态赋给一个新性状编码值,编码工作完成。

举一个例子。如果在某植物分类研究中,采用花序性状,出现的性状状态有复穗状花序、穗状花序、总状花序、圆锥花序和伞房花序,无疑这个性状属于无序多态。花序的演化实际过程比较复杂,这里假如按图3-1的方式展开,图中单生叶腋花序是假设状态,也是树图的演化起源。该树图有3个演化终点状态,分别是复穗状花序、伞房花序和圆锥花序。3个演化终点状态确定3个新的性状,分别记作性状I、II和III,新性状的编码列于图3-1的表中。

图3-1 部分花序的演化分析编码

起源状态是单生叶腋花序,所有性状的编码均为0。

性状I的主通路单生叶腋花序→穗状花序→复穗状花序;

性状II的主通路单生叶腋花序→总状花序→伞房花序;

性状III的主通路单生叶腋花序→总状花序→圆锥花序。

按照前述编码规定,性状I中穗状花序和复穗状花序的编码分别为1和2;总状花序、圆锥花序和伞房花序,因为从起源状态到它们的路径不经过主通路,故编码值均为0。性状II中总状花序和伞房花序的编码分别为1和2;从起源状态到圆锥花序的通路有一条边通过主通路,故圆锥花序在性状II的编码值为1;从起源状态到穗状花序和复穗状花序的通路不经过主通路,故穗状花序和复穗状花序在性状II的编码为0。同理可作性状III的编码,不再赘述。

其实,演化分析的编码方法也是性状分解法,它的分解是依据性状的演化关系。因此,演化分析方法能更好地反映生物演化谱系,对生物分类系统学的研究具有重要价值,在分支分类部分还要详细讨论。无序多态性状的编码方法介绍到此。

经过编码以后的原始数据,如果有t个分类单位,n个性状,数据可列成表格记录如下:

(3.1)

其中分类单位和性状都以整数编号表示。第i 个分类单位,第j 个性状状态的数据是y ij (i = 1, 2, …, t ; j = 1, 2, …, n )。

第二节 数据变换和数据标准化

前一节讨论了性状的编码,经过编码所获得的原始数据如果都是二元数据,没有特殊需要可以直接进行相似性系数运算;如果数据是一般的实数,就必须先进行数据的变换和标准化,然后才能进行相似系数运算。

生物世界种类万千,变化多端,对生命现象的描述和记录十分复杂,数据的来源不同,量纲不同,某些来自专门技术和特殊实验的数据度量标准更复杂。

数据的复杂性最后反映在数值的大小和变化的幅度因不同的性状而各不相同。性状之间的这种差异仅仅是由于性状各自的特点和度量标准不同而产生的。这种差异影响分类的结果,有时候甚至大到把具有分类意义的变化完全掩盖下去,使得分类运算看不到有意义的结果。因此在进行大规模运算之前,需要先进行变换或标准化处理,以便减少和消除这种差异带来的影响。

对原始性状数据进行变换的方法就是将需要变换的数据代入一个事先拟好的函数中,进行计算,得出一组新的数值代替原来的性状数据。如果某一性状有t 个分类单位,数据x 1, x 2, …, x t 进行变换的一般形式是:

……

这里i x '(i = 1, 2, …, t )表示变换后的数据,f i (x 1, x 2, …, x t )(i = 1, 2, …, t )是原始性状数据的函数,称为该变换的变换函数。

最简单的变换是数据自身减去某一常数:

),,2,1('t i c

x x i i (3.2)

这个变换的效果是把度量的基准点做一次平移,有时把常数c 改换成该性状数据的平均值,这样的变换称为中心化(centralization)。

另一个简单的变换是数据自身乘以非零常数c ,

),,2,1('t i c x x i i (3.3) 这个变换可以使性状数据均匀地放大(c >1)或者缩小(c <1)。

还有一个基本的变换是m 次幂乘方,变换函数是

),,2,1('t i x x m

i i

(3.4)

其中m 是非零整数。如果不是整数也可以表示开方运算。

前面提到的三种变换是性状数据自身最基本的代数变换,部分复杂的变换都可以通过有限次这种变换的组合来实现。

除基本的代数变换以外,还有一些特殊函数的变换。数学中任何一个函数都可以当作变换函数,常见的变换函数有三角函数与反三角函数、指数函数、对数函数等,例如:

前面所讨论的变换都是个别性状对其自身的变换。为了消除性状之间数值的大小和变化幅度的差异,常常对所有的性状采取统一的变换,这种变换称为标准化变换(standardized transformation)。

对原始数据进行这种变换的运算过程称为原始数据的标准化(standardization of original data)。在主成分分析和许多相似性系数的运算中,原始数据的标准化已成为必不可少的步骤,我们在这一节里详细讨论。

经过性状编码以后获得的原始数据可以看作一个t 行n 列的矩阵,称为原始数值矩阵(original data matrix):

tn t t n n y y y y y y y y y 21

2222111211 (3.5)

矩阵中的行向量[y i 1 y i 2 … y in ](i = 1, 2, …, t )称为第i 个分类单位向量(vector of operational taxonomic unit);列向量

[y 1j y 2j … y tj ](j = 1, 2, …, n )称为第j 个性状向量(vector of charater).

最简单的标准化变换称为极差标准化变换。如果经标准化变换以后的数据记作x ij ,极差标准化变换的数学公式如下:

n j t i y y y y x kj k kj k kj k

ij ij ,,2,1,,2,1}{min }{max }{min (3.6) 其中}{max kj k

k 表示第j 个性状数据y 1j , y 2j , …, y tj 的最大值;}{min kj k

k 为相应的最小值。 公式中的分母代表第j 性

状极大状态值和极小状态值之间的差异。极差标准化的名称由此而得。不难看出,经极差标准化变换之后的数据

x ij 介于0到1之间(0≤x ij ≤1),性状之间数据大小和变化幅度不具有分类意义的差异已经消除。

极差标准化变换虽然计算简单,但这种变换设计十分粗糙,特别当个别数据远离其他数据时,较大的极差使变换后的数据取值不甚合理。

下面介绍一种基于统计运算的标准化变换,这种变换比较合理,已成为数量分类运算常规的运算过程。以至以后再述及标准化时,除非特别说明,一般都指这种基于统计学的标准化方法。其变换公式表示如下:

n j t i s y y x j

j

ij ij ,,2,1,,2,1 (3.7) 其中

n j y t y t

k kj

j ,,2,111

(3.8)

2

112)(11

t

k j kj j y y t s ),,2,1(n j (3.9)

j y 和s j 分别是第j 性状数据的平均值(mean)和标准差(standard deviation)。

怎样理解上述标准化变换的意义呢?如果我们把每个性状的数据都看作是平均值为j y ,标准差为s j 的正态分布随机变量。所谓标准正态分布就是平均值为0,标准差为1的正态分布。不难验证变换以后每一个性状的数据组x 1j , x 2j , …, x tj 其平均值为0,标准差为1。变换之前,每一个性状各有自己的平均值和标准差;变换之后,所有的性状都服从标准正态分布,因而性状之间因数值大小和变化幅度不同而产生的不具有分类意义的差异就不复存在了。 也可以从另一个角度理解标准化的意义。变换以后的第j 个性状向量以大写字母X j 表示,有趣的是,变换后性状向量的模都相同,并且有等式

),,2,1(1

n j t X j (3.10)

其中X j = [x 1j , x 2j , …, x tj ]

向量的模可以理解为向量的长度。经过标准化变换,性状向量长度都一致,说明因性状之间大小和变化幅度的不同而产生的不具有分类意义的差异已经消除。

原始数值矩阵(3.5)经过标准化变换之后获得已标准化原始数值矩阵

tn t t n n x x x x x x x x x 212222111211

(3.11) 该矩阵仍然与原始数值矩阵一样,t 行代表分类单位,n 列代表性状。矩阵在标准化过程中排除了不具有分类意义

的数量关系,因而能正确地反映分类单位之间的相亲性。以后的分类运算分析将在这个矩阵上进行。

本书为了说明数量分类每一步的具体运算方法,选取植物桔梗科(Campanulaceae)中的部分种(6个种,8个形态学性状)和五加科人参属(Panax )部分种(7个种,13个性状)作为具体例子。此两例经过性状编码获得的原始数据将在以后各章中多次采用。取用时,对数据的来源每次不再作具体介绍。为了使举例简单易算,尽量把数据的规模缩小,当然,在实际工作中,分类单位和性状的个数都远比此例多,不会如此简单。 举例的桔梗科6个种,学名和种的形态描述如下: 党参[Codonopsis pilosula (French.) Nannf.]

多年生草本。茎缠绕附它物而蔓生,茎长约3~10米。叶对生,有长柄,卵圆形,叶全缘或具波状边缘。花单生枝顶或生叶腋;萼片5,宽披针形;花冠钟状,浅绿色,5浅裂;雄蕊5;柱头3~5裂;子房下位,3~5室。蒴果圆

锥形,成熟时顶部萼片间室背开裂。种子长椭圆形、褐色、无翼。

桔梗[Platycodon grandiflorus (Jacq.) A. DC.]

多年生直立草本,株高60厘米。叶互生,有时对生或轮生;叶无柄或短柄;叶缘有锐锯齿。花单生或数朵生枝顶;萼5裂;花冠阔钟状,蓝紫色,5裂,花径4~5厘米;雄蕊5;子房下位,5室,柱头5裂。蒴果倒卵形,成熟时顶部瓣裂;种子扁平、无翼。

轮叶沙参[Adenophora pereskiifolia (Fisch. ex Roem. et Schult.) G. Don.]

多年生直立草本,株高50厘米。茎生叶3~4叶轮生;叶卵圆状披针形;叶缘有锐粗锯齿。圆锥花序或总状花序;萼片5、披针形;花冠钟形、蓝紫色,花盘短筒状;花柱长,伸出花冠外,柱头膨大、3瓣裂;子房下位、3室,果沿侧壁开裂;种子卵圆形、无翼。

荠苨[Adenophora remotiflora (Sieb. et Zucc.) Miq.]

多年生直立草本,株高70厘米。上部茎生叶互生、有柄、卵形、长椭圆状卵形至广披针形;叶缘有锐重锯齿。总状花序或疏圆锥花序;花冠宽钟形、白色或淡青色;花柱伸出花冠外;柱头3浅裂;子房下位,3室;花盘短筒状。蒴果侧壁开裂;种子卵形、无翼。

羊乳[Codonopsis lanceolata (Sieb. et Zucc.) Trautv.]

多年生草本,茎缠绕,长2~3米。叶有短柄、对生,叶狭卵形,叶全缘,或微具波状疏齿。花单生;花冠钟状、5浅裂,淡绿色,内面具有紫褐色斑;雄蕊5,柱头3~5;子房3~5。果短圆锥形,顶部萼片间室背开裂;种子淡褐色、卵圆形、扁而具翼。

石沙参(Adenophora polyantha Nakai)

多年生直立草本,高65厘米左右。叶互生、近无柄,叶椭圆状披针形,叶缘具粗锯齿。圆锥花序或总状花序;萼片线状披针形;花冠钟形,边缘裂片外翻卷,花蓝紫色;花柱略伸出花冠外;子房3室。蒴果侧壁开裂;种子无翼。

选取8个性状,性状的编码方法如下:

(1) 茎是否缠绕,二元性状。茎缠绕,1;直立,0。

(2) 株高,数值性状。取株高或茎的长度(米)

(3) 叶的着生方式,有序多态性状。叶互生,0;对生,1;轮生,2。

(4) 叶缘,有序多态性状。叶全缘或波状疏齿,0;锯齿,1;重锯齿,2。

(5) 花序,有序多态性状。单生花序,或整个生枝顶,0;总状花序或疏圆锥花序,1;圆锥花序或总状花序,2。

(6) 子房室数,数值性状。取子房室数。

(7) 果开裂方式,有序多态性状。果侧壁开裂,0;果顶部5瓣裂,1;果顶部萼片间室背开裂,2。

(8)种子是否具翼,二元性状。果不具翼,0;具翼,1。

对6个种的8个性状,按照上述原则进行编码,编码结果列于表3-1中。标准化数据在表3-2中。

续表3-1

人参属选取部分种和变种(7个OTU13个性状)的数据,也作为本书演算的实例。分类单位的描述如下:

人参(Panax ginseng C. A. Meyer)

多年生草本,株高50~60厘米。主根圆柱形或纺锤形,肉质;根状茎较短,节距4毫米左右。掌状复叶,小叶3~5;中央小叶长10厘米左右,椭圆形至长椭圆形,长8~12厘米,宽3~5厘米;叶缘锯齿,10齿宽18毫米左右。伞形花序顶生;花小;萼5齿;花瓣5;雄蕊5;花柱2,分离。果成熟时红色;种子扁圆形,宽4~5毫米。根部化学成分人参醇含量高。分布海拔1000米左右。

西洋参(Panax quinquefolius Linn.)

多年生草本,株高30厘米左右。主根圆柱形或纺锤形,肉质;根状茎短,节距3~4毫米。掌状复叶,小叶3~5;中央小叶长7~10厘米,宽5厘米左右,长倒卵形;叶缘锯齿10齿宽20毫米左右。伞形花序顶生;花萼5齿;花瓣5;花柱2,分离。果成熟时红色。种子扁球形,宽5毫米左右。植物化学成分人参醇含量高。分布海拔1000米左右。

三七(Panax notoginseng (Burk.) F. H. Chen)

多年生草本,株高30~40厘米,主根圆锥形、肉质。根状茎短,节距9毫米左右。掌状复叶,小叶5~7;中央小叶长6~10厘米,宽3厘米左右,倒卵状椭圆形;叶缘锯齿较宽,10齿宽23毫米左右。伞形花序顶生,花80~100朵;花柱2,合生。果成熟红色。化学成分人参醇含量高。分布海拔2000米左右。

竹节参(Panax japonicus C. A. Meyer var. japonicus)

多年生草本,株高50厘米左右;肉质主根较小;根状茎竹节状,节距5~8毫米,差异较小;掌状复叶,小叶常5枚,中央小叶阔椭圆形,长8~9厘米,宽3~5厘米;叶缘细锯齿,10齿宽20毫米左右;伞形花序;花柱2或3,离生;果成熟时红色具黑色斑点;种子卵球形,宽3毫米左右;植物化学成分人参醇含量低;分布海拔1000~1500米。

羽叶三七[Panax japonicus C. A. Meyer var. bipinnatifidus (Seem). C.Y. Wu

et K. M. Feng]

多年生草本,株高35~55厘米。主根不呈明显肉质;根状茎较长,节距3~5厘米;差异较大。掌状复叶,小叶5~7;中央小叶长5~9厘米,宽2~4厘米,二回羽状深裂,长椭圆形;叶缘锯齿细,10齿宽10~20毫米。伞形花序顶生;花小;子房二室;花柱2,离生。果成熟红色具黑色点;种子较小,宽3毫米左右。化学成分中人参醇含量较少。分布海拔较高,2000~3000米。

狭叶竹节参[Panax japonicus C. A. Meyer var. angustifolius (Burk.) Cheng et Chu]

多年生草本,株高60~100厘米。肉质主根不明显;根状茎竹节状,节距0.5~1.0厘米。掌状复叶,小叶5~7;小

叶狭长,长可达10~15厘米,宽1~3厘米,披针形或线状披针形;叶缘锯齿细密,10齿宽10~20毫米。伞形花序;花柱2~5,离生。果成熟时红色具黑色点。种子较小,卵球形,宽2.5毫米左右。植物化学成分人参醇含量低。分布海拔1500~2000米左右。

珠子参[Panax japonicus C. A. Meyer var. marjor (Burk.) C. Y. Wu et K. M. Feng]

多年生草本,株高50~60厘米。肉质主根不明显;根状茎串球状,或前端有短竹鞭状部分,节距长10~30毫米,差异较大。掌状复叶,小叶5,小叶较小,中央小叶长5~8厘米,宽2~3厘米,倒披针形,倒卵状椭圆形;叶缘锯齿细密,10齿宽10~15毫米;伞形花序长;花柱2,离生;果成熟时红色具黑色斑点;种子卵球形,小,宽2~3毫米;植物化学成分人参醇含量低;分布于海拔较高的林下,2500~3000米。

选取13个性状,性状编码如下:

(1) 根状茎节距,数值性状。取根状茎两相邻节间的长度(毫米)。

(2) 根状茎节距标准差,数值性状。根状茎节距多次度量数据,取数据的标准差。

(3) 具有圆锥状肉质根,有序多态性状。肉质根很小或不明显,0;肉质根明显纺锤形或圆柱形,1;肉质根明显,圆锥形,2。

(4) 株高,数值性状。地上部分主茎长度(厘米)。

(5) 中央小叶长,数值性状。中央小叶长(厘米)。

(6) 中央小叶长:宽,数值性状。中央小叶长与宽的比值。

(7) 叶缘10齿宽,数值性状。中央小叶叶中部10个锯齿的宽(毫米)。

(8) 柱头数,数值性状。花柱数量多个观测数的平均值。

(9) 花柱合生,二元性状。离生,0;合生,1。

(10 ) 成熟果具黑点,二元性状。不具黑点,0;具黑色斑点,1。

(11 ) 种子宽,数值性状。种子沿果实对称轴垂直方向的宽度(毫米)。

(12 ) 分布海拔、数值性状。分布地区海拔高度记录的平均值(米)。

(13) 人参醇含量,有序多态性状。植物化学成分水解后人参二醇与人参三醇数量的多少,无,0;+,1;++,2;+++,3;++++,4。

上述7个分类单位,13个性状,将观察记录的数据整理后列于表3-3。

上述人参属的数据不大,作为演算的实际例子比较合适。它与桔梗科6个种的实际例子所不同之处,在于人参属类群较小,选择的7个种已经把人参属绝大多数种类包括在内,取用的13个性状,把反映该属主要形态学的依据也纳入。因此对该数据的演算具有较大的真实性。

第三节相似性概念的数量化

亲缘关系(genetic relationship)是生物学中一个十分重要的概念,生物数学中的生物分类须要引进比亲缘关系更广泛的概念,即相似性的概念。

在阐述分类的基本概念时,已经指出分类工作的目标是在被分类群集合上建立起一种分类关系,即满足等价性三个条件的一种关系。生物分类希望建立的分类关系能反映分类单位之间的亲缘关系。以分析事物为目的的分类,要求所建立的分类关系能体现事物之间的本质联系。在表征生物分类观点下,两者的要求可以统一于相似性的概

念之中。如果从生物亲缘关系考虑,关系接近的生物个体,它们的性状表现倾向于比较相同,反之,性状表现较大的差异。在分析事物时,一个呈现多种特性的事物,如果事物之间表现的差异较小,说明两个事物间的联系密切,否则联系疏远。因而我们可以建立一般的相似性概念,即表现性状差异所决定的,分类单位之间的相似性关系,称为相似性(similarity)。两个分类单位,性状表现比较一致,相似性就大;反之相似性就小。 相似性的概念比亲缘关系具有更广泛更抽象的意义,可以用于比较二个生物个体,也能用于比较不同的生物类群,在生物学中有相似性的概念,非生物学中也能应用这个概念。

相似性程度用数值来表示,该数值称为相似性系数(similarity coefficient)。相似性系数的出现是生物分类朝定量方向发展的重要标志。对它的计算,至今一直是分类运算过程中一个十分重要的步骤,相似性系数有以下几个主要类型,即距离系数、相关系数、联合系数、信息系数和模糊系数,前三个系数将在本章中论述,其他系数将连同其相应的分类方法,另辟专门章节进行讨论。

按照数值的大小与其反映的相似性程度是否一致,可以将相似性系数分为两大类,即相异系数和相亲系数: 相异系数(dissimilarity coefficient) 系数值愈小,表示的相似性程度愈高;反之, 值愈大,愈不相似。距离系数是最常见的相异系数。

相亲系数(similarity coefficient) 系数值愈大,表示相似性程度愈高;反之,值愈小,愈不相似。这里,相亲系数与相似性系数英文原词相同,出现两个概念名称上的混乱。为了使中译名不再混淆,采用了“相亲系数”这个名词,以此与相似性系数区别。相关系数是最常用的相亲系数。

3.1 距 离 系 数

在数量分类学中,距离系数有较早的历史,早在1934年Anderson 就已经用距离系数做桦木科的定量分类研究。现在的许多研究说明,距离系数对于分类运算有较好的稳定性,在距离系数基础之上建立起来的分类运算,方法很多,比较完整,另外距离系数也比较直观,所以直到今天还被定量分析普遍采用,是相似性系数中比较重要的一种。

让我们从最简单的情形开始讨论,如果在三个性状之下讨论二个分类单位之间的关系,性状状态数据表示如下:

性 状

1 2 3 分类单位A x 1 x 2 x 3 分类单位B

y 1

y 2

y 3

其中x 1, x 2, x 3, y 1, y 2和y 3分别是两个分类单位性状状态的数值。

图3-2 距离系数的空间表示

如果以三个性状当作坐标轴,状态数值分别为相应的坐标,可以将两个分类单位分别以三维欧氏空间中的两个点A ,B 来表示(见图3-2)。怎样用数值来描绘它们之间的相似性关系呢?一个最简单,也是最直观的方法就是连A 与B 二点间的直线,量出它们之间的距离d AB ,以值d AB 表示OTU A 与OTU B 之间的相似性,值d AB 小,A 和B 两点相近,说明两个分类单位有较大的相似性。相反,若d AB 值大,A 和B 两点相距较远,说明两个OTU 的相似性疏远。用几何学的距离当作相似性系数,来描述相似性关系是很合适的。 距离d AB 的值可以通过三个性状分量差的平方和进行计算:

将前面的结果推广到n 个性状,得到n 维坐标下的距离系数(distance coefficient)。

2

1

12)(

n

i i i AB y x d

(3.12)

这个系数也被称为欧氏距离系数(Euclidean distance coefficient)。

如此确立的距离系数具有以下三个性质,这三个性质具有普遍意义,也称为距离系数的基本性质: (1) d AB ≥0,当且仅当A = B 时,等式成立。 (2) d AB = d BA 。

(3) d AB ≤d AC + d CB ,这里C 是A 和B 之外的另一个任意的分类单位。

这三条基本性质都不难理解。最后一条性质是几何学中的三角形不等式,有时候被改换成其他的形式,如: (3 ) d AB ≤max {d AC , d CB }

这条性质比原来的三角不等式要求更强,因为

max {d AC , d BC }≤d AC + d BC

距离系数很多,不管如何定义,通常都应当满足这三条基本性质。它的前两条性质保证了共分类群等价条件的自反性和对称性成立。但是三角不等式不能保证传递性的成立。而性质('3)却能做到这一点。这是因为如果把距离系数作为共分类群关系的判别系数,亦即对于任意d o >0如果有

d AB ≤d o OTU A φOTU B

由此我们可以从性质('3)导出等价性的传递条件成立。但是绝大多数的距离系数不能满足如此苛刻的要求。这是距离系数作为相似性系数的重大缺陷。

如果我们需要比较分类单位i 和j 而建立距离系数,从已标准化原始数值矩阵(3.11)取出分类单位向量 常见的距离系数计算公式摘引如下:

平均欧氏距离系数(mean Euclidean distance coefficient):

2

1

12)(1

n

k jk ik ij x x n d

(3.13)

平均绝对距离系数(mean absolute distance coefficient):

n

k k j ik ij x x n d 1||1

(3.14)

Minkowski 距离系数:

r

n

k r k j ik ij x x n d 1

1||1

(3.15)

其中常数r >0。这个系数常常被化学分类学使用,借以比较两个薄层层析的差异。因为当r 充分小时Minkowski 系数对较小的差异十分敏感,故适用于差异十分微小的OTU 之间建立相似性比较。

前面两个距离系数(3.13)和(3.14)可以归于Minkowski 距离系数的特殊情况。当r = 1时即平均绝对距离系数(3.14),当r = 2时,即平均欧氏距离系数(3.13),当r →∞时,可以引出Chebyshev 距离系数:

|}

{|1max k j ik ij x x n k d (3.16)

欧氏距离系数的又一种扩展形式是: Mahalanobis 距离系数

n l k l j il k j ik kl ij x x x x m d 1,))((

(3.17)

其中m kl (k , l = 1, 2, …, n )是参数。这个表达式写成向量与矩阵的乘积形式比较方便,若向量

该向量的转置

(X i -X j ) T = [x i 1 - x j 1 x i 2 - x j 2 … x in - x jn ]

公式(3.17)可改写成

)()'(j i j i ij X X M X X d (3.18) 其中常数矩阵M = [m kl ]n ×n 。当矩阵M 是单位矩阵时,即

M = E

在此E 表示单位矩阵,这时,Mahalanobis 距离系数又回到欧氏距离系数(3.12)的平方。虽然Mahalanobis 系数比欧氏距离系数更完全,但是该公式要确定n 2个参数,使用很不方便,下面再介绍几个其他形式的距离系数。 Canberra 距离系数:

n k k j ik k j ik ij x x x x d 1|| (3.19)

在此要求x ij ≥0(对一切可能取到的值)。不然的话,应将公式稍加改变: n k k j ik k j ik ij x x x x d 1||||||

(3.20)

与Canberra 系数相类似的另一个系数如下:

分离系数

2

112

1

n k k j ik k

j ik ij x x x

x n d (3.21)

最后,如果分类单位取样不止一个,相似性距离系数可按下面系数(coefficient of racial likeness)计算。 距离系数:

n m s m s x x n d n k j jk i ik

k j ik ij 2)(12

1122

2

(3.22) 其中ik x 和k j x 分别表示性状k 对于第i 个分类单位和第j 个分类单位取样的平均值;s ik 和s jk 是其相应的标准差;

m i 和m j 分别表示分类单位i 和分类单位j 的取样个数。

最后要说明两点,其一是公式(3.12)~(3.18)要求数据已进行标准化处理;公式(3.19)~(3.21)可直接就原始数据进行计算。其二是公式(3.12)、(3.18)、(3.19)和(3.20)的系数与性状的多少有关。为了排除这个影响也可以取相应的平

均系数,这时只需紧接在求和符号 之前添加一个分数“n

1

”。

3.2 相关系数与角余弦系数

前一节的距离系数属于相异系数。在本节介绍两种相亲系数,即相关系数和角余弦系数。这两种系数都来自统计数学,学过数理统计的读者不会感到陌生。特别是相关系数,在统计数学中这是一个重要的统计量,被普遍使用于表示两组数据的相关性。Sokal 和Michener(1958)将相关系数引进到数量分类学,在数量分类学中,该系数继续扮演一个颇为重要的角色。至于角余弦系数往往被相关系数代替,末能普遍采用。它计算简单,其实也值得推荐使用。

如果数据来自已标准化的原始数据(3.11),两个分类单位i 与j 之间的相关系数(correlation coefficient)定义如下:

2

1121

21

)()()

)((

n

k j

k j n k i ik n

k j k j i ik

ij x x x x x x x x

r (3.23)

其中 n k n

k k j j ik i x n x x n x 11

1,1。

角余弦系数(coefficient of cosine of included angle)定义于下:

2

1

1

2121

n k k j n k ik n

k k

j ik

ij x x x x

a (3.24)

因为两个系数都属于相亲系数,与距离系数的相异性有着相反的意义。系数值越大,相似性程度越大;反之,值

越小,相似性程度越小。两个系数都具有以下两条基本性质,表述这两条性质时让相关系数r ij 也代表角余弦系数a ij 。

(1) -1≤r ij ≤1,当且仅当x ik = ck jk (c 为非零常数,k = 1, 2, …, n )时,r ij = 1(c >0)或r ij = -1(c <0)。 (2) ji ij r r 。

这两条性质保证了共分类群等价性的自反性和对称性要求,但是传递性也与距离系数一样未能被满足要求。

相关系数当r ij = 1时,达到完全正相关,这时两个分类单位数据成比例,仅差一个正比例常数因子;当r ij = 0时,两分类单位数据不相关;当r ij = -1时,完全负相关,两分类单位数据成比例,仅差一个负比例常数因子。

角余弦系数具有明显的几何意义,把两个分类单位向量X i 和X j 之间的夹角记作θa ,根据向量乘积与向量夹角的关系有

j

i T j

i a X X X X

cos (3.25)

桔梗科试验数据的平均欧氏距离系数、相关系数、角余弦系数和绝对距离系数分别置于下面表(3-4)、(3-5)、(3-6)和(3-7)中,供读者参考。

3.3 联 合 系 数

联合系数在生物学的研究中已经起到很重要的作用,特别在生物分类学、生态学、 生物地理学和微生物学中。在生物学的定量分析研究中,联合系数常常用来表示分类群实体的相亲性和相似性。英国微生物学家Sneath(1957)首次把联合系数引进数量分类学, 他曾提出,在对比两种细菌时,把负匹配从联合系数中排除出去。Sokal 与他合著的《数量分类学原理》(1963)一书,对联合系数曾进行过总结。此外,Clifford 和Stephenson (1975)也曾做过总结性的讨论,这本著作偏重于生态学和生物地理学的应用。有关联合系数的论述很多,随着定量分析的发展,生物学家与数学家设计了多种多样适用于不同需要的联合系数,有关联合系数的理论和应用正在发展中。

在各种相似性度量中联合系数难于确切定义。在此我们摘引Sokal 和Sneath 给出的定义:联合系数(association coefficient)是在整个二元性状或多态性状数据上,一对OTU 之间一致性度量的配对函数。在大多数情形,联合系数以二元数据出现,因此,本书把重点放在二元性状的联合系数。

当原始数据是二元数据时,由于数据结构的特殊性,它不必经过标准化处理,直接就原始数据进行相似性系数的计算。假设两个分类单位OTU i 和OTU j ,待比较其相似性,从原始数据矩阵中提取相应的第i 个和第j 个分类单位向量,

OTU i :Y i [y i 1 y i 2 y i 3 … y in ] OTU j :Y j [y j 1 y j 2 y j 3 … y jn ]

其中的分量y ik 和y jk (k = 1, 2, …, n )取值0或1。当对比OTU i 和OTU j 的相似性时,两组数据的匹配有四种情形。即OTU i 和OTU j 分别为1-1,1-0,0-1,0-0。

计数这四种情形,将计数结果汇总于一个规定的2×2列联表如下:

n = a + b + c + d

其中a , b , c 和d 称为OTU i 和OTU j 的匹配数值。a 是两个OTU 都取1的性状个数计数值;d 是两个OTU 都取0的性状个数计数值;b 和c 分别是其中一个OTU 取1,另一个OTU 取0的性状个数计数值。列联表中的4种情形把性状可能取到的各种匹配情形都已包括在内,因此4种情形的计数值之和应该等于性状的总个数n ,即n = a + b + c + d 。

两个OTU 两个OTU 两个OTU 两个OTU 一个最简单的考虑就是计算匹配一致的性状个数(a + d )占总性状个数n 的百分比值。因而有简单联合系数

当然对问题的考虑,并不都如此简单,不同的生物学问题需要设计各种不同的联合系数。联合系数的种类很多,常见的联合系数汇集于表3-8中。

此外,还有两种系数分别是如下两个方程的解:

1)()( c

b a b a

c b a c a s

s

(Preston, 1962) s c b a s c a s b a e e e )()()(1 (Mountford, 1962)

它们是超越方程,不具一般的解。由于在具体实践中计算和使用不便,这些系数未被收列于表3-8中。可是,Mountford 系数具有近似表达式2a /(ab + ac + bc ),它已被包括在表3-8中。

为了便于讨论,将表3-8中最左边的编号当作相应联合系数的编号。例如S (3)是Jaccard 系数S J ,S (6)是简单匹配

系数。我们已尽可能把讫今为止的各种二元数据的联合系数收集在表3-8中。其中许多是已为人们熟知的系数。除简单匹配系数S (6)以外,还有Russell 和Rao 系数S (1),Jaccard 系数S (3),Czekanowski 系数S (4)和普通的相关系数S (15)。

续表3-8

*A 在实际工作中,如何从众多的联合系数中挑选合适的公式呢?让我们对表3-8中的联合系数进行比较分析。分析方法采取分类分析,利用桔梗科6个种的二元数据,对每一个联合系数公式,计算全部种之间的系数值(共有1526 C 个数值),把23个联合系数当作OTU ,种间的15个系数值当作性状,作分类运算,得树谱图(图3-3)。

图3-3 联合系数的分类树谱图

对树谱图粗略地一瞥,就看到两个系数S (22)和S (23)结合为一,并与其他系数明显不同。呈特殊表现的原因是因为它们属于相异系数,而其他联合系数都是相亲系数。这两个系数值愈大,OTU 之间的相似性愈小,它与大多数联合系数的相亲性截然相反。 再看树谱图,除S (22)和S(23)之外,其他系数按取值范围又分为三个组。三个取值

范围分别是[0, 1],[0, ∞)和[-1, 1],联合系数的这三个组分别被称为相亲有限联合系数,相亲无限联合系数和相亲相关联合系数。

进一步研究发现对称性是联合系数的另一个重要方面。所谓对称性,在此是指当交换表达式中的两个字母,例如a和d,系数表达式的值不变,于是称该系数关于a和d对称;否则称关于a和d不对称。表3-8中除最后一个S(24)外所有的联合系数都关于b和c对称。不难理解,在生物学相似性意义下,这个对称性是必需的。因为相似性的关系,要满足共分类群等价关系的对称性条件。

然而,联合系数关于匹配数a和d的对称性却完全不同。审视表3-8中的联合系数,S(1)~S(4),S(9),S(10),S(12),S(16),S(20)~S(22)和S(24)所有这些系数是非对称的,其他都是对称的。在树谱图(图3-8)中,尽管非对称系数分散在不同类型中,在相亲有限联合系数中,大多数非对称系数仍聚集在一起。它表明,联合系数关于a和d的非对称性具有内在的、数量上的联系。匹配值a表示双方OTU都取肯定(值1)的性状个数,称之为正匹配数;类似地d称为负匹配数。在生物学问题中,正匹配数可能与负匹配数具有不同的意义,因而在联合系数的表达式中应占有不同的地位。非对称系数的出现正适合了这种情形的需要。这种情形在生物学领域屡见不鲜,特别在生态学、生物地理学、分类学和微生物学中。

在生物地理学和生态学中,调查记录的原始数据矩阵常常表现为这种形式,OTU是地点,性状是种。当两个地点进行比较时,某些所谓指示种和特征种起重要的作用。假若两个地点具有相同的指示种或特征种,则可以论断,它们属于相同的类型或类别。如果都不具有这样的种,是否属于相同类型尚不能做出论断。例如龙脑香料(Dipterocarpaceae)的一些种被一些生物地理学家在植被调查研究中当作热带雨林的特征种,只要某些调查地区一旦具有这个种,就可以认定它们是相同的植被类型——热带雨林。相反,如果不具有该种,尚不能获得如此结论。这种情形,正匹配比负匹配更重要,因而对称联合系数不合适,应该取适当的关于a和d不对称的系数,才能正确地表达正、负匹配不一致的情形。这正是生物地理学的定量分析中,为什么联合系数常常采取某种非对称形式的缘故。

与此相类似的情形,也可能在生物分类学、生物系统学的研究中出现,当数量分类使用二元数据时,某些性状的两个对立状态是相互不等价的,在分类意义上一个可能比另一个更重要,也许某一个具有较大的鉴别意义。例如常常被生物分类学家强调的鉴别性状,化学分类学中的特征化学成分,微生物学中基于鉴别培养基的某些性状等。现在就二元数据的某些计算机技术进行讨论。考虑到计算机资源的节省和工作效率的提高,二元数据可以分组,每组由三个连续的二元数字组成,如此一组二进位数转换成从0到7的普通十进位数,表示如下:

将转换后的十进位数(0~7)代替二元数据,输入操作将减少劳动力,存贮空间的节省更为可观。例如,两组32位的二元数据处理如下:

二元数据依次分成3个数字一组:

转换成十进位数(0~7)

(数据结尾如果不足一组时,以0补充直到凑足3个一组)

转换后的十进位数,每连续四个组成一个整型数,在计算机中仅占据整型变量6个单元。

为了计算联合系数,需要计数a,b,c和d。按照匹配数的定义,似乎前面得到的十进数又要再转换成原来的二元数据。这是不必要的,事实上,可以建立十进位数的配对,把所有十进位配对的a、b、c和d值事先准备好(表3-9),数a,b,c分别存于三个二维数组A(i, j),B(i, j)和C(i, j)中。然后将所有十进位配对的a,b和c值累计求和得整个数据的匹配数a,b和c,再从n减去a,b和c可得d。

例如就前面已经转换成十进位数的数据,计算匹配数值如下: 最后将a , b , c 和d 代入表3-8中的各种公式,可计算联合系数。 联合系数具有6种类型。下面给出这6种类型之间的变换公式。

现在我们将利用表3-10所建立的相似性系数变换讨论联合系数的普遍公式。表3-8中所列举的联合系数,按照取值范围可归属于6种类型,取值为[0,1]的系数最为普遍, 属于相亲有限类型。联合系数属于相亲有限类型的定为基本类型。基于二元数据的联合系数,除去个别以外,绝大多数都可以借表3-10的相似性系数变换转变成基本类型;反过来从基本类型也可以转换成其他任何一种类型。因此要解决联合系数的统一计算,只要基本类型的计算得到解决,其他任何类型的计算也就被解决。

作者(1989)设计了联合系数的两个普遍公式,把表3-8中所有取值为[0,1]的相亲有限类型联合系数都归于该公式。两个普遍公式如下:

)(]

2/)([2313312112211

221h h ac ab h c b bc l c b d a h d a h d a h d a h S l l l l l l l l (3.26)

)1(3211

2

2

1

c b l

d l a l d l a I I h I I h I I h S

(3.27)

(h 1 + h 2 = 1且h 3 = 0,除去当公式S (14)和S (15)时h 3 - 0.5)

其中

这两个普遍式中有六个参数,参数h 1, h 2和h 3≥0(除系数S (14)和S (15),h 3 = -0.5以外),l 1, l 2和l 3为非负整数,l 3取值非0即1。每给一组适当的参数就决定 了一个联合系数。表3-8中列出了所有系数(S (24)除外)的参数值。 参数l 1和l 2通常取整数0或1,这时公式中的指数项可以被非指数项取代,例如1l

a 2l

d 可以被[al 1 + (1 - l 1 )][dl 2 + (1 - l 2)]代替。公式(3.27)中参数h 1和h 2可视为权系数,当l 1≠l 2且h 1≠h 2(h 1 + h 2 = 1)时公式属于非对称(关于a 与d )形式。公式(3.26)中参数l 3除S (8),S (9),S (18)和S (21)取值1以外均取0值;参数h 1, h 2和h 3也可当作权系数,若h 1=h 2且h 1 = h 3公式(3.26)对称,否则(且l 1≠l 2)非对称;当参数l 1 = l 2时公式(3.26)也取对称形式。

表3-8中系数S (1)~S (14)取值范围[0,1],已经被定为基本类型,称之为基本联合系数(fundamental association coefficients)。称之为基本的含意之一在于这些系数可以由前述两个普遍式(3.26)和(3.27)直接计算出来。S (1)- S (9)由第一个普遍式(3.26)给出; S (10)-S (14)由第二个普遍式(3.27)给出。其他系数可以由这两个普遍公式间接算得,把间接算得的联合系数称为扩展联合系数(extended association coefficients)。对它的计算先代入普遍公式,得到相

应的基本联合系数,然后再根据原数据所要求的类型,作表3-10中的变换,得到所需要的联合系数。表3-8中S (15)~S (23)都属于扩展联合系数,S (15)和S (16)由普遍式(3.27)计算,S (17)~S (23)归普遍式(3.26)计算。它们所属的类型在表3-8中已经给出。

例如Jaccard 系数S (3),从表中参数值知h 1 = 1, h 2 = h 3 = 0, l 1 = 1并且l 2 = l 3 = 0,代入普遍公式(3.26)得本系数值。Kulczynski 系数S (10),参数值取h 1 = 1, h 2 = h 3 = 0,l 1 = 2, l 2 = 0, l 3 = 1代入普遍公式(3.27)计算可得。以上都属于基本联合系数。

再举扩展联合系数的例子,表3-8中的系数S (17),S (19)和S (23)属于扩展联合系数。这些系数的6个参数都与S (6)完全相同,对它们的计算先从计算S (6)开始。将参数h 1 = h 2 = h 3 = 1,l 1 = 1, l 2 = l 3 = 0,代入公式(3.26)算得基本联合系数S (6)。S (6)属于相亲有限,类型1。S (17),S (19)和S (23)分别为类型3、类型2和类型4,要获得这些系数分

别再做表3-10中的变换F 13(S )= 2S -1,S

S

S F 1)(12和F 14(S )= 1-S (注意,这里M = 1)。这三个系数中的S (23)就

是联合系数中的欧氏距离系数。再看一个重要的系数,相关系数S φ=S (15),该系数是基本联合系数S (14)的扩展类型。对它的计算是先将h 1 = 0.5, h 2 = 0, h 3 = -0.5, l 1 = l 2 = 1, l 3 = 0代入普遍公式(3.27),先得S (14);然后再做F 13(S )= 2S -1的转换可得S φ。

联合系数的普遍公式与相似性系数的转换公式相结合,不仅把当前已经被使用过的联合系数的计算包括在内,而且还可以开拓出更多的新系数。当前联合系数的使用有片面性,对于非对称系数仅考虑对匹配数a 的加强,而忽视了对匹配数d 的加强。联合系数中相亲类型多,相异类型少。新系数的开拓有助于克服使用上的片面性。如果把普遍公式的6个参数排成一组数[h 1h 2h 3l 1l 2l 3]按照参数的要求每给出一组参数都对应于一个基本联合系数,以及它的5个扩展联合系数。例如我们信手给出一组值[2 2 0 0 1 0],这一组参数值对于公式(3.26)相应的基本联合系数是

它的扩展类型只须将该系数代入表3-10中的转换公式F l i (S )(i = 2, 3, …, 6),便可得到。这些系数尚未见应用报道。它的基本类型是非对称的,公式的数学结构分母中2d 项出现,削弱了匹配数d 的作用,从而加强了a 的作用。因此该公式对生物地理和具有特征性状的分类研究可能有使用前景。

6个参数[h 1 h 2 h 3 l 1 l 2 l 3]得到的组合数量是惊人的,从中开发出具有使用价值的联合系数,数量之大是相当可观的,表3-8中列出的基本联合系数仅仅14个。足见联合系数的应用研究中,未开垦的处女地还十分广阔。相似性系数的转换和普遍公式的相结合将为联合系数的进一步开拓应用提供方便。

相似性系数的转换和联合系数普遍公式为计算联合系数编写电脑程序带来的益处,是十分明显的,下面画出这两者相结合的联合系数计算程序流程图(图3-4)。

图3-4 联合系数计算程序流程图

第四节 表征分类的分类运算

表征分类从原始资料的收集和整理开始,形成了原始数据,又经过许多运算过程, 得出了我们所需要的相似性系数矩阵。做好这些准备以后,就要开始着手分类运算。分类运算是整个表征分类的核心内容,它决定了分类结果的好坏,因此,生物学家十分关心。分类运算是数量分类最困难的工作,各种数学工具应用于分类运算产生了许多分类方法,它也是数学家热心致力于研究的课题之一。 简单的系统分类

距离系数的系统分类,其运算过程大致如下。先将每一个分类单位看做是一个类群,运算最初,类群与类群之间的距离系数,也就是分类单位之间的距离系数;分类单位的距离系数矩阵,也就是类群的距离系数矩阵。考虑将相似性最接近的类群先结合, 因而从类群的距离系数矩阵中找到距离最小的一对类群,将这两个类群合并,获得一个新的类群。然后根据一定的法则,计算新类群与其他所有类群之间的距离系数,以这个新的类群代替被合并的一对类群,得到类群之间的新的距离系数矩阵,这样就完成了一次循环运算。接着进行下一次循环运算,上次运算得到的矩阵中再找距离最近的两个类群,将这一对类群合并,再计算系数,得到新的系数矩阵……。一再重复执行这样的循环运算过程,运算过程与前面完全相同。每循环一次,有一个类群被归并,获得的系数矩阵其阶数减少一阶。直到所有的分类单位都归属于一个类群为止,整个分类运算结束。

让我们取Anderson 等(1934)对桦木科(Betulaceae)植物的研究数据进行演算,以此当作一例来具体说明分类运算方法。分类单位是桦木科中的6个属,下面是属之间的距离系数:

最初将每一个分类单位看作是一个类群,记作G i = {i }(i = 1, 2, …, 6)。在此,括号中的数码是分类单位的编码,以此码代表该分类单位。

第一次循环 从分类单位的距离系数矩阵

M (1)中寻找最小值,即d 12 = 1.6。将类群

G 1与类群G 2合并。得一新类群记作G 7

G 7 = {1, 2} 计算新类群与其他类群的距离。距离的计算按最小距离方法。 M (2)。 第二次循环 从系数矩阵M (2)中寻找最小

值,即d 37

= 2.1。将类群G 3与类群G 7合并,

得新的类群,记作

G 8 = {7, 3} = {1, 2, 3}

计算新类群与其他类群的距离系数。

从系数矩阵M (3)中寻找最小 d 48 = 2.4,将类群G 4和G 8合并,得新 G 9

G 9 = {8, 4} = {1, 2, 3, 4}

G 9与其他类群的系数

从系数矩阵M (4)中寻找最小 值,d 56 = 3.5,将类群G 5与G 6合并,得新类 群G 10

G 10 = {5, 6}

计算类群G 10与G 9的系数

第五次循环 系数矩阵已降低到二阶,只有 二个类群G 9和G 10,将此二个类群合并得G 11

G 11 = {9, 1} = {1, 2, 3, 4, 5, 6}

分类运算结束。

值的最小者。

最后,将分类运算结果画出树谱图(dendrogram),见图3-5。树谱图显示出桦木科内六个属的分类系统关系。 此例给出分类运算最简单的一种方法,帮助我们了解聚类运算的基本过程。从这个最简单的例子出发,随后还要对各种距离系数的分类方法进行深入讨论。

让我们回过头来再看看全部演算过程,所有这些运算步骤中最关键性的一步是合并的类群确立以后,如何计算新的距离系数。这些系数将决定整个分类运算的过程,类群之间,哪一个先被合并,怎样合并,都要取决于这些系

数值;分类最后的结果是好或者是坏,也取决于我们对新距离的定义是否合理。在距离系数基础上的分类方法虽然名目繁多,但是运算的基本过程都相同。究其根本,区别全在新距离的定义不同,不同的距离定义,就得到不同的分类方法。许多从事数量分类研究的学者都对这个关键性的问题做了大量工作。运算过程中计算新类群距离的方法逐渐改进,分类的方法日趋完善。

在此讨论距离系数的各种分类方法,实际上都归结到运算过程中如何确定新类群的距离系数。现在让我们开始讨论。

图3-5 桦木科树谱图(最短距离法,单链法)

假如在某一分类运算的循环过程中,被合并的类群是G p 和G q ,归并以后新的类群是G r 。G i 是任意一个已知的类群,G r 和G i 的距离系数可以定义如下:

},min{qi pi ri d d d (3.28) 这就是前述例子中所采用的距离计算方法。因为取距离的最小值,这个分类方法就被称为最短距离法(the shortest

distance method)。

与最短距离法相对应的是最长距离法(the longest distance method),它的距离定义是取最大值,

},max{qi pi ri d d d (3.29) 前面桦木科的运算数据,用最长距离法进行运算得到的树谱图见图3-6。运算过程与最短距离法完全相同,只是

在计算距离时将最小值改换成最大值。由于距离取最大值,二个距离的最大系数符合聚合的条件时,最大值符合要求,两类群之间所有分类单位的距离都小于这个最大值,当然也都符合相聚的条件,所以最长距离法也可称为全链法(complete linkage method);最短距离法也称为单链法(single linkage method)。

图3-6 桦木科树谱(最长距离法,全链法)

图3-7

平均链的系统分类

前面介绍了两种分类运算方法。无论是最长距离法还是最短距离法,新距离的定义取了两个极端,显然是非常粗糙的、不太合理的。改进的第一个方法是中线法。

图3-7中,线段IP 和IQ 分别表示类群G i 与类群G p 和G q 之间的距离。类群G p 和G q 合并成G r 以后,类群G i 与G r 的距离按最短、最长距离法的定义就是从线段IP 和IQ 中选取最短者或最长者,如果采取三角形IPQ 的中线IM 来表示G i 与G r 之间的距离,自然要比IP 和IQ 要合理。因为取用的是三角形中线,分类方法的名称由此而来。现在将计算IM 长度的表达式写出来,几何学中三角形中线的计算公式有 2

122241)(21

pq iq ip ir d d d IM d

(3.30)

前面的数据用中线法进行计算得到的树谱图见图3-8。

M

图3-10 桦木科树谱图(重心法) 图3-8 桦木科树谱图(中线法) 图3-9

中线法的距离IM ,M 点取在P 与Q 的中点,对两个类群G p 和G q 看来似乎不偏不倚。可是当二个类群所包含的分类单位数目不等时,简单地把M 取作P 与Q 的中点,实际上仍然不合理,如果把分类单位形象地比作力学中的质点,M 点应落在P 和Q 两个类群构成的质点组的重心上。也就是说,M 点应根据两类群的大小按比例地划分线段PQ (见图3-9)。

令n p , n q 和n r 分别表示类群G p , G q 和G r 所包含

的分类单位个数;又令x 1 = PM , x 2=QM 。

MQI MPI ,。 M 点应满足:

x 1n p = x 2n q x 1 + x 2 = d pq

解得

又根据几何关系有 等式两边分别各乘以

r

p n n 和

r

q n n ,并将x 1和x 2

的值分别代入

将两式相加,并注意到n r = n p + n q 可得

再引用关系d pq = d ip cos α+ d iq cos β,得最后结果 即

22222pq r

q p iq r q ip r p ir d n n n d n n d n n d

(3.31)

因为M 点取在重心,我们把这个距离公式所确立的分类方法称之为重心法(centroid method)。

以重心法计算前面桦木科的数据,得到结果如图3-10。重心法虽然做了许多周密的考虑,但是它仍然不能说是十分完善的。两个类群的距离应该体现类群之间整体意义上的联系。而中线法和重心法都是以一个点代表类群,建立起类群之间的联系。实际上类群之间的联系,体现在两类群间所有分类单位之间的联系,一个单一的点是不可能将许多复杂的联系都包含在内的。为了克服这方面的缺陷,以至有人建议用所有联系两类群之间分类单位距离的平方和,再取平均值,来表示两个类群的距离平方,即类群间平均平方距离,表示式如下:

p

q

G i G

i ij q p pq d n n d 2

21 (3.32)

其中n p 和n q 分别表示G p 和G q 中分类单位个数。联系两类群间分类单位距离系数值共有n p ·n q 个。

现在让我们看看在分类运算中,当两个类群G p 和G q 合并成G r 以后,按平均平方距离新的递推公式如何导出类群G r 与其他类群的距离系数公式?根据新确认的原则, 距离系数应该是: 注意类群间距离的定义,最后得

222iq r q ip r p ir d n n d n n d (3.33)

由这个距离公式确立的分类方法称为类平均法(group average method),也可以称为非加权配对算术平均法

(unweighted pair-group method using arithmetic average ,简作UPGMA)。一般说来这是一个比较好的方法,常常在定量分类工作中采用。

应用类平均法计算桦木科的分类数据,得到的分类结果见图3-11。

疯狂生物数学+ 乐高

5+疯狂生物数学长颈鹿吉罗德 重点学习内容 发展儿童对高度概念的理解 学会估计,比较和使用公制测量 所需器材 9090城镇超大套装,9660早期结构套装,米尺,长颈鹿玩偶 词汇 高度、比…高、比…小、比较 联系10分钟请孩子们看长颈鹿的图片和长颈鹿玩偶,讨论长颈鹿的特点。 给孩子们讲一个类似于这样的故事:“长颈鹿吉罗德和他的妈妈乔治娜一起生活在动物乐园里。长颈鹿吉罗德年纪很小,总是觉得很饿,又因为他长的不高,想快点长大,所以要吃很多的树叶。可是有些树的树枝长的太高了。吉罗德要长多高才能吃到这些树上的叶子呢?让孩子们试着描述一下大树和长颈鹿的高度,然后说明为了找出长颈鹿和大树的高度,他们需要搭建测量。 建构30分钟请孩子们搭建长颈鹿吉罗德和长满树叶的大树。

反思5分钟问孩子们:长颈鹿吉罗德和大树一样高吗?他怎样才能吃到树叶?有更简单的方法让他吃到树尖上的叶子吗? 吉罗德有多高?用你的米尺量一量吧! 延续10分钟请孩子们搭建吉罗德的哥哥乔治。实际上乔治刚刚被测量过了,乔治比吉罗德高的多。乔治的实际身高是16英寸(或40厘米)。因为乔治是吉罗德的哥哥,所以他们的长相几乎一样。 记录5分钟请孩子们使用米尺测量三只长颈鹿的高度,把结果记录在工作表上,并圈出长的最高的一只长颈鹿。 评估 提问,例如:乔治比吉罗德高多少? 吉罗德的格温姑妈比他高的多。搭建格温姑妈,请家人给你和格温姑妈拍一张数码相片。在下次活动中把照片展示给你的好朋友们吧。

5+疯狂生物数学怪异小爬虫 重点学习内容 发展儿童对长度概念的理解 学会使用非标准单位估计和测量 所需器材 9090城镇大套装,9660早期结构套装,比毛虫长和比毛虫短的物体 词汇 长度、比…长、比…短、相同、测量 联系10分钟请孩子们看不同毛虫的图片。 给孩子们讲一个类似于这样的故事:“修提和施特泽是一对怪异的小爬虫。他们喜欢比赛,例如看谁能到达最高的嫩芽处;看谁能藏在最小的叶子里。今天他们正玩一个新的比赛呢。施特泽能找到比他长一点的东西吗?修提能找到比她短一点的东西吗? 和孩子们讨论:一辆汽车只比施特泽长一点吗?一个火柴盒只比修提短一点吗?孩子们难以猜测吗?为了找出什么东西比毛虫长,什么东西比毛虫短,孩子们需要搭建出来。 搭建30分钟请孩子们搭建毛虫修提和施特泽 请孩子们找出三个比修提和施特泽都短的东西,三个比修提和施特泽都长的东西。

高中生物学中的数学模型

高中生物学中的数学模型 山东省嘉祥县第一中学孙国防 高中生物学中的数学模型是对高中生物知识的高度概括,也是培养学生分析推理能力的重要载体,本文通过归纳高中生物学中的数学模型以提高学生的分析推理能力。 1. 细胞的增殖 【经典模型】 1.1间期表示 1.2 有丝分裂中各时期DNA、染色体和染色单体变化 1.3 减数分裂中各时期DNA、染色体和染色单体变化 【考查考点】细胞增殖考点主要考察有丝分裂、减数分裂过程中DNA、染色体、染色单体的数量变化以及同源染色体的行为,并以此为载体解释遗传的分离定律和自由组合定律。 2. 生物膜系统 【经典模型】

【考查考点】 3物质跨膜运输 【经典模型】 【考查考点】 自由扩散、协助扩散和主动运输的影响因素和特点。 4. 影响酶活性的因素 【经典模型】 【考查考点】 影响酶活性的因素,主要原因在于对酶空间结构的影响。酶促反应是对酶催化的更高层次的分析。 5. 影响细胞呼吸及光合作用的因素 【经典模型1】 【考查考点】 真正光合速率= 净光合速率+呼吸速率 光合作用实际产O2量=实测O2释放量+呼吸作用耗O2 光合作用实际CO2消耗量=实测CO2消耗量+呼吸作用CO2释放 光合作用葡萄糖生产量=光合作用葡萄糖积累量+呼吸作用葡萄糖消耗量

【经典模型2】 【考查考点】氧气浓度对有氧呼吸和无氧呼吸的影响,以及在种子和蔬菜储存中的原因。 6 基因的分离和自由组合定律 【典型例题】男性并指、女性正常的一对夫妇,生了一个先天性聋哑的儿子,这对夫妇以后所生子女,(并指是常染色体显性遗传病,两种病均与性别无关) 正常的概率:_________同时患两种病的概率:_________患病的概率:_________ 只患聋哑的概率:_________只患并指的概率:_________只患一种病的概率:_________ 序号类型计算公式 1 患甲病的概率m 则非甲病概率为1-m 2 患乙病的概率n 则非乙病概率为1-n 3 只患甲病的概率m-mn 4 只患乙病的概率n-mn 5 同患两种病的概率mn 6 只患一种病的概率m+n-2mn或m(1-n)+n(1-m) 7 患病概率m+n-mn或1-不患病概率 8 不患病概率(1-m)(1-n) 7. 中心法则 【经典模型】 DNA分子的多样性:4N DNA的结构:A=T,G=C,A+G=T+C,(A1%+A2%)/2=A%, A1%+T1%=A2%+T2%=A%+T% DNA的复制:某DNA分子复制N次所需要的游离的鸟嘌呤脱氧核苷酸:(2N-1)G 15N标记的DNA分子在14N的原料中复制n次,含15N的DNA分子占总数的比例:2/2n DNA中的碱基数和其控制的蛋白质中的氨基酸数的比例关系:6:1 【考查考点】DNA的结构,碱基组成,半保留复制和基因的表达。 8. 现代生物进化理论 【典型例题】某人群中某常染色体显性遗传病的发病率为19%,一对夫妇中妻子患病,丈夫正常,他们所生的子女患该病的概率是 A.10/19 B.9/ 19 C.1/19 D.1/2 答案:A 【经典模型】 设A的基因频率为P,a的基因频率为q,因P+q=l,故(P+q)2 =I,将此二项式展开得:

数学模型在生物学中的应用

数学模型在生物学中的应用 摘要 数学模型是研究生命发展规律,发现和分析生命现状的工具。建立可靠的本文从生物数学的发展、分支了解生物数学的历史,紧接着又在数学模型在生物数学的地位中了解数学模型的地位,最后在数学模型的应用中知道了微分方程模型、差分方程模型以及稳定性模型.这将有助于在生物数学的研究中,依据数学模型的基础,建立符合规律的数学模型,在生命进程中验证新的规律、新的发现,使在研究生物学时更清晰、更明了. 关键词:数学模型;生物学;应用

Application of mathematical model in Biology Abstract: Mathematical models in biology such as a microscope can be found in biological mysteries, biological research through with the establishment of the mathematical rules of the law of development of life, which launched a new discovery, new rules and in biology established reliable model of the biological status of classified analysis and forecasting. The from the history of mathematical biology development, the branch of the understanding of mathematical biology, followed by another in the mathematical model in Mathematical Biology status in understanding the status of mathematical model. Finally, in the application of mathematical model know differential equation model, the differential equation model and the stability of the model. This will help in mathematical biology research, on the basis of the mathematical model, established in accordance with the law of the mathematical model, in the process of life to verify new rules, new found in biological research clearer, more clear. Keywords: mathematical mode;biology;application

生物数学第一章

第一章 概 论 第一节 学 科 界 说 生物数学(biomathematics)是一门介于生物学与数学之间的边缘学科。这门学科以数学方法研究和解决生物学问题,并对与生物学有关的数学方法进行理论研究。它的分支学科较多,从生物学的应用去划分,有数量分类学、数量遗传学、数量生态学、数量生理学和生物力学等。这些分支是数学与生物学不同领域相结合的产物,在生物学中有明确的研究范围。从研究使用的数学方法划分,生物数学又可分为生物统计学、生物信息论、生物系统论、生物控制论和生物方程等分支。这些分支与前者不同,它们没有明确的生物研究对象,只研究那些涉及生物学应用有关的数学方法和理论。 生物数学按照生物学和数学这两个方面去理解,可以从下面的图示获得形象的表示: 生物学 数 学 这里把生物学的分支领域看作一个集合,数学的不同分支领域视作另一个集合,生物数学就是这两个集合导出的乘积空间。因而生物数学的分支内容十分丰富。 生物数学具有完善的数学理论基础,包括集合论、概率论、统计数学、随机过程、对策论、微积分,微分方程、线性代数、矩阵论和拓扑学,还包括一些近代数学分支,如信息论、图论、控制论、系统论和模糊数学等。由于生命现象复杂,从生物学中提出的数学问题往往十分复杂,需要进行大量的计算工作。因此,计算机是生物数学产生和发展的基础,是研究和解决生物学问题的重要工具。90年代以来,计算机技术的进一步发展,生物学的应用又把数学模型的定量分析与电脑的信息处理技术紧密结合在一起, 计算机在生物数学中日益重要。然而,不论数学内容多么丰富,计算机的地位多么重要, 就整 个学科的内容而论,生物数学需要解决和研究的本质方面是生物学问题,数学和计算机 ×

生物学和人类的关系

生物学和人类的关系 [摘要]生物学是研究生命的科学,它既研究各种生命活动的现象及其本质,又研究生命与环境之间的相互关系。近30多年来,生物学的理论成就给自然科学的发展作出了巨大贡献,并最大限度地造福了人类。生物技术又为人类利用、改造和保护自然,造福人类提供了实践方法。生命科学要为人类造福转化为生产力,必然与技术相结合,才能在生产上发挥巨大作用。然而。事物的两面性又提醒我们,科学对文明的发展既有正面的推动作用,又可能引起不利于人类生存的副作用。那么,我们只有把握生命科学在人类社会中的各方面作用,才能把人类文明推进到更高的阶段。 [关键字]生物学生命科学生物技术人类文明 1引言 20世纪是生物科学发展史上最为辉煌的时代,特别是20世纪50年代以来,随着数理科学的广泛而深刻地渗入到生物科学领域以及一些先进的仪器设备和研究技术的问世,生物科学已进入从分子水平研究生命活动过程及其规律,以及生命体与环境相互作用规律的生命科学的新时代。由于应

用先进技术,生命科学在微观和宏观两方面都取得了丰硕的成果:特别是生命科学的理论成就为自然科学的发展作出了巨大的贡献。遗传物质DNA双螺旋结构的阐明被认为是20 世纪自然科学的重大突破之一。由于生命科学的进步向数学、物理学、化学以及技术科学提出了许多新问题、新概念和新的研究领域,生命科学已成为21世纪的主流科学之一。 进入21世纪,人类面临着人口、食品、健康、环境、 资源等与生命科学有关的重大问题,“人类基因组计划”的 实施和深入发展,将有可能从更深层次上了解人体生长、发育、正常生理活动以及各种疾病的病因和发病机理,并为医学提供防治策略、途径和方法。“水稻基因组计划”的顺利 开展,对21世纪农业的发展,解决粮食问题,将产生巨大 的影响。 由此看出,当今发展科学的目的在于认识世界,而发展技术的目的在于利用、改造和保护自然,造福人类。生命科学要为人类造福转化为生产力,必然与技术相结合,才能在生产上发挥巨大作用。于是在20世纪70年代,随着生命科学理论的不断发展,与工程技术相结合,开辟了生物技术(也叫生物工程)新领域。例如,通过基因重组技术,PCR技术、DNA和蛋白质序列分析技术、分子杂交技术、细胞和组织培养技术、细胞融合技术、核移植技术等等,促进了基因工程、蛋白质工程、细胞工程、发酵工程、酶工程、染色体工程、

数学与生命科学

数学与生命科学 事例DNA是分子生物学的重要研究对象,是遗传信息的携带者,它具有一种特别的立 体结构——双螺旋结构,双螺旋结构在细胞核中呈扭曲、绞拧、打结和圈套等形状,这正好是数学中的纽结理论研究的对象。 X射线计算机层析摄影仪—即CT扫描仪,它的问世是二十世纪医学中的奇迹,其原理是基于不同的物质有不同的X射线衰减系数。如果能够确定人体的衰减系数的分布,就能重建其断层或三维图像。但通过X射线透视时,只能测量到人体的直线上的X射线衰减系数的平均值(是一积分)。当直线变化时,此平均值(依赖于某参数)也随之变化,能否通过此平均值以求出整个衰减系数的分布呢?人们利用数学中的拉东变换解决了此问题,拉东变换已成为CT理论的核心。首创CT理论的A.M.Cormark(美)及第一台CT制作者C.N.Hounsfield (英)因而荣获1979年诺贝尔医学和生理学奖。另一项高技术是H.Hauptman与J.Karle 合作,发明了测定分子结构的新方法,利用它可以直接显示被X射线透射的分子的立体结构。人们应用此方法,并结合利用计算机,已测出包括维生素、激素等数万种分子结构,推动了有机化学、药物学和生物学等的发展,由此可见在此两项技术中数学起了关键的作用(两发明人分享1985年的诺贝尔化学奖)。 综述在发现DNA化学结构和发明计算机模拟后50年的今天,一场由数学和计算科学 驱动的革命正在生物学的领域发生。一系列突破性的研究正在重新定义以下领域:数学生态学、流行病学、遗传学、免疫学、神经生物学和生理学等等。美国国家科学基金会(NSF)主任科勒威尔(R. Colwell)在2000年10月向国会提交的报告中,称数学是当前所有新兴学科和研究领域的基础,要求下一年度对数学的资助要增加3倍以上,达到1.21亿美元。在这些增加的预算中,有很大的一部分被用来支持数学与其他学科的交叉研究,尤其是数学与生物学的交叉研究项目。 尽管数学一直在现代生命科学中扮演着一定的角色,如数量遗传学、生物数学等,但生物学家真正体会到数学的重要性,还是最近十几年来的事情。基因组学是这种趋势的主要催化剂。随着DNA序列测定技术的快速发展,1990年代后期每年测定的DNA碱基序列以惊人的速度增长。以美国的基因数据库(GenBank)为例,1997年拥有的碱基序列数为1×109,次年就翻了一番,到2000年GenBank已拥有近8×109个碱基序列。同样,在蛋白质组研究和转录组研究等快速推进的过程中,各种数据也在迅猛增加。据估计,现在每年产生的生物数据量可以达到1015字节。如何管理这些“海量”数据,以及如何从中提取有用的知识,成为了对当前生物学家、数学家、计算机专家等的巨大挑战。一门新兴学科——生物信息学(bioinformatics),也应运而生。此外,对细胞和神经等复杂系统和网络的研究,导致了数学生物学(mathematical biology)的诞生。NSF为此专门启动了一项“定量的环境与整合生物学”项目,以鼓励生物学家把数学应用到生物学研究中去。几乎在同一时间,美国国立卫生研究院也设立了一项“计算生物学”的重大项目。 数学不仅能帮助人们从已有的生物学实验和数据中抽象出模型和进行解释,它还可以用于设计和建造生物学模型,也许这些生物学模型在自然的状态下是根本不存在的。在这种意义上说,基于数学模型和假设进行的生物学实验,将更接近人们熟知的物理学和化学实验,更多地依赖于抽象和理性,不再是一门经验科学。

高中生物数学模型问题分析

高中生物数学模型问题分析 生命科学是自然科学中的一个重要的分支。在高中生物课程中,它要求学生具备理科的思维方式。因此在教学中,教师应注重理科思维的培养,树立理科意识,渗透数学建模思想。本文在此谈谈,在生物教学中的几个数学建模问题。 1 高中生物教学中的数学建模 数学是一门工具学科,在高中的物理与化学学科中广泛的应用。由于高中生物学科以描述性的语言为主,学生不善于运用数学工具来解决生物学上的一些问题。这些需要教师在平时的课堂教学中给予提炼总结,并进行数学建模。所谓数学建模(Mathematical Modelling),就是把现实世界中的实际问题加以提炼,抽象为数学模型,求出模型的解,验证模型的合理性,并用该数学模型所提供的解答来解释现实问题,我们把数学知识的这一应用过程称为数学建模。在生物学科教学中,构建数学模型,对理科思维培养也起到一定的作用。 2 数学建模思想在生物学中的应用 2.1 数形结合思想的应用 生物图形与数学曲线相结合的试题是比较常见的一种题型。它能考查学生的分析、推理与综合能力。这类试题从数形结合的角度,考查学生用数学图形来表述生物学知识,体现理科思维的逻辑性。 例1:下图1表示某种生物细胞分裂的不同时期与每条染色体DNA含量变化的关系;图2表示处于细胞分裂不同时期的细胞图像。以下说法正确的是() A、图2中甲细胞处于图1中的BC段,图2中丙细胞处于图1中的DE段 B、图1中CD段变化发生在减数Ⅱ后期或有丝分裂后期 C、就图2中的甲分析可知,该细胞含有2个染色体组,秋水仙素能阻止其进一步分裂 D、图2中的三个细胞不可能在同一种组织中出现 解析:这是一道比较典型的数形结合题型:从图2上的染色体形态不难辨别甲为有丝分裂后期、乙为减Ⅱ后期和丙为减Ⅱ中期;而图1中的AB段表示的是间期中的(S期)正在进

生物数学第三章

第三章生物分类的数学模型 本章开始将讨论生物分类,按照生物分类学家的理解就是指表征分类和分支分类,我们仅研究两种分类概念下的数学理论与方法。这里的分类也是多元统计关于聚类分析的延续,但是已远远超出统计数学的范围。表征分类除经典的系统分类以外还包括图论分类、信息分类、模糊分类;分支分类是以抽象代数为基础,研究生物演化规律的分支学科。因此生物数学中的分类数学模型不能再视作多元统计中的聚类分析,而应称为分类分析。本章专门讨论分类分析中的表征分类数学模型。 第一节分类的基本概念和原始数据的获得 何谓分类?有句俗话“物以类聚”,这句话的意思是说,许多事物依据其类别的特征,相似者归为同一种类。从这个意思去理解,分类有两个要素。第一个要素是被分类的对象,分类对象是由许多被分类的实体所组成,3个以上的实体构成一个基本分类对象。被分类的实体,就是被分类的基本单位,在数量分类学中称为运算分类单位(operational taxonomic unit)简写作分类单位(OTU)。全部被分类的分类单位构成的集合称为被分类群。分类的第二个要素是分类的依据,分类依据取决于被类群中分类单位的性状,所谓性状(character)是一个分类单位区分于其他分类单位的性质、特征或属性。一个分类单位对某个性状所呈现的状态,称为该性状的性状状态(character state),简称状态(state)。 分类就是将被分类群中所有的分类单位,依据它们的性状状态,遵从一定的原则作出划分或聚合,得到一组新的分类单位集合。通过分类获得的这个分类单位集合称为分类群(taxon)。 世界上一切事物都存在分类的问题。专门研究生物物种的分类,也就是生物分类学中的分类,有表征与分支两个对立的概念。依据生物表现性状相似性全面比较而建立的系统分类称为表征分类(phenetic classification);遵从生物演化的谱系关系而建立的系统分类称为分支分类(cladistic classification)。这两个概念在生物分类学和数量分类学中都很重要,相应的也有两种不同的数学方法,本章将要研究表征分类。 分类单位隶属于一个分类群产生分类单位与分类单位之间的联系。如果A是被考虑的一个分类群,又有分类单位x∈A,且分类单位y∈A,则认为x与y之间建立起同属于 ·71·

(高考生物)浅谈生物学科与其他学科的联系

(生物科技行业)浅谈生物学科与其他学科的联系

浅谈生物学科与其他学科的联系 龙海市海澄中学连艳虹 摘要:解决生物学的问题,往往要涉及到语文、数学、物理、化学、政治、地理等诸多方面的学科内容。这要求生物老师必须跟得上时代的步伐,不仅要具备有生物科学知识,还要具有其他学科的基础知识,并在平时教学中渗透相关学科的知识,有助于学生系统掌握生物学知识及知识的迁移,以提高教学质量。 关键词:生物学科、其他学科、联系、学生 生物学科本身是一门实验性学科,又是应用性很强的学科。解决生物学的问题,往往要涉及到语文、数学、物理、化学、政治、地理等诸多方面的学科内容。从历史上看,生物学科的发展也离不开这些学科的共同进步。随着培养学生全面综合素质要求的不断提高,随着高中综合科目考试中应用其他学科知识解决生物学问题的趋势将越来越明显,因此,就要求生物老师必须跟得上时代的步伐,不仅要具备有生物科学知识,还要具有其他学科的理论基础知识,并在平时教学中能有所贯穿,加强挖掘与其他学科的联系,解决教材中的重、难点,才能真正达到教学目的。 1注重生物与其他学科的联系以提高生物教学质量 众所周知,生物科学的发展在很大程序上是得益于数、理、化等学科的发展的。数、理、化等学科的研究成果,为生物学的发展提供了先进的理论、研究方法和研究工具。另一方面,从哲学上物质运动的形式看,生命物质的运动是复杂的、高级的物质运动形式,其中必然包含着较简单的、较低级的数学、物理、化学等方面的物质运动形式。因此,在生物学教学过程中,必须加强与数学、物理、化学、地理等相关学科知识的联系,促进知识的迁移,扩展和转化,这样才能使学生对于深奥的知识易于理解,即深入浅出,也能使学生对于较浅显的知识易于理解深刻,抓住本质,即浅入深出。 1.1相关学科知识,有助于学生系统掌握生物学知识

生物数学

生物数学 生物数学是生物与数学之间的边缘学科。它是用数学方法研究和解决生物学问题,并对与生物有关的数学方法进行理论研究的学科。如果把生物学的分支领域看作一个集合,数学的分支领域看作另一个集合,生物数学就是这两个集合导出的乘积空间。因而生物数学的分支内容非常丰富,从研究使用的数学方法划分,生物数学可分为生物统计学、生物信息论、生物系统论、生物控制论和生物方程等分支。此外,由于生命现象极为复杂,从生物学中提出的数学问题往往也十分复杂,需要进行大量计算工作,因此计算机是解决生物数学问题的重要工具。 一、生物数学的发展 生物数学产生和发展的历史,要追溯到16世纪。中国明朝的著名科学家徐光启(1562 - 1633)曾用数学的方法估算过人口的增长,他说:“头三十年为一世”, 即人口大致每30年增加一倍。这是把数学应用于生态问题的最早史例。1662年, J. Graunt研究了伦敦人口的出生和死亡率,通过计算后认为:如果略去移民,伦敦的人口每64年将增加一倍。1789年英国神父在他的著作中提出了人口按几何级数增长的理论等。这些都是早期的生物数学的零碎工作。1900年,意大利著名数学家V olterra在罗马大学的一次题为“应用数学于生物和社会科学的尝试”的演讲, 1901 年英国统计学家Pearson创办了《生物统计杂志》(Biometri2k a) ,标志了生物数学发展的一个里程碑。人们根据生命现象的普遍特点:多次重复、大量出现、随机性等,以生物统计学为基础解决生命现象所面临的问题。这一阶段的工作局限于对生命现象作静止的、定量的简单描述, 研究的数学手段也仅仅是统计学、几何学和一些初等的解析方法。DA.W. Thompson对这一阶段的研究成果作了总结,写出一部巨著《论生长与形式》, 作为生物数学萌芽阶段的代表作。在这本著作中提出了许多古典的生物数学问题, 直到今天仍然引起某些学者的关注,进行讨论和研究。20世纪20年代开始, 数学在生物中的应用不再局限于静止、孤立的描述生命现象, 开始分析生命现象复杂的过程, 并探索其规律性。人们开始使用各种数学工具, 建立起各种各样的数学模型模拟各种生命过程。数学物理方法把许多微分方程模型带进了生物学领域, 生物数学的发展进入第二阶段。美国生态学家Lotka在1921年研究化学反应和意大利数学家Volterra在1923年研究鱼类竞争时分别提出了现在已经成为生物数学研究中的经典模型之一的Lotka - Volterra 系统。同时代的另外代表人物还有: Kostitzyn、Kolmogorov、Rashevsky等。20世纪40年代末电子计算机的发明和普及应用, 使生物数学的发展进入又一个新的时期。由于生命现象的复杂性, 给生物数学带来大量运算, 只有利用电子计算机,一些生物数学问题的求解才成为可能, 因而计算机成为发展生物数学的基础。在此基础上许多生物数学的分支学科, 如数量分类学、生物控制论、生物信息论等在20世纪50年代以后如雨后春笋般相继产生, 并得到了发展。20世纪70年代随着电子计算机的发展和进一步的普及, 以此为后盾的生物数学如虎添翼飞速发展。从古典的初等数学到近代数学, 从抽象数学到应用数学, 生物数学已经把数学学科的绝大部分内容置于自己的基础之中, 具有了完整的数学理论基础。特别是70年代中期, 微分方程及动力系统的新理论和新方法大量的应用于种群生态学、种群遗传学、神经生物学、流行病学、免疫学、生理学以及环境污染等问题的研究中。生物数学在利用数学工具解决问题的同时, 又提出了更为现实的问题。20

三、数学与生物科学

(二)数学与生物科学 在生物方面的动物捕食,我们可以利用数学模型建立捕食和被捕食间的竞争模型,就是数学在生物学方面的应用。 1.生物数学和DNA 生物学家告诉人们说,一个生物的全基因组序列蕴藏着这一生物的起源、进化、发育等所有与遗传性状有关的信息。所有这些重要信息都写在由4种碱基(A、T、G、C)组成的基因组DNA那条长长的双链上。大自然各种生灵的千变万化仅仅是由ATGC四个字母排列的变化导致。可见排列是最基本的,排列中包含着极为丰富的信息。而在排列决定构象、构象决定功能的过程中就有不少数学问题。现在知道构成基因的DNA序列中很大部分是非编码序列,即所谓的“垃圾DNA”,怎么区分编码和非编码序列?这就用到了数学,各种算法计算,通过比较,用已经认识的东西来比较还不认识的东西。在语言学角度看,这些所谓的“垃圾DNA”与人类语言有相似处,即语言的冗余度[4]。要认识这种语言可能涉及到很多数学问题,如数理语言、数理逻辑,甚至密码学。而且已经有人,如陈润生教授等提出用密码学方法来分析DNA。 再如从基因变化预测疾病。我们知道有些基因突变是正常和必需的,有些突变则会致病。研究基因突变需要用到概率论等,从基因突变预测疾病则涉及到概率统计。自然科学每一个主要学科领域的革命性进展都或多或少地从数学那里得到力量,随着数学越来越多地介入生命科学,给生命科学本身的发展带来意想不到的结果。 2.数学方法与医学诊断 X 射线计算机断层扫描仪(简称 CT )被认为是放射医学领域的一次革命性突破。其原理是基于不同的物质有不同的 X 射线衰减系数。如果能够确定人体的衰减系数的分布,就能重建其断层或三维图像。但通过 x 射线透射,只能测量到人体的直线上的 x 射线衰减系数的平均值(是一积

生物与数学

生物与数学 人类在征服大自然的漫长过程中,不断地接触、认识各种生物。发现它们与数学之间联系密切,息息相关,奥妙莫测。正如著名科学家伽利略所说:“自然这本书,是用数学语言写成的。” 马克思说过:“蜜蜂建筑蜂房的本领使人间的许多建筑师感到惭愧。”人们赞美蜜蜂的蜂房结构,认为它是符合数学观点的最省材料的设计。其实,蜘蛛网的建造结构,又何尝不是数学家为之赞叹不已的高级几何图形。当你凝视着一张挂满晶莹露珠的蜘蛛网时,觉得它仿佛像一个圆,网的中心就是圆心,从圆心辐射出几条半径,它们的圆心角大致相等;倘若再仔细端详,又会觉得它不太像圆,因为连接相邻两条半径的蛛丝不是同心圆弧,而是平行直线。各平行线间的距离也不相等,越靠近中心越稠密。 一张蜘蛛网简直就是一幅精美的几何图形。人们就是用圆规、直尺也难以描绘得如此匀称、美观。尽管人们把蜘蛛看作是一种勤奋智慧的动物,但它毕竟不懂得什么高等几何。蜘蛛结网不过是它的本能而已。然而,蜘蛛的“数学头脑”,对科学家来说,无疑是一个有待揭示的谜。 生物的形态和生长,往往隐藏着各种数学规律。 如果仔细观察向日葵花盘上的葵花籽,可以发现它们竟是呈对数螺线排列的。假如从一些植物嫩枝的顶端往下看,植物叶子的排列也是对数螺线的形状。更令人吃惊的是,这些叶子在螺线上的距离竟然遵循着数学上的“黄金分割”规律。 几何学的知识告诉我们:在同样体积的物体中,球的表面积最小,扁平薄片的表面积最大。因而,在气候温暖、水分充足的主要农牧区,植物的叶子大多呈扁平结构。这是植物在长期进化过程中形成的,因为这是耗用最少的有机原料、制造出最大表面积的一种理想构造。 植物的叶子被人们比喻为植物的“绿色工厂”,这座工厂的动力就是太阳光。科学家发现:植物叶子“为了”更有效地进行光合作用,通过上述数学特征,采用了最佳“技术”方案。 人们还研究了一些植物的叶子和花瓣的图案,发现它们完全符合解析几何的一些曲线方程。如“笛卡儿叶线”、“玫瑰形线”方程等。其实,古时人们就发现数学上的某些封闭曲线和植物的叶和花瓣的形状非常相似。发现坐标法的大数学家笛卡尔,曾经用坐标法研究了一族曲线,鉴于这族曲线与植物有着密切的关系,因而人们给这族曲线取了一个富有诗意的名称——“茉莉花瓣”。

生物中的数学天才

1动物中的数学天才“丹顶鹤” 丹顶鹤总是成群结队迁飞,而且排成“人”字形。人字形的角度是110度。更精确的计算还表明“人”字形夹角的一半——即每边与鹤群前进方向的夹角为54度44分8秒!而金刚石结晶体的角度正好也是54度44分8秒!是巧合还是某种大自然的“默契”? 2动物中的数学天才“蜜蜂” 密封蜂房是严格的六角柱状体,它的一端是平整的六角形开口,另一端是封闭的六角棱锥形的底,由三个相同的菱形组成。组成底盘的菱形的钝角为109度28分,所有的锐角为70度32分,这样既坚固又省料。蜂房的巢壁厚0.073毫米,误差极小。 3动物中的数学天才“蜘蛛” 蜘蛛网的“八卦”形网。是既复杂又美丽的八角形几何图案,人们使用直尺和圆规也很难画出像蜘蛛网那样匀称的图案。 4动物中的数学天才“珊瑚虫” 珊瑚虫在自己的身上记下“日历”,它们每年在自己的体壁上“刻画”出365条斑纹,显然是一天“画”一条。奇怪的是,古生物学家发现3亿5千年前的珊瑚虫每年“画”出400幅“水彩画”。天文学家告诉我们,当时地球一天仅21.9小时,一年不是365天,而是400天。 5植物中的数学天才“牵牛花” 到了夏季,人们随处看到绕缠在大树上生长的牵牛花。而树为圆桶状,是为了最大限度减少从各个方向吹来的风的影响。牵牛花采螺旋缠绕形式,用它的藤蔓紧紧依附在大树上生长。虽然乍看起来显得不太符合“两点之间线段距离最短”的几何学原理,但如果打开螺旋式缠绕的牵牛花藤蔓,就会发现它是线段,也就是说,牵牛花藤蔓是在用最短的距离缠绕在大树上生长的。 6植物中的数学天才“车前草” 车前草是常见的一种小草,它那轮生的叶片间的夹角正好是137.5度,按照这一角度排列的叶片,能很好地镶嵌而又互不重叠,这是植物采光面积最大的排列方式,每片叶子都可以最大限度地获得阳光,从而有效地提高植物光合作用的效率。建筑师们参照车前草叶片排列的数学模型,设计出了新颖的螺旋式高楼,最佳的采光效果使得高楼的每个房间都很明亮。

数学与其他学科的关系影响

数学与其他学科的关系影响 数学的世界是缤纷多彩的,是高深莫测的,是斗争的,发展的,是面向未来的。当我们初次踏进数学王国之门时,便被其中每一个数字,每一种符号,每一样图形的魅力深深折服。在科学技术飞速发展,百家争鸣的今天,数学在其他各个领域发挥着越来越不可缺少的作用。因为有了数学这坚实的依靠,物理,化学,美术,天文学,生物学……得以高速进步,达到前所未有的高度。 物理学 1.《流数简论》中以速度的形式引进了流数(微高)的概念,其中提出的微积分的基本问题 如:已知物体的路程,求物体的速度问题。已知物质运动的速度,求物体路程的问题 2.牛顿的力学巨著《自然哲学的数学原理》运用微积分工具,严格地推导证明了包括开普勒行星运动三大定律、万有引力定律等在内的一系列结论,并且还将微积分应用于流体运动、声、光、潮汐、彗星乃至宇宙体系,充分显示了这一数学工具的威力。 3,椭圆、双曲线、抛物线这些圆锥曲线都有焦点,焦点也就是光线的聚集点,人们已经证明(可用导数方法证明),抛物线有一条重要性质:从焦点发出的光线,经过抛物线上的一点反射后,反射光线平行于抛物线的轴 美术学 1.列奥纳多?达?芬奇有一句名言概括了他的艺术哲学思想:“欣赏我作品的人,没有一个不是数学家。”他认为绘画是一门科学,和其他科学一样,其基础是数学。米开朗琪罗、拉斐尔以及其他的许多艺术家都对数学有浓厚的兴趣,而且力图将数学应用于艺术。 2.画家们在发展聚焦透视体系的过程中,引入了新的几何思想,并促进了数学的一个全新方向的发展,这就是射影几何。丢勒认为:“创作一幅画不应该信手涂抹,而应该根据数学原理构图 3.射影几何集中表现了投影和截影的思想,这门”诞生于艺术的科学“,今天成了最美的数学分支之一 地理学 1. 里氏震级是由两位来自美国加州理工学院的地震学家里克特(Charles Francis Richter)和古登堡(Beno Gutenberg)于1935年提出的一种震级标度,是目前国际通用的地震震级标准。它是根据离震中一定距离所观测到的地震波幅度和周期,并且考虑从震源到观测点的地震波衰减,经过一定公式,计算出来的震源处地震的大小。 生物学 1.生物数学生物学的不同领域中应用数学工具对生命现象进行研究的学科。其一般方法是建立被研究对象的数学模型并对其进行定性和定量研究,主要应用的

浅析数学与科学的关系

浅析数学与科学的关系 摘要:数学是一门有着广泛应用的基础科学,对生产和生活起到了重要的作用。本文浅显地分析了数学的特点、数学思想和数学工具在科学研究中所表现出的重要作用。 关键词:数学思想数学工具科学研究 数学是一门有着广泛应用的基础科学,数学的研究对于整个科学的发展都有着巨大的推动作用。 1.数学的定义和特点 毕达哥拉斯学派提出了“万物皆数”的观点,虽然这是一个错误的观点,因为数是个概念,不是物,是物的数量特征在人的头脑中反映为数,不是客观存在的物。但是这个错误的背后是一个人类认识上的大进步——认识到数量关系在宇宙中的重要性。 当前,数学被定义为是从量的侧面去探索和研究客观世界的一门学问。而客观世界中的任何事物或对象又是质与量的对立统一,因此没有量的侧面的事物或对象是不存在的。因此从数学的定义出发,就必然导致数学与客观世界中的一切事物的存在和发展密切相关。 恩格斯曾经说过,“纯数学的对象是现实世界的空间形式和数量关系,所以是非常现实的材料。这些材料以极度抽象的形式出现,这只能在表面上掩盖它起源于外部世界的事实。但是为了能够从纯粹的状态中研究这些形式的关系,必须使它完全脱离自己的内容,把内容作为无关重要的东西放在一边。”从这一论述出发,数学具有如下特点: 1.1抽象性 任何科学及人类思维都具有抽象性,但数学要比其他理论更抽象。一方面,它是对具体事物的抽象,比如从一块石头抽象出1的概念。另一方面,它还可以在抽象之上进行抽象,由概念引出概念。如1、2、3等概念无疑是建立在对真实事物的直接抽象上。至于像虚数这样的概念,则距离现实更远,以至被认为是“思维的自由想象和创造物”。总之,它只保留了事物的空间形式和数量关系;数学体系是由抽象的概念以及关系构成的,是被人们用高度形式化的符号来描述的;

数学与社会发展的关系——廖子惠

数学与社会发展的关系 廖子惠12数A

前言 数学作为一门独立的学科它的产生与发展是与人类社会的生活紧密相连的。社会生活的需要促使了数学的产生和发展同时数学的发展对人类社会的生活、生产和科技进步起着巨大的推动作用,这在近代数学发展中显得尤为突出。因此,数学与社会生活是相互依存、互为因果而且互为成长的。数学的发展过程与人类对自然界的认识过程相一致,即从简单到复杂,从特殊到一般,从具体到抽象。

目录 前言 (2) 一、数与数学的起源 (4) 二、社会对于数学的需要 (8) 1、衣食住行中的数学 (8) 2、社会生产中的数学 (9) 3、数学与战争 (10) 三、数学对于社会发展的推动 (11) 1、数学与物理科学 (11) 2、数学与生物科学 (13) 3、数学与社会科学 (14) 四、社会的需要促进了数学的发展 (15) 五、数学的社会特征 (18) 结语 (23)

一、数与数学的起源 数学是一门以人们社会生活(需要 包括客观存在的现象)为研究对象, 用数和形以及基本符号来抽象表述的 一门科学,数学与社会生活的发展是 相互促进的,数学的产生源于社会生 活的需要,数学的发展促进了社会的 进步。 从数的产生来看,原始人类是用尖 锐的工具在树干上划痕来记数,用绳 结等来表示数和量的,这也就是原始 数学的抽象表达形式。随着生产活动 的不断发展,人类认识的数和量也在 不断地增加,使得人类产生了用手指和脚趾来进行加法运算,并且由此产生“进位制”。可见人类最初对数自然数的认识是和整个社会生活密不可分的。在夏禹治水的时候,洛水出现一只大龟,背上有图有字,称为洛书,据说洛书出现后才产生了数学。

数学思维方法解决生物学问题

数学思维方法解决生物学问题 数学思维源于生产实践和生活需要,是人脑对数学问题的本质和内在规律性的概括和间接反映。教学中,如果能够适时适当地让学生亲身去体验数学思维,可能使学生从本质上掌握认识客观事物的一般规律和解决问题的一般方法。下面列举就一些实例中的数学问题进行分析: 一、用相似比和位似形的性质分析显微镜成象规律 问题1:显微镜中像的放大倍数如何计算? 甲说:显微镜中像的放大倍数等于目镜放大倍数与物镜放大倍数的乘积。(对吗?) 乙说:显微镜中像的放大倍数,是指像的面积放大倍数而不是像的长度或宽度的放大倍数,用数学中相似比知识回答,像的放大倍数应该是目镜放大倍数与物镜放大倍数的乘积的平方。 问题2:写出字母b在显微镜中的像是什么? 甲说:像为P,因像与实物上下相反。(对吗?) 乙说:像为d,因像与实物左右相反。(对吗?) 丙说:像为q,因像与实物上下相反,左右也相反,根据位似形的性质得知,将像旋转180昂螅胧滴锿较颉?/SPAN> 二、用极限分析细胞的生长过程 问题3:细胞能无限生长吗? 分析:把细胞看似一个球体,半径为R,表面积与体积的比为3/R,体积越大,这个比值越小,Lim 3/R=0,极限为0,说明体积R→∞,此时,细胞获取的营养物质无法满足其需要。用萝卜在红墨水中渗透实验,也可测算,细胞越大,营养物质到达中央的时间越长,细胞得不到足够的营养和排出废物,就不能正常生活而死亡,所以细胞不能无限制生长。 三、用直角坐标系和函数图象分析生物的物质变化

生物学教材中,分析蒸腾作用失水的变化、消化道内营养成分的变化,人体发育各器官的变化,环境污染程度等多处数据分析都是用函数图象表示的。学生难以看懂,因此,在教学时,结合学生认知特点,充分让学生在教与学的过程中,亲身去体验数学思维。先让学生认识数轴与直角坐标系的知识,再让学生理解函数图象上的点表示的意义,分析图象的变化规律,学会计算数据,得出结论,学会用数学方法解决实际问题。 问题4:向A、B、C、D 4支相同试管中,加入等量清水,水面上加等量的油,分别插入4株相同的嫩枝,B中叶片下表面涂上凡士林,C中叶片上下表面涂上凡士林,D中切叶片并在切口处涂上凡士林,在光照正常条件下实验,每 隔一段时间记录各装置的重量变化,用曲线图表示的,试问由哪几个装 置的重量变化可判断叶片上下表面的气孔数目怎样? 分析:八年级学生才在数学中学直角坐标系,对七年级学生来说, 先得看懂直角坐标系的意义;横轴上数据表示时间的变化,纵轴上数据表示装置重量的变化,过曲线上任意一点作横轴和纵轴的垂线,垂足上的数据表示某装置在某时刻的重量,B、A曲线表示时间越长,某装置的重量越小,任取一点计算,比如取第6小时这一时刻,B装置约为76克,减轻了4克,说明从叶片上表面蒸腾失水4克,A装置约为68克,减轻了12克,12-4=8(克),说明从叶片下表面蒸腾失水约8克,减轻越多,说明蒸腾失水越多,叶面气孔就越多,因此,叶片下表面气孔比上表面气孔数目多。 四、用反证法判断相对性状的显隐性关系 问题5:在人类中,不能卷舌和能卷舌是一相对性状,由等位基因A-a控制。一对能卷舌的夫妇,生了一个不能卷舌的子女。请问显性性状是什么? 分析:假设能卷舌是隐性性状,那么这对夫妇的基因型都为(aa),都只会形成一种带a的配子,子女基因型为(aa),子女表现型为卷舌,不能出现不卷舌的子女,这与题中已知条件相矛盾,因此假设不成立,卷舌只能为显性性状。 五、用列表法考虑一切可能的情况

高中生物数学问题专题复习

高中生物数学问题专题复习 一.高中课本中的数字 1.细胞中常见的化学元素有20多种。(必修ⅠP16) 2.在干重中C的含量达到55.99%,这表明C是构成细胞的最基本的元素。(必修ⅠP16) 3.菲林试剂中甲液为0.1g/mL的 NaOH,乙液为0.05g/mL 的CuSO4。 双缩脲试剂A液为0.1g/mL的NaOH, B液为0.01g/mL的CuSO4。(必修ⅠP18) 4.将试管放入盛有50—65℃温水的大烧杯中加热约2min。(斐林试剂的反应条件)(必修ⅠP18) 5. 在生物体中组成蛋白质的氨基酸约有20种。(必修ⅠP20) 有8中氨基酸是人体细胞不能合成的(婴儿有9种,比成人多一种组氨酸),这些氨基酸叫做必需氨基酸,另外12种叫做非必需氨基酸。(必修ⅠP21) 6.在小烧杯中加入30ml质量分数为8%的盐酸,将烘干的载玻片放入小烧杯中。(必修ⅠP27) 7.多数糖类分子中氢原子和氧原子之比是2:1。(必修ⅠP30) 8.1g糖原氧化分解释放出来约17kJ的能量,而1g脂肪可以放出约39kJ的能量。(必修ⅠP32) 9.其中脂质约占细胞膜总量的50%,蛋白质约占40%,糖类占2%-10%。(必修ⅠP41) 10.质量浓度为0.3g/ml的蔗糖溶液。(必修ⅠP62) 11.测得单分子层的面积恰为红细胞表面积的2倍。(必修ⅠP65) 12.唾液的PH为6.2~7.4,胃液的PH为0.9~1.5,小肠液的PH为7.6。(必修ⅠP83) 13.0℃左右时,酶活性很低,但酶的空间结构稳定。酶制剂适于在低温(0~4℃)下保存。(必修ⅠP85) 14.高能磷酸键水解时释放的能量多达30.54kJ/mol。(必修ⅠP88) 15.1mol的葡萄糖彻底氧化分解以后,可使1161kJ左右的能量储存在ATP中,其余以热能的形式散失掉了。1mol 葡萄糖在分解成乳酸以后,只释放出196.65kJ的能量,其中只有61.08kJ的能量储存在ATP中,近69%的能量都以热能的形式散失了。(必修ⅠP94) 16.无水乙醇(也可用体积分数为95%的乙醇,但要加入适量的无水碳酸钠,以除去乙醇中的水分)(必修ⅠP98) 17.叶绿素(含量约占3/4)类胡萝卜素(含量约占1/4)(必修ⅠP98) 18.细胞周期的大部分时间处于分裂间期,大约占细胞周期的90%~95%。(必修ⅠP112) 19.上午10时至下午2时,剪取洋葱根尖2~3mm,立即放入盛有盐酸(质量分数15%)和酒精(体积分数95%)混合液的玻璃皿中,在室温下解离。(必修ⅠP116) 20.在人的一生中,体细胞一般能够分裂50~60次,而癌细胞却不受限制。(必修ⅠP125) 21.每3个这样的碱基又称做1个密码子,科学家将64个遗传密码子编制成密码子表。(必修ⅡP64) 22.反密码子为UAC的tRNA携带甲硫氨酸,通过与mRNA的碱基AUG互补配对,进入位点1。携带组氨酸的tRNA 以同样的方式进入位点2。(必修ⅡP66) 23.例如果蝇有4对共8条染色体。(必修ⅡP86) 24.由受精卵发育而来的个体,体细胞中含有两个染色体组的个体叫做二倍体。(必修ⅡP87) 25.蜜蜂的蜂王和工蜂的体细胞中有32条染色体,而雄蜂的体细胞中只有16条染色体。(必修ⅡP87) 26.红绿色盲中男性的发病率为7%,女性发病率为0.5%。(必修ⅡP91) 27.细胞内液(约占2/3)细胞外液(约占1/3)(必修ⅢP2) 28.血浆中90%为水,其余10%分别是:无机盐(约1%),蛋白质(7%~9%),以及……(必修ⅢP4) 在组成细胞外液的各种无机盐离子中,含量上占明显优势的Na+和Cl—,细胞外液渗透压的90以上来源于Na+和Cl—。在37℃时,人的血浆渗透压约为770kPa。(必修ⅢP5) 正常人的血浆近中性,pH为7.35~7.45。(必修ⅢP5) 29.正常人的血糖含量是0.8—1.2g/L(80~120mg/dL)(必修ⅢP23) 30.在人体血液中甲状腺激素的含量只有3×10—5~1.4×10—4mg/mL,而1mg甲状腺激素可使人体产热增加4200kJ。(必修ⅢP28) 31.大约只有1%以可见光的形式,被生态系统的生产者通过光合作用转化成为化学能,固定在它们所制造的有机物中。(必修ⅢP94) 能量在相邻两个营养级间的传递效率大约是10%~20%。(必修ⅢP96) 生态系统中的能量流动一般不超过4~5个营养级。(必修ⅢP96)

相关主题
文本预览
相关文档 最新文档