两种过滤特征基因选择算法的有效性研究_李丽
- 格式:pdf
- 大小:283.36 KB
- 文档页数:6
- 160 -[7]夏蓉晖,秦冬.高龄冠心病患者多重用药1例[J].临床药物治疗杂志,2019,17(1):52-53.[8] Masumoto S,Sato M,Maeno T,et al.Factors associated with the use of dietary supplements and over-the-counter medications in Japanese elderly patients[J].Bmc Family Practice,2018,19(1):20.[9]李金芳,马利,余玉善,等.石河子市老年高血压住院患者衰弱影响因素分析[J].广东医学,2018,39(22):53-57.[10]闫雪莲,孙雪,付乐宸,等.末期老年住院患者多重用药及药物重整调查[J].中华老年多器官疾病杂志,2018,17(12):12-15.[11]张佳颖,郭西芮,吴行伟,等.居民用药风险“知识-态度-行为”调查及影响因素研究[J].中国药房,2018,29(11):1445-1448.[12] Gunawan H,Hanum H,Abidin A,et al.Relationship betweendepression with FEV 1 percent predicted and BODE index in chronic obstructive pulmonary disease[J].IOP Conference Series Earth and Environmental Science,2018,125(1):012149.[13]李丽,曹学云,陈冬玲,等.老年高血压患者家庭治疗方案执行情况及影响因素分析[J].慢性病学杂志,2018,19(7):876-880.[14] Torres A P,Garc ía M E G,L ópez-Sobaler A M,et al.Assessment of diet in patients with chronic kidney diseases without dialysis and relationship with the nutritional status[J].Nutricion Hospitalaria,2017,34(5):1399-1407.[15]杨影红,曾幸坤,褚娇娇,等.门诊老年患者衰弱现状调查及相关影响因素分析[J].浙江医学,2018,40(10):1050-1053.[16]贾春伶,张娟涛,张丽霞,等.社区老年慢性病患者多重用药现状和处方干预认知度调查[J].人民军医,2019,62(6):534-538,541.[17]贾贺勋,袁诗韵,罗涛.重庆地区部分老年高血压患者现况调查及多学科诊治方案建议[J].重庆医科大学学报,2019,44(5):642-648.[18]杨翔,张瑗,陈阳希,等.高龄老年患者不合理用药情况调查及影响因素分析[J].医学研究生学报,2018,31(1):39-43.(收稿日期:2020-07-21) (本文编辑:刘蓉艳)①山东省宁阳县第一人民医院 山东 宁阳 271400通信作者:李文思肺腺癌临床病理特征与EGFR基因突变的关系研究李文思① 苏雷①【摘要】 目的:探讨肺腺癌临床病理特征与表皮生长因子(EGFR)基因突变的关系。
基于分类间隔的特征选择算法ISSNl000—9825,CODENRUXUEWJournalof&,V o1.19,No.4,April2008,PP.842—850DoI:10.3724/SP.J.1O01.2008.0084202008byJournalofSoftware.Allrightsreserved.基于分类间隔的特征选择算法任双桥,傅耀文,黎湘,庄钊文(国防科学技术大学电子科学与工程学院空间电子信息技术研究所,湖南长沙410073)FeatureSelectionBasedonClassesMarginRENShuang.Qiao,FUY ao?Wen,LIXiang,ZHUANGZhao?WenE-mail:************.cnTel/Fax:+86.10.62562563 (SchoolofElectronicScienceandEngineering,NationalUniversityofDefenseTechnology, Changsha410073,China)+Correspondingauthor:Phn:+86—10—66322728,E-mail:************************.cnRenSQ,FuYw,Lix,ZhuangZW.Featureselectionbasedonclassesmargin.JournalofSoftwa re,2008,19(4):842-850./lO00?9825/19/842.htmAbstract:Firstly,adistinguishableconditionisproposedforseparatingthefeaturesbylinearc lassificationhypersurface.Secondly,thepaperanalysesthepropertiesofthefeaturelineardistinguishablecriter ionbasedonsupportvectormachines(SVMs).Finally,theefficiencyrateoffeaturesaredefinedbythecontributio ntoclassesmarginofeachfeature,andafeatureselectionalgorithmisputforwardbasedonthefeatureefficiencyrat e.Asexperimentalresultsshow,validatedwiththeactuallymeasuringdataandUCI(UniversityofCalifornia,Irv ine)data,performanceofthenewfeatureselectionmethod,suchasclassificationcapabilityandgenera lizedcapabilityare improvedobviouslyincontrasttotheclassicalReliefmethod.Keywords:featureselection;efficiencyrate;classemargin;SVM(supportvectormachine) 摘要:对于二类目标特征选择问题,首先讨论了特征空间的线性可分性问题,并给出了其判别条件;其次,通过借鉴支撑矢量机原理.分析了特征可分性判据的基本性质;最后,依据各特征对分类间隔的贡献大小定义了特征有效率.并以此进行特征选择和特征空间降维.实测数据与网络公开UCI(UniversityofCalifornia,Irvine)~库的实验结果表明,与经典的Relief特征选择算法相比,该算法在识别性能和推广能力上明显有所提高.关键词:特征选择洧效率;分类间隔;支撑矢量机中图法分类号:TPI8文献标识码:A特征选择是模式识别中的关键技术之一【,.一般情况下,只有在特征矢量中包含足够多的类别信息,才能通过分类器实现正确分类.由于特征是否包含足够多的信息很难确定,为了提高识别率,总是最大限度地提取特征信息.结果不仅使特征维数增大,而且其中可能存在较多的无效和冗余特征.因此,选择合适的特征来描述模式,对模式识别精度,训练时间和存储空间等许多方面都有较大影响【",并且对分类器的构造也起着非常重要的作用.特征选择的标准较多,经典的选择算法大多采用概率度量,距离度量和熵度量等衡量标准【1】.在足够多的样本前提下,基于大样本统计理论的上述准则和相应的分类算法是合理的;而当训练样本为小样本时,上述准则Suppo~edbytheNationalNaturalScienceFoundationofChinaunderGrantNo.60402032(国家自然科学基金)Received2006-?11-06;Accepted2007-?O1-?24任双桥等:基于分类间隔的特征选择算法843不一定总能取得良好的效果【.此外,特征选择常用的另一类准则还有类内距离,类间距离和散布矩阵度量等I".这些方法虽然应用广泛,但是,其识别算法大多是建立在经验模型的基础上,如神经网络等【6',其模型参数和结构的确定受数据和识别算法的影响较大.总之,经典的特征算法和相应的分类器大多注重的是大样本下使经验风险最小,而对分类器的推广性能要求较低【8Ⅲ.统计学习理论和支撑矢量机(supportvectormachine,简称SVM)[5】是一种研究有限样本下统计规律及学习方法性质的理论,较好地解决了小样本,非线性,高维数和局部极小点等实际问题.根据SVM分类器及特征选择的特点,近年来,研究人员[11,12]基于SVM将特征选择和分类识别融合在一起,通过利用一定的特征选择标准减少并优化支撑矢量,达到获得最佳特征组合的目的.由于这种方法获得的是直接用于分类的支持矢量子集,因此从理论上看,它将明显优于传统的特征选择方法.文献[11】提出了一种基于余量迭代搜索的多类目标特征选择算法,并讨论了算法的推广性能.Weaton等人I】基于SVM提出寻找具有最小留一法误差界的特征子集,并通过梯度下降算法代替贪婪算法,分别对模拟数据和真实数据进行了特征选择实验. 对于二类目标识别,本文首先对特征线性可分性给出了判别条件.然后,基于支撑矢量机原理,依据各特征对分类间隔的贡献大小定义了特征有效率,并以此提出了一种新的特征选择算法.该算法秉承了统计学习理论的理论基础~一结构风险最小,也即要求选择出的特征子集能够较好地兼顾分类器的分类能力和推广性能.实测数据实验结果表明,与经典的Relief特征选择算法相比,本文的算法在识别性能上获得了明显的提高.特别地,对于小样本数据效果更为明显.1特征空间目标线性可分条件1.1线性可分性定义对于二类目标识别,给定,个训练样本={ff),i=1,...,,),其中∈∈{1,-1)为类别标示符.如果存在一个线性分类器能将每个样本正确分类,则称样本D线性可分.定义1.1.称样本集D=={l),i=1,...,,),其中,而∈∈{1,一1}线性可分,是指存在weRn,6∈尺,p>o,使得不等式(1.1)成立:yi(wXi+b)>p,i=1,...,,(1.1)若不存在满足不等式(1.1)的(w,b,,则称样本集D线性不可分.如图1所示.则有2.5一.~2.0l什....1.5+6=0一一一l10rw什.…一Classonew+6一p.Classtwo0.5——Classonemargin——DeeisionboundaryJ,0.0lClasstwomarginjl234567Fig.1Samplearerecognizedbylinearfunction图1样本集线性可分示意图为讨论方便,将不等式(1.1)写成矩阵形式,记._wr,b,p)ERn+2,=(O….,O,1)∈,:JournalofSoftware软件V o1.19,No.4,April2008岔在下述讨论中,Farkas引理扮演了一个重要的角色.(1.2)(1-3)引理1.1(Farkas择一定理)[玎J.设矩阵A~Rre~n,矢量∈,则不等式组①和组②恰一组有解.组①:0o.组②:Ara---B,0.根据引理1.1,可从反面考察样本集z{f),i=1,...,l}的线性可分性,也即,若D线性不可分,则不等式组①无解,从而其充要条件是不等式组②有解.若将不等式(1.2),不等式(1.3)代入不等式组②,则可得甜4∑:1,∑ay:0(1.5)从而可得D={(xtf),i=1,...,,}的线性可分性理论形式的判据:定理1.1(~-f分性条件).观测样本集{i),i=1,...,,}线性可分的充要条件是式(1.4)一式(1.6)无解.2特征线性可分最优化模型由定理1.1可知,观测样本集D=={々),卢1,...,Z)线性可分的充要条件是式(1.4)-式(1.6)无解,即下述不等式组无解:日a0(2.1)jj∑tZiYi:o,∑:1(2.2)1=1i=10,i=1,...,,(2.3)其中,矩阵n=tylx1...ytxf).由于Ha=O的充要条件是口萨0,这里,S=HrH,=y,yf,xj.显然,对称矩阵S半正定,从而对任意的口∈R,有娩0.因此,可构造如下二次凸规划闯题:mil__arS1111n口口2s.t.yra=O.ea=l(2.4)0<a~l由定理1.1和优化问题式(2.4)~-Y得:推论2.1.观测样本集D=={ff),扛1,...,,}线性可分的充要条件为二次凸规划问题式(2.4)的目标函数值大于0.证明:必要性.假设样本集{),卢1,...,,}线性可分,则不等式组(2.1)一不等式组(2.3)无解.因此,对任意满足萨0和eta=1的非负矢量必有日0,从而可得arSa>0,故二次凸规划问题式(2.4)的目标函数值大于0.必要性得证.充分性.假设二次凸规划问题式(2.4)的目标函数值大于0,则对任意满足萨0和eta=1的非负矢量必有arSa>0,从而日僻0.因此,不等式组(2.1)一不等式组(2.3)无解,即样本集D:{),f=1,...,,}线性可分.充分性得证.证毕.口下面将通过考察支撑矢量机原理【来探讨二次凸规划问题式(2.4)的实质.由v.SVM可知,对于样本集D,其最优分类面的求解等价于求解下述二次凸规划问题.任双桥等:基于分类间隔的特征选择算法845min去w—P+cZ毒^ls.t.yi(wrx,+b)>_p-~i(2.5)0,0,i=1,...,,其中,w为特征空间中最优分类超平面的法矢,鼹引入的松弛变量,c为正则化参数,0<C<l,c越大,表示对错误分类的惩罚越大?在v_sVM模型中,分类面的间隔为W'ffff根据Wolfe对偶理论,二次规化问题不等式(25)可以等价于在其对偶空间(即Largrange乘子空间)来求解,其对偶形式为下述二次凸规划问题[:mi一1grsd1Illrl一2s.t.yra=o,Pa=l(2.6)0C其中,O<C<I,为正则化参数.特别地,当C=I时,对偶问题式(2.6)即为凸规划问题式(2.4).因此,满足式(2.1)和式(2.2)的非负权值其实质就是V—SVM对偶问题式(2.6)中的非负Largrange乘子.从而在判断样本集D是否线性可分时,同时也实现了支撑矢量机的求解.3特征线性可分判据性质下面来考察当正则化参数C=I时凸规划问题式(2.6)目标函数值的性质.假设每个观测样本由,1个特征构成,即Xi=ll,…)∈,i=1….,,,其中为第个特征,则有,=其中,=(),=,易知0,k=l….令(,1)=1T口=J厶"Fok(3.1)--I=l其中,为式(2.6)的解.定理3.1.,1)具有单调递增性,即,1),l+1).证明:假设在观测样本xy(xfl,…,Xin)∈时,规划问题式(2.6)的解为%,当样本增加~个特征时,即Xi~(X1..1)∈川,规划Ih3~(2.6)的解为+l'则有,11+l+1)=寺《.+.口+=寺∑sL.口+-』一k=l寺∑口l.c+.=1厶"T+.c+.-l-tll厶""Tok=(,1),其中,第1个不等式是由于sL.0(矩阵sL.半正定),第2个不等式是由于J(n)~t3C=l 时规划问题式(2.6)的最优目标函数值.证毕.口定理 3.2.假设两个观测样本集O={(ubyi),f=1….,,),D={(v,『),i=1…,,,),其中,"∈,vi~Rm.令样本集三+={f),i=1….,,}("f,Vt)~Rn+m,则有,1)+),l+),其中,1)),l+)分别为样本集D,D,D+所对应的规划问题式(2.6)在正则化参数C=I时的最优目标函数值.证明:由于f:("f,vf)∈,则有JournalofSoftware软件V o1.19,No.4,April2008.+=[薹]一『,v1''(+1一l(+v,).:.二-j+m)=去++:Sn~n+m+《+2一2一一≥+2 (2)其中,,,%+分别为样本集Dn,Dm,Dn+所对应的规划问题式(2.6)在正则化参数C=-I 时的最优解.口定理 3.3.假设两个观测样本集={(ff),i=I,...,f),D={(if),i=I,...,f),其中,Uf∈,vfERra.若,1),(m),则有4:,其中,1)m)分别为样本集D,Dm所对应的规划问题式(2.6)在参数cr_1时的最优目标函数值.4:,4分别为样本集Dn和.m的最优分类间隔?证明:不妨假设',(,1)>O,若不然,由推论2.1可知,结论显然成立.因此,样本集D和D均线性可分.由支撑矢量机的原理可知,线性可分样本集D={(ff),i=I,...,I)的最优分类间隔可由如下凸规划问题求得,也即mm!w~111111W—一口2s.t.yf(wf+6)(3.2)max一.s.t.yra---0,Pa=l(3.3)其中,为非负Largrange乘子,w=∑.设%为凸规划问题式(3.3)的最优解,则有, (n)==lffJ(3.4)_Il1W*fJ一:一(3.5)由式(3.4),式(3.5)可得:--tfw=fJ(3.6)4:=厕同理,线性可分样本集D={(f),i=1,...,1)的最优分类间隔为4==厮(3.7)(3.8)任双桥等:基于分类间隔的特征选择算法847由于,1)),因此44=1.口定理3.4.若样本集D={("ff),卢1….,,}线性不可分,且设Ui=(Ufl,…,"f)∈,为第个特征,则任意剔除m>O个特征后组成新的样本集仍然线性不可分.若样本集D线性可分,则增加任意m>O个特征后组成新的样本集仍然线性可分,且其分类间隔不会下降.证明:假设样本集D={(),卢1,...,,}线性不可分,则由推论2.1可知,当正则化参数C=l 时,有(,1)=÷=0,则任意剔除m>O个特征后,由定理3.1可知:.0一)r(,1)=0.从而,J(n—)=0,即新的样本集线性不可分.同理,假设样本集D={("f),i=l,...,线性可分,则有,1)>0,增加任意m>O个新特征后,则有0(,1)+),也即新的样本集线性可分.当新增m>O个特征后,假设样本集D+={ii),i=l….,,}产(,vf)∈,则由,1)+)和定理3.3可知,4:4+.因此,当样本新增m>O个特征后,其最优分类间隔随特征维数的增加而递增.证毕.口综上所述,对于观测样本集D={,),i=l,…,f},当正则化参数C=l时,二次凸规划问题式(2.6)的目标函数值)具备了作为类别可分性判据的下述基本条件【:①)与误判概率的界存在单调关系.根据统计学习理论,期望风险)=(z,a)dF(z)与经验风险)=÷∑Q(z,),至少以1一的概率满足下述不等式:(一(+,,,,其中,Q(z,,creW2为决策风险函数,zf)为观测样本.为致信范围,h为函数集Q(z,,∈的VC维,且,,,是关于VC维h的单调增函数,而关于样本规模,是单调减函数.在统计学习理论中,关于线性函数集的VC维有一个重要结论.定理 3.5[.设矢量∈包含在一个半径为,的超球中,则分类间隔为的超平面集合的VC维h以下述不等式为界:矗min]+l-由此可得关于测试样本误判概率的一个上界,即测试样本不能被分类间隔为的超平面正确分类的概率,至少以1一的概率满足下述不等式:Pe,.o≤争+√其中,flIl型+11-1n翌占=4.,,o是训练样本中没有被分类间隔为的超平面正确分类的样本数.因此,由定理3.5可知,超平面函数集的VC维h是分类间隔的单调减函数.从而有,当采用超平面进行分类识别时,期望风险(的界和测试样本误判概率P,,.,的界均为分类间隔的单调减函数.又由于最优分类间隔4=√2(,1),从而有,期望风险(和测试样本误判概率,的界均为,1)的单调减函数.②)具有不完全可加性.③由于):÷l_w=l_,因此)具有"距离"的某些共性.④.,(n)关于特征维数是单调递增的4基于分类间隔的特征选择JournalofSoftware软件V o1.19,No.4,hpril2008由于.,(n)具备以上4个基本条件,因此,可以将其作为类别可分性判据【l】_在此基础上,可定义各特征的有效率并以此进行特征选择.假设样本集D={i),i=1,...,,}线性可分,则.,(,1)=J.口T口=1厶"口T1)k口>0,从而,可以定义第k个特征的有效率为=箍k=-…于是,∑7"k=1,0.由于w==∑n,llw=112=T,且=(),=y~yjxaxjk.因此,=,其中,w==(w=(1),...,w=(.由式(4.1)可知,第k个特征的有效率的实质就是最优分类超平面法矢w=的第k个分量w=(.i})占其总能量lJw=lJ的百分比.又由于最优分类间隔4=√.,()Jw=lJ,因此,很好地刻画了第.i}个特征对分类间隔4的贡献.下面考察在一些特殊情形下特征的有效率,以验证式(4.1)可以很好地吻合直观感知.假设第k1个特征和第七2个特征满足如下线性关系:‰=+,i=l….,,(4.2)不妨假设,JI,也即o<1~1,则有,w=(毛)=∑=∑n=w=(七2)(4.3)从而可得:=02(4.4)因此,由式(4.4)n-I"知,当第k1个特征和第七2个特征完全线性相关时,其特征的有效率是以0下降的.由于大多数分类器均采用距离度量,因此,数值较小的特征提供的有效信息应不如数值较大的特征.特别地,当O=0时,即恒等于常数则其有效率=0,这一结论也符合客观事实.因此,式(4.1)的特征有效率与直观感知的吻合度是很好的.假设二次凸规化问题式(2.6)的目标函数值.,(,1)=0,也即观测样本集D线性不可分.此时,由线性不可分情形下v.SVM原理可知,只需对Langrange乘子口的边界约束条件作进一步限制,即要求0≤c.这里,C为正则化参数,可设定0<C<1,也即在分类间隔和误判概率之间作一个折衷以确保.,()>0.总之,无论观测样本集D是否线性可分,均可根据特征有效率的大小进行特征的剔除和增加.5实验结果及分析本节利用实测数据和公开的UCI(UniversityofCalifornia,Irvine)数据库进行实验,并与经典的Relief特征选择算法进行了比较,取得了较好的结果.Relieff7,14]~Kira等人1992年提出的公认的性能较好的特征选择方法,该算法认为,一个好的特征应该使最近邻的同类样本之间特征值相同或相近,而使最近邻的不同类样本之间的值不同或者差别很大.因此,若赋予每个特征相应权值并进行特征排序,通过设定特征权阈值或者特征子集的数目即可进行相应的特征选择.任双桥等:基于分类间隔的特征选择算法849本次实验数据为某机载雷达实测一维距离像数据集,共有3939个样本,样本维数为32,包括了15个角度下的测量值,样本类型包括卡车和坦克两种目标.该数据集已经过距离对准和能量归一化等预处理过程,且为了更好地对比,本实验将选择一个小样本训练集,实验中选取的初始训练样本集为每个角度下若干个样本,总共选取了100个训练样本,测试样本为3839个,依据特征有效率小选择的特征维数从4开始依次递增,采用SVM方法进行测试识别,实验结果如图2(a)所示.第2组实验数据为网络上公开的UCI数据库中的某癌症患者数据集,共有569个样本,样本维数为3O,样本类型包括健康者和患者两种类型.实验中选取的初始训练样本集为100个,测试样本为469个,依据特征有效率y大小选择的特征维数从14开始依次递增,采用SVM方法进行测试识别,实验结果如图2(b)所示.O.85O.8O10.750.70O65O.93r0.921O_91}0.90O.89一;0.881o.870.860.ThenumberoffeaturedimensionThenumberoffeaturedimension(a)(b)Fig.2Relationbetweennumberoffeaturedimensionandrecognitionrate图2特征维数与测试样本分类正确率之间的关系由图2(a)可知,当特征维数等于14时,本文算法的测试分类结果最好,测试率为81.69%,选出的特征为【112151********O222326272932].当全部特征都选用时,测试率为72.57%,相对于最优特征集的测试率下降了9.12%.而由Relief算法选出的最优特征集为19个,测试率为76.69%,低于本文算法的最优测试率.由图2(b)可知,当选择特征维数等于17时,测试分类结果最好,测试率为92.96%,选出的特征子集为[156789111213161719252628293o1.当全部特征都选用时,测试率为88.06%,相对于最优特征集的测试率下降了4.9%.由Relief算法选出的最优特征集为25个,测试率为91.04%,低于本文算法的最优测试率.6结束语对于二类目标识别问题,本文首先针对样本空间中的可分性给出了其判别条件;然后,基于SVM原理探讨了特征选择问题,以特征有效率为切点,提出了一种新的特征选择算法;最后,通过两个小样本实测数据实验验证了该特征选择算法较之经典的Relief算法在识别性能和推广能力上更为有效. References:【1】SunJX,eta1.ModernPaRernRecognition.Changsha:NationalUniversityofDefenseTechn ologyPress,2002(inChinese).【2】LiuH,YuL.Towardintegratingfeatureselectionalgorithmsforclassificationandclustering. IEEETrans.onKnowledgeandDataEngineering,2005,17(4):491-502.【3】FanJS,FangTJ.Analysisandevaluationonmainfactorsforfeatureselectionandabstraction. ComputerEngineeringandAppliction,2001,13(2):95—99(inChinesewithEnglishabstract).【4】KwakN,ChoiCH.Inputfeatureselectionforclassificationproblems.IEEETrans.onNeural Networks,2002,l3(1):143—159.【5】V apnikVN.StatisticalLearningTheory.Bering:PublishingHouseofElectronicsIndustry,2 004.850【6】【8】【9】【10]【11】【12]【13]【14]JournalofSoftware软件V o1.19,No.4,April2008GarrettD,PetersonDA,AndersonCW,parisonoflinear,nonlinear,andfeatu reselectionmethodsforEEGsignalclassification.IEEETrans.onNeuralSystemsandRehabilitationEngineering,2003,11(2): 141—144.ZhangLX,WangJX,ZhaoYN,Y binationfeatureselectionbasedonrelieLJournalofFudanUniversity(NaturalScience),2004,43(5):893-898(inChinesewithEnglishabstract).JinX,DengYF,ZhongYX.Mixturefeatureselectionstrategyappliedincancerclassification fromgeneexpression.In:Proc.ofthe2005IEEEEngineeringinMedicineandBiology27thAnnualConLShanghai:IEEEPres s,2005.4807--4809.XuJQ,YuanZD.AfeatureselectionmethodbasedonminimizinggeneralizationboundsofS VMViaGA.In:Proc.ofthe2003IEEEInt'lSyrup.onIntelligentControlHouston.Texas:IEEEPress,2003.996—999. SindhwaniV,RakshitS,DeodhareD,ErdogmusD,PrincipeJC,NiyogiP.Featureselectionin MLPsandSVMsbasedonmaximumoutputinformation.IEEETrans.onNeuralNetworks,2004,15(4):937—948. Gilad—BachrachR,NavotA,TishbyN.Marginbasedfeatureselection--Theoryandalgorithms.In:P roc.ofthe21stInt'lCon~onMachineLearning.Banff:ACMPress,2004.43—50.WestonJ,MukherjeeS,Chapelle0,PontilM,PoggioT,V apnikV.FeatureselectionforSVMs. In:AdvancesinNeuralInformationProcessingSystems,V o1.13.Cambridge:MITPress,2000.668—674. SuTS,eta1.OptimizationComputationPrincipleandProgramDesigning.Changsha:Natio nalUniversityofDefenseTechnologyPress,2001(inChinese).LiY,WuZF,LiuJM,TangYY.Efficientfeatureselectionforhigh—dimensionaldatausingtwo?levelfilter.In:Proc.ofthe3rdInt'lConeonMachineLearningandCybernetics.Shanghai:IEEEPress,2004.1711-1716. 附中文参考文献:【l】孙即祥,等.现代模式识别.长沙:国防科技大学出版社,2002.【3】范劲松,方廷健.特征选择和提取要素的分析及其评价.计算机工程与应用,2001,13(2):95—99.【7】张丽新,王家,赵雁南,杨泽红.基于Relief的组合式特征选择.复旦大学(自然科学版),2004,43(5):893-898【l3】粟塔山,等.最优化计算原理与算法程序设计.长沙:国防科技大学出版社,2001.任双桥(1977一),男,湖南望城人,博士,主要研究领域为支撑矢量机,目标识别.傅耀文(1976一),男,博士,副教授,主要研究领域为目标识别,信息融合.黎湘(1967一),男,博士,教授,主要研究领域为目标识别,信息融合.庄钊文(1958一),男,博士,教授,CCF高级会员,主要研究领域为信息融合,雷达极化信息处理.■■。
基因组文库的构建和池化筛选综述与专论?生物技术通报BloTECHNoLoGYBULLETIN201O年第5期基因组文库的构建和池化筛选陈献伟娜日苏朱超.王会'雷娜,高剑峰关伟军马月辉(中国农业科学院北京畜牧兽医研究所,北京100193;2石河子大学生命科学学院,石河子832003;广西大学动物科学技术学院,南宁530004;山西农业大学,太谷030801)摘要:作为物种保护策略的重要部分,建立濒危畜禽的基因组文库,可有效保存濒危畜禽种质资源.BAC(bacterialartificialchromosome)文库具有高容量,遗传特性稳定和嵌合体少等优点,因而被用于畜禽基因组文库的构建.对BAC文库的构建方法和文库池化筛选系统作一综述.关键词:BAC栽体基因组文库池化筛选ConstructionandScreeningofGenomicLibrary ChenXianweitNaRisuZhuChaofWangHuifLeiNa?GaoJianfengGuanWeijunMaYuehui ('InstituteofBeijingAnimalScienceandV eterinary,CAAS,Beijing100193;CollegeofLife Science,ShiheziUniversity,Shihezi832003; CollegeofAnimalScienceandTechnology,GuangxiUniversity,Nanning530004;ShanxiA griculturalUniversity,raigu030801)Abstract:ConstructionofthegenomicLibraryofdomesticanimalasthebasiccompone ntofs peciesconservationstrategycan preserveendangeredanimalgermplasmresourcesefficiently.Beingcapableofinsertinglarg efragments,maintainingthestabilityofin—sertedDNAinE.coli,producingfewchimerismes,BAClibraryhavebeencontributedtorese archesofconstructionofgenomiclibrary. ThispaperdescribedtheconstructionmethodandscreeningsystemofBAClibrary. Keywords:BACvectorsGenomiclibraryPoolingScreening高分子量的DNA文库是基因组研究的基础,如重要经济性状基因的图位克隆,比较基因组研究,基因组测序及物理图谱的构建.BAC载体具有容量大,遗传特性稳定和嵌合体少等优点,非常适合于基因组文库的构建.1BAC文库的研究进展基因组文库是利用DNA重组技术将某种生物细胞的核DNA的全部或大部分片段随机地连接到克隆载体上,之后转移到适当的宿主细胞中,通过细胞增殖而形成的各个片段的无性繁殖系的总集.基因组文库构建的关键取决于所使用的克隆载体.自Cohen等构建第一个质粒载体pSC101以来,相继出现了大量的克隆载体.克隆载体大致可分为噬菌体系列和人工染色体系列.前者主要包括质粒(plasmid),噬菌体(bacteriophage),柯斯质粒(cosmid,又称粘粒)等,其主要特点是载体在宿主细胞内能稳定遗传,易分离,转化效率高,但克隆容量有限,一般小于45kb.许多真核生物的基因庞大而复杂,难以克隆到这些载体中.后者主要有酵母人工染色体(yeastartificialchromosome,YAC),细菌人工染色体(bacterialartificialchromosome,BAC)以及可转化人工染色体(TransformationArtificialChromo—some,TAC)和哺乳动物人工染色体(mammalianarti—ficialchromosome,MAC)等,显着特点是载体的容载收稿日期:2009—12-29基金项目:国家科技支撑项目(2006BAD13BOB,2008BADB2B01),转基因重大专项(2008ZX08009-003),国家"863"计划项目(2006AA10Z1982007AA10Z170)作者简介:陈献伟,男,硕士,主要从事分子生物学研究工作;E.mail:****************通讯作者:关伟军,男,教授,博士生导师,主要从事动物细胞分子生物学方面研究工作;E—mail:********************.cn马月辉,男,研究员,博士生导师,主要从事动物遗传资源保护方面研究工作;E—mail:yuehui—**********12生物技术通报BiotechnologyBulletin2010年第5期能力大,约100—350kb.这些具有较大外源片段承受能力的人工染色体对于真核生物基因组文库的构建极为有利.近年来得到广泛应用的克隆载体主要是细菌人工染色体(BAC).细菌人工染色体是在大肠杆菌F一因子基础上发展而来的.F.因子的复制是严谨型的,在每个细胞中仅有1—2个拷贝,这样就减少了质粒所携带的外源片段发生重组的可能性,而且F.因子能携带的外源片段可达1mb,表明F一因子更适合于克隆大片段的DNA.BAC克隆体系的第一代载体pBAC108L(图1).pBAC108L能克隆的外源片段可达300kb,但它存在的一个问题是只有10%一50%的转化子是重组子.自从BAC载体问世以来,出现了许多目的在于增加易用性和用于特定系统和环境的修饰.pBeloBAC11和pBACe3.6是对pBAC108L进行修饰构建的载体,通常作为进一步修饰的基础载体(图2).pBeloBAC11代表了第二代的BAC克隆系统,也是应用非常广泛的一种BAC载体.其外源DNA片段的容量最大可至300kb以上,可应用于基因组文库的构建工作.主要特点是在pBAC108L的多克隆位点上增加了LacZ基因,可用于蓝白斑筛选.然而pBeloBAC11仍是低拷贝质粒.T7—?'_SP6SalINotIBHNotI卜口_[卜卜—)—EcoRV图1pBAC108L载体H/ndmBamHIrepE图2pBeloBACll载体Frengen等构建了pBACe3.6载体(图3).pBACe3.6是在pBAC108L的基础上构建的,但比pBeloBAC11修饰程度高.此外,它利用了不同于pBeloBAC11蓝白斑选择的另一选择机制,其多克隆位点位于蔗糖致死基因sacB上,这样重组克隆可以在含有蔗糖的培养基上进行阳性选择.OCM(R)mHIfl1lCIIf811c0RInO,SacIf2O)胁II(221PUC—LINKLI(766)LI(2012)ApaLI(2509)南R322NotI(2850)图3pBACe3.6载体1997年,Hamilton等"结合根癌农杆菌双元载体和BAC载体的特点,构建了一种"双元BAC载体(abinaryBAC)",即BIBAC.BIBAC作为第三代文库载体,不仅具有第二代载体的特征,而且有植物2010年第5期陈献伟等:基因组文库的构建和池化筛选转化的功能.BIBAC转化技术在双子叶植物中已经建立,Hamilton等'通过农杆菌介导的方法把克隆在BIBAC2中的完整的150kb大小的人类DNA片段转进了番茄和烟草.TAC(transforma.petentartificialchromosome)也是一种直接用于转化的人工载体.1999年,Liu等结合PAC载体和双元载体的特点,构建了植物可转化基因人工染色体TAC载体Pyltae7和Pyhac17.TAC载体能在大肠杆菌和根癌农杆菌中以单拷贝形式复制.目前,已有人和一些哺乳动物的基因组DNABAC文库建成,如猪",牛,大熊猫"和鲶鱼H等动物.通过BAC文库的构建,不仅长久而有效地保存动物基因遗传资源,而且,为进一步研究,开发和利用其与重要经济性状,生殖和遗传性疾病相关的功能基因,提供可靠的基因材料平台.2BAC文库的构建方法基因组DNA文库的构建流程相对简单,但其需要很多特殊的处理以及必要的仪器设备,成功的关键都体现在操作的细节上.BAC文库的构建过程包括以下几个步骤.2.1BAC载体的制备载体制备的好坏,直接关系到文库中空白载体的比例和文库的质量,载体的纯度越高,获得阳性克隆的概率越高,文库的质量也越好.采取酶切的同时进行彻底的脱磷处理,以减少或避免空白载体的比例,保证其符合建库要求.载体的制备主要包括BAC载体的大量提取和纯化,CsCL.EtBr密度梯度离心纯化得到的超螺旋质粒,BAC载体的后期处理(酶切和去磷酸化),载体脱磷效果检测,载体自连回收.2.2高分子量(HMW)DNA的制备由于构建BAC文库需要得到尽可能完整的大片段DNA,因此,首先要保证将细胞核包埋在琼脂糖凝胶块中的质量,即细胞核的质量和浓度,琼脂糖凝胶的浓度等.而且如果是组织样品,一般使用液氮将组织捣碎,并在整个研磨过程中使组织浸泡在液氮中,然后包埋在低熔点琼脂糖中形成"Plugs",以此来保护核DNA免受降解.2.3高分子量DNA的不完全消化高分子量DNA的不完全消化的目的使通过限制性内切酶的不完全消化,产生大量比较适合和集中的片段,一般通过脉冲场凝胶电泳进行两次片段选择'.DNA的分离一般有一次尺度选择和二次尺度选择(尺度选择即脉冲电泳),在脉冲场电泳条件下,由于不同分子量的DNA片段发生"共迁移",在大片段中混有很多小片段DNA,而这些小片段DNA 在连接过程中效率要明显高于大片段DNA,从而影响基因组文库的构建质量.二次尺度选择法得到的DNA连接转化效率较高,转化后插入的片段整齐度好,空载率低.为了获得纯度高,含量多的大片段,减少大片段的降解,同时又尽可能的去除小片段,采用二次尺度法进行大片段DNA的分离,按照部分酶切所确定的最佳酶用量,对基因组Plugs进行大量酶切,然后进行脉冲场电泳.2.4大片段DNA和载体的连接大片段DNA能否有效地连接到载体上,主要取决于插入片段与载体的比例,对于不同的生物采用的比例不同,大部分处于1:5—15(摩尔比)范围.2.5将连接产物转化入受体细胞对于转化大肠杆菌而言,电转化是目前使用最普遍的一种方法.研究表明,文库中载体的平均插入大小主要与转化效率相关.插入片度越大,转化效率越低;反之,越高.此外,转化条件也直接影响转化效率,插入片段大小及假阳性克隆的含量.2.6挑选阳性克隆,构建文库阳性克隆的分检有人工和使用机器手技术两种.一般通过lacZ的插入失活,显示蓝白斑的负同选择来筛选重组子,但是在基因组文库构建中常常发现有1%一10%左右的假阳性,用机器人操作时假阳性更高.现在又产生了正向选择的BAC载体pBACe3.6,pBAC/SACB¨,利用sacB的插入失活,产生的零背景可使机器人进行挑选重组子时不必进行菌落间的分辨,便于自动挑取收集.2.7文库的保存管理与质量检测文库构建完成后,还需要对文库进行评价,其质量的高低标准包括文库中克隆的数量,平均插入片l4生物技术通报BiotechnologyBulletin2010年第5期段的大小,克隆的稳定性,细胞器DNA的含量以及假阳性克隆的含量等.3BAC文库的池化和筛选基因组BAC文库有数万到数十万个克隆组成,因此建立高效的管理和筛选系统是必要的.筛选系统有PCR筛选系统和Southern杂交筛选系统两种.3.1PCR筛选系统建立PCR筛选系统需要对所有的克隆进行保存和池化.整个BAC文库由若干个超级池组成,每个超级池有10个384孔板组成.将一个超级池的行克隆,列克隆和每板的克隆分别合并成池,提取质粒DNA作为第二步PCR筛选的模板,同时将10个板的克隆合并提取DNA,即有了第一步筛选超级池的DNA.对BAC文库进行两步.3D筛选的过程:首先,用目的序列的PCR引物筛选文库的若干个超级池的DNA,得到阳性超级池号;之后用阳性超级池的板池,行池,列池的DNA进行第二步筛选,得到阳性的板池号,行池号,列池号;从冻存的文库中依照筛选结果得出的克隆地址,挑出阳性克隆,再次做PCR验证.Bonet等¨构建了野草莓的BAC文库,共有18432个克隆,存于48块384孔板中,压缩到48个96孔板中.他将每6块96孔板的克隆混在一起,共形成8个超级池.用70个分子标记进行PCR分析,以超级池质粒为模板通过PCR的方法确定含有目的片段的阳性单克隆.Wang等.构建了尖吻鲈的BAC文库,49152个克隆保存在128块384孔板中,由11个超级池构成,每个超级池分成48个96 孔板,对文库进行超级池,板池和行列池3步法筛选,用24个微卫星和15个EST对文库进行PCR筛选表明文库具有较好的基因组覆盖率.3.2HD杂交膜筛选系统一般材料BAC文库库容量都是数以万计,若同时对这些数目庞大的BAC进行分析,非常困难.常规BAC文库的研究一般都是以尼龙膜为载体,用机械手将整个文库顺序点到膜上.将膜在固体培养基上培养一段时间后进行菌落原位裂解,将DNA结合在膜上,再用特异性探针进行Southern杂交筛选阳性克隆.每张膜可容纳50000以上的克隆.一个库用6—7张膜就可以包括.杂交膜筛选缺点是Southern杂交要用到同位素,存在假阳性和污染,放射性元素对人和环境都会产生影响,成本也高.对于功能基因克隆的筛选,用PCR筛选系统得到的结果比从高密度杂交膜筛选系统得到的结果更为可靠,假阳性少,而且方法简单,快速.但是对于构建大区域的物理重叠群,高密度膜杂交筛选阳性克隆可以一次得到一个标记的所有重叠克隆,更有利于快速的构建BAC重叠群.4展望细菌人工染色体(BAC)具有容量大,易于分离和操作等特性,比其它载体系统构建的基因组文库有更高的覆盖率和稳定性.利用BAC文库容量大的特点,进行基因筛选,目的基因定位,表达调控等研究是BAC文库利用的发展方向.BAC文库将在动物基因资源保存,基因组学,后基因组学等研究中发挥重要的作用.参考文献[1]QuiniouSM,WaldbieserGC,DukeMV,eta1.Afirstgeneration BACbasedphysicalmapofthechannelcatfishgenome.JBMCGe? nomics,2007,8:40.[2]JungS,MainD,StatonM,eta1.Syntenyconservationbetweenthe PrunusgenomeandboththepresentandancestralArabidopsisge- nomes.JBMCGenomics,2006,7:81.[3]ZhebentyayevaTN,Swire-ClarkG,GeorgiLL,eta1.Aframework physicalmapforpeach,amodelRosaceaespecies.JTreeGenetics andGenomes,2008,4:745-756.[4]CookRJ,LloydRS,WagnerC.IsolationandcharacterizationofcD? NAclonesforratliver10?formyhetrahydrofolatedehydrogenase.J BiolChem,1991,266(8):4965-4973.[5]ShizuyaH,BirrenB,KimUJ,eta1.Cloningandstablemaintenanceof300一kilobase—pairfragmentsofhumanDNAinEscherichiacoliU? singanF—factor-basedvector.JProcNatlAcadSciUSA,1992,89: 8794-8797.[6]FrengenE,WeiehenhanD,ZhaoB,eta1.Amodular,positiveselec- tionbacterialartificialchromosomevectorwithmuhiplecloning sites.Genomics,1999,58(3):250-253.[7]HamihonCM.Abinary—BACsystemforplanttransformationwith hjgh—molecular—weightDNA.Gene,1997,200:107?116.[8]HamiltonCM,LewisC,eta1.Stabletransferofintacthighmolecular weightDNAintoplantchromosomes.ProcNatlAcadSciUSA,1996,93(18):9975.[9]HamiltonCM,FraryA,XuYTanksleySD,ZhangHB.Construction 201O年第5期陈献伟等:基因组文库的构建和池化筛选oftomatogenomicDNAlibrariesinbinary-BAC(BIBAC)vector PlantJ.1999,18:223-229.[1O]LiuYG,ShiranoY,FukakiH,eta1.c0mplementationofplantmu—tantwithlargegenomicDNAfragmentsbyatransformation??compe? tentartificialchromosomevectoracceleratespositionalcloning. PNAS,1999,96(11):6535-6540.[11]Rogel—GaillC,BourgeauxN,BillauhA,eta1.Constructionofa swineBAClibrary:applicationtothecharacterizationandmapping ofporcinetypeCendoviralelements.JCytogenetCellGenet, 1999,85:205-211.[12]EggenA,GautierM,BillautA,eta1.Constructionandcharacter- izationofabovineBAClibrarywithfourgenome-equivalentcover. age.JGenetSelEvol,2001,33:543—548.[13]LiuW,ZhaoYH,LiuZL,ZhangY,eta1.Constructionofa7-fold BAClibraryandcytogeneticmappingof10genesinthegiantpanda (Ailuropodamelanoleuca).JBMCGenomics,2006,7:294.[14]QuiniouSM,WaldbieserGC,DukeMV:AfirstgenerationBAC. basedphysicalmapofthechannelcatfishgenome.JBMCGenom- ics,2007,8:40.[15]KimUJ,Bi~enBW,SlepakT,eta1.Constructionandcharactefiza. tionofahumanbacterialartificialchromosomelibrary.JGenom. ics,1996,34:213-218.[16]ZhangY,ZhangX,SeheuringCF,eta1.Constructionandcharac- terizationoftwobacterialartificialchromosomelibrariesofZhikong scallop(ChlamysfarreriJonesetPreston),andidentificationof BACclonescontainingthegenesinvolvedinitsinnateimmunesys—tern.JMarBiotechnol,2008,10:358-365.[17]TaoQZandZhangHB.CloningandstablemaintenanceofDNA fragmentsover300kbinEscherichiacoliwithconventionalplas- mid—basedvectors.JNucleicAcidsRes,1998,26:4901-4909. [18]BendahmaneA.Zero-backgroundplasmidvectorforBAClibraryconstruction.JBioTeehniques,1999,26(2):228—230,232.[19]BonetJ,GironaEL,SargentDJ,eta1.Thedevelopmentandcharac—terisationofabacterialartificialchromosomelibraryforFragariavesca.JBMCResNotes,2009,2:188.[20]WangCM,LoLC,FengF,eta1.ConstructionofaBAClibraryand mappingBACclonestothelinkagemapofBarramundi,Latescal?carifer.JBMCGenomics,2008,9:139.[21]FengJ,VickBA,LeeMK,eta1.ConstructionofBACandBIBAC librariesfromsunflowerandidentificationoflinkagegroup-specific clonesbyovergohybridization.JTheorApplGenet,2006,113:23—32.病毒学精要概览(双语版)科学出版社新书(英)T.斯科恩着,朱俊萍李相辉安静译978—7—03-026886—7$50.002010年3月出版内容简介:本书是CoffeeHouseNotesonVirology一书的中英双语版本,内容涵盖了病毒学的基本原理,概念以及与病毒学密切联系的学科中各项热点议题,例如:病毒和肿瘤,病毒和免疫系统,病毒进化及新病毒等.书中丰富的病毒实例几乎囊括了医学病毒学中所有重要的类群和相关医学问题.本书语言极其精炼,简单,以解答75个问题的形式阐释了病毒学中最普遍的性质和规律,为庞杂丰富的病毒学世界搭建起一个精要概括的知识框架.相信该书有助于普通高等学校和医学高等院校相关专业的本科生,研究生,教师以及相关领域的科研人员在最短的时间内学习和掌握病毒学的基本原理和事实.更希望通过对本书的阅读,激发起读者探索病毒学世界的兴趣.欢迎各界人士邮购科学出版社各类图书(免邮费)邮购地址:北京东黄城根北街16号科学出版社科学出版中心生命科学分社邮编:100717联系人:周文宇(010—64031535)网上订购: 更多精彩图书请登陆网站,欢迎致电索要书目。
・研究报告・生物技术通报BIOTECHNOLOGY BULLETIN2013年第12期酿酒酵母是最简单的真核生物,同时又具有类似原核生物的生长特性,便于培养和进行遗传操作的优点,是一种模式真核生物和模式实验系统,被称为真核生物的“大肠杆菌”[1]。
它与人类的关系极为密切,是人类实践中应用较早的一类微生物[2],同时它也被广泛用作基因克隆和表达的宿主菌。
为了鉴定克隆到酵母细胞内的外源基因,可以通过提取酵母基因组后通过PCR 扩增目的基因、与特异性底物形成水解圈、荧光基团、挑取单克隆进收稿日期: 2013-06-30基金项目:广东省科技计划(2012B020311005)作者简介:武可婧,女,硕士研究生,研究方向:微生物功能蛋白;E -mail :wu.kejing@ 通讯作者:林蒋海,博士,副研究员,研究方向:基因工程,代谢工程;E -mail :jianghai.lin@一种高效快速鉴定酵母转化子的酵母菌落PCR 方法武可婧 吕一鸣 李晶博 肖文娟 龚映雪 刘泽寰 林蒋海(暨南大学生命科学技术学院,广州 510632)摘 要: 酵母是一种重要的基因工程宿主菌,但是由于其细胞壁结构复杂牢固,普通的菌落PCR 方法的成功率较低。
为解决此问题,提供一种快速、简单、高效的酵母菌落PCR 方法。
该方法先利用溶壁酶溶解酵母细胞壁,然后利用热涨裂解细胞并进行PCR 反应。
此方法将酵母细胞裂解和PCR 在同一个PCR 管中完成。
试验结果显示此方法能成功扩增目的基因且成功率高。
将此方法应用于外源性内切葡聚糖酶(endoglucanase,EG)的酿酒酵母转化子筛选,经与基因组PCR 比较,菌落PCR 与基因组PCR 结果一致。
结果证明此方法具有良好的稳定性,适用于酿酒酵母转化子的快速筛选。
关键词: 酿酒酵母 菌落PCR 转化子 阳性克隆A Rapid and Efficient Yeast Colony PCR Method to Identify PositiveTransformantsWu Kejing L ü Yiming Li Jingbo Xiao Wenjuan Gong Yingxue Liu Zehuan Lin Jianghai(School of Life Science and Technology ,Jinan University ,Guangzhou 510632)Abstract: Yeast is an important host microorganism in genetic engineering and molecular cloning. However, because of the complex structure of their cell wall, ordinary colony PCR method has a low success rate. To address this problem, a fast, simple and efficient yeast colony PCR method was provided. In the novel method, a commercial available cell wall degradation enzyme, lyticase, was used to disrupt yeast cell wall and the resulted protoblast was then bursted by heating. Into the lysis mixture, other PCR components were added and PCR reactions were performed. In the current constructed method, the yeast cell lysis and PCR reaction were performed in one single PCR tube, which is convenient and easy to implement. The success rate of the novel method was relatively high compared to traditional ones. Using this method, the Saccharomyces cerevisiae transformants of exogenous endoglucanase(EG)were screened. Compared to PCR using genomic DNA, the results of colony PCR were consistent with those from genomic PCR. The results indicated that the novel method was of good stability, repeatability and suitable for the rapid screening of the S. cerevisiae transformants.Key words: Saccharomyces cerevisiae Colony PCR Transformant Positive clone行菌落PCR 等一系列方法来鉴定酵母转化后的阳性克隆。
两阶段遗传算法的结构及性能分析
刘立民;靳晨霞;杨丽芸;李法朝
【期刊名称】《河北科技大学学报》
【年(卷),期】2007(28)1
【摘要】针对基本遗传算法(简称BGA)常常存在局部收敛以及收敛解精度不高等方面的不足,提出了一种改进的算法--两阶段遗传算法,给出了算法的结构及具体的实施策略,进而利用Markov链理论和仿真技术分析了该算法的收敛性能,结果表明该算法具有操作简单、鲁棒性强等特点,不仅可以有效地避免寻优过程中的"早熟"现象,而且在很大程度上能提高最优解精度,适合于大规模、高精度的优化问题.【总页数】5页(P44-48)
【作者】刘立民;靳晨霞;杨丽芸;李法朝
【作者单位】河北科技大学理学院,河北石家庄,050018;河北科技大学理学院,河北石家庄,050018;河北科技大学理学院,河北石家庄,050018;河北科技大学经济管理学院,河北石家庄,050018
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.基于多层编码遗传算法的两阶段装配式建筑预制构件生产调度优化 [J], 谢思聪;陈小波;
2.基于多层编码遗传算法的两阶段装配式建筑预制构件生产调度优化 [J], 谢思聪;
陈小波
3.基于两阶段遗传算法确定权重的城市信息化模糊综合评价研究 [J], 王宁宁; 赵晓永; 陈锐
4.步行荷载的两阶段遗传算法识别 [J], 王鹏程; 陈隽; 王浩祺
5.NRS-SVM两阶段遗传算法的多晶硅铸锭配料质量分析 [J], 徐静林;黄丽霞;张雪英;李凤莲;杜海文;于丽君;马秀
因版权原因,仅展示原文概要,查看原文内容请购买。
2020年12月Dec.2020第40卷第12期Vol.40,No.12热带农业科学CHINESE JOURNAL OF TROPICAL AGRICULTURE火龙果SSR 分子标记核心引物的筛选①胡文斌1)②林家年2)洪青梅1)李婧1)濮文辉1)何云1)李洪立1)③李琼1)③(1中国热带农业科学院热带作物品种资源研究所海南海口571101;2海南大学热带农林学院海南海口570228)摘要为了筛选出适合火龙果种质资源遗传多样性分析和品种鉴定的SSR 核心引物,以遗传背景差异较大的8份火龙果种质资源对已报道的20对火龙果SSR 引物和本课题组转录组测序开发的100对EST-SSR 引物进行初步筛选,筛选出引物36对。
再利用18份形态差异较大、不同来源的火龙果种质资源对初筛引物进行复筛和验证,筛选出24对SSR 核心引物,并通过遗传多样性分析和聚类分析验证引物的有效性。
24对核心引物对18份火龙果种质资源进行遗传多样性分析,共得到117个等位基因,平均每个位点等位基因数(Na )4.88个,有效等位基因数(Ne )为2.341,期望杂合度(He )为0.516,多态性信息含量指数(PIC )平均为0.471,说明引物的多态性较高,能够有效揭示18份火龙果种质资源的遗传多样性。
筛选出的24对SSR 引物,带型清晰、稳定,多态性较高,可作为核心引物用于现有的火龙果种质资源鉴定和遗传多样性分析等研究。
关键词火龙果;SSR 核心引物;遗传多样性;聚类分析;品种鉴定中图分类号S628;S667.9文献标识码ADOI :10.12008/j.issn.1009-2196.2020.12.007Screening of SSR Core Primers for PitayaHU Wenbin 1)LIN Jianian 2)HONG Qingmei 1)LI Jing 1)PU Wenhui 1)HE Yun 1)LI Hongli 1)LI Qiong 1)(1Tropical Crops Genetic Resources Institute,CATAS,Haikou,Hainan 571101,China;2Institute of Tropical Agriculture and Forestry,Hainan University,Haikou,Hainan 570228,China)Abstract In order to screen out suitable SSR core primers which can accurately evaluate pitaya germplasm resources genetic diversity and identify pitaya cultivars,based on the 8pitaya germplasm resources with distant genetic relationship,20pairs of SSR primers from the articles and 100pairs of SSR primers developed from pitaya transcriptome were initially screened out,there were 36pairs of primers were screened out.Then 18pitaya germplasm resources with different geographical origins and morphological characteristics were chosen to screen the initial selected primers.Finally,a total of 24pairs of SSR core primers were identified.The genetic diversity of 18pitaya germplasm resources was analyzed by these core markers.As a result,117polymorphism bands were acquired.The average number of alleles (Na ),effective alleles (Ne ),and expected heterozygosity (He )are 4.88,2.341and 0.516respectively.The average PIC (Polymorphism information content)value is 0.471.The results showed that SSR primers with high polymorphism can evaluate the genetic diversity of the 18pitaya materials effectively,the 24core primers can produce clear amplification results with good repeatability and high polymorphism,and can be applied to pitaya germplasm resources identification and genetic diversity analysis.Keywords pitaya ;SSR core marker ;genetic diversity ;cluster analysis ;cultivar identification①基金项目:海南省自然科学基金青年基金项目“火龙果种质资源遗传多样性与分子身份证研究”(No.318QN263);中国热带农业科学院基本科研业务费“火龙果种质资源评价与创新利用研究”(No.1630032018035)。
鱼类环境 DNA 研究中通用引物的筛选验证刘军;赵良杰;凡迎春;张新磊;刘其根【摘要】为了筛选一个通用性和适用性良好的能够运用于环境DNA( eDNA)研究的鱼类引物,从相关文献中选取了鱼类线粒体基因组部分片段的5对引物,分别对线粒体D-loop区、16S rRNA基因、 COI基因以及Cytb基因部分片段进行扩增。
对千岛湖48种鱼类基因组DNA进行扩增后比较发现,引物16 s和COI 均可以取得良好的扩增效果,通用性优于其他几对引物。
引物16s的扩增产物经凝胶电泳检测均出现明亮的目的条带,引物COI则有3种鱼的条带经凝胶电泳检测亮度较暗。
利用上述引物对环境样品eDNA扩增时发现,只有16s和COI的引物具有良好的扩增效果,能够得到明显单一的亮带。
对该两种引物的PCR产物克隆后测序比对发现,16s的PCR产物均为千岛湖常见鱼类物种的基因片段, COI 的PCR产物则为细菌COI基因的部分片段。
综上,我们认为引物16s在通用性和适用性上都更为适合作为鱼类群落结构eDNA研究的通用引物。
%In order to screen the primer of well universality and applicability for eDNA research, five pairs of universal primer of fish mitochondrial genome fragment were chosen from the previous references to amplify the partial sequences of D-loop region, 16S rRNA gene, COI gene and Cytb gene.These primers were used to amplify genome of 48 species of fish in Qiandao Lake to test the universality, it was found that the 16s and COI were better than the other primers.Gel e-lectrophoresis showed that all 16s DNA bands of the 48 species of fish was light, but 3 COI gene bands of the fish species was dark.The eDNA from Qiandao Lake were amplified by these five pairs of primer, and the electrophoretogram showed that the PCR product of 16sDNA and COI gene presented a clear bright band.According to the cloned sequencing and BLAST results, the PCR product of 16s DNA was coincident to the fragments of fishes from Qiandao Lake, but the PCR product of COI gene was in accord with the COI gene of bacteria.In summary, the primer of 16S rRNA was the most suit-able universal primer to study on eDNA of fish community structure in the Qiandao Lake.【期刊名称】《淡水渔业》【年(卷),期】2016(046)001【总页数】9页(P9-17)【关键词】引物筛选;线粒体标记;环境DNA;千岛湖【作者】刘军;赵良杰;凡迎春;张新磊;刘其根【作者单位】上海海洋大学农业部淡水水产种质资源重点实验室,上海 201306;上海海洋大学农业部淡水水产种质资源重点实验室,上海 201306;上海海洋大学农业部淡水水产种质资源重点实验室,上海 201306;上海海洋大学农业部淡水水产种质资源重点实验室,上海 201306;上海海洋大学农业部淡水水产种质资源重点实验室,上海 201306【正文语种】中文【中图分类】S917.4环境DNA(eDNA)是指从有机体脱落释放进入到自然环境中(如空气、水、土壤等)的DNA,包括细胞中的DNA和细胞破碎后游离出细胞外的DNA分子。
一种改善双射S盒密码特性的有效算法
陈华;冯登国;吴文玲
【期刊名称】《计算机研究与发展》
【年(卷),期】2004(41)8
【摘要】S盒是许多密码算法中的惟一非线性部件,它的密码强度决定了整个密码算法的安全强度.利用基因算法可以构造出密码特性良好的S盒,实践证明,若能在基因算法的中间过程对子S盒的密码特性作局部优化,将会使算法更加有效.William Millan曾给出一个改善双射S盒的非线性度的算法.而差分均匀性也是衡量S盒密码特性的一个重要指标,研究了如何利用差分矩阵来改善差分均匀性,并给出了一个实用的算法,它能同时改善一个随机选取的双射S盒的非线性度和差分均匀性.【总页数】5页(P1410-1414)
【作者】陈华;冯登国;吴文玲
【作者单位】中国科学院软件研究所信息安全国家重点实验室,北京,100080;中国科学院软件研究所信息安全国家重点实验室,北京,100080;中国科学院软件研究所信息安全国家重点实验室,北京,100080
【正文语种】中文
【中图分类】TP309;TP393.08
【相关文献】
1.一种有效缩减AES算法S盒面积的组合逻辑优化设计 [J], 王沁;梁静;齐悦
2.一种基于质心不变特性的仿射不变纹理特征提取算法 [J], 贾建华;焦李成;黄文涛
3.一种改善双射S盒非线性度的方法 [J], 于亦舟;欧海文
4.一种基于回归估计误差仿射投影算法的统计特性分析 [J], 智永锋;李虎雄;李茹
5.一种基于乘积的仿射密码算法 [J], 樊变霞;石曙东;郑治华
因版权原因,仅展示原文概要,查看原文内容请购买。