refgene命名规则
- 格式:docx
- 大小:9.40 KB
- 文档页数:1
基因命名原则和书写规则基因命名原则和书写规则基因是生物体内遗传信息的基本单位,是通过传递遗传信息来指导蛋白质合成的分子。
基因的命名原则和书写规则对于基因的研究和表达非常重要。
基因的命名原则:1. 基因名称应由基因的首字母和两个对等号组成,对等号左边是前缀,右边是后缀。
2. 前缀表示基因的类型,如 DNA、RNA 或蛋白质。
3. 后缀表示基因的功能,如癌基因、抑癌基因或编码蛋白质的基因。
4. 基因名称不能用数字或缩写字母表示,除非这些数字或缩写字母是公认的通用术语或缩写。
5. 基因名称不能与已知的基因名称重复,除非双方协商同意使用。
基因的书写规则:1. 基因书写应该使用拉丁字母和空格,而不是数字或缩写字母。
2. 基因名称应该按照上述命名原则进行书写。
3. 基因的前缀和后缀应该大写,除非它们是小写字母,如癌基因 C-MYC。
4. 基因名称中的点号应该使用英文逗号而不是中文逗号。
拓展:1. 基因命名的历史:基因命名始于 20 世纪 60 年代,当时科学家们开始使用符号和缩写字母来表示基因。
随着时间的推移,这些符号和缩写字母逐渐演变成了现在的基因名称。
2. 基因的表达方式:基因的表达方式包括 RNA、蛋白质和 DNA 等形式。
RNA 和蛋白质形式的基因通常通过转录和翻译过程来产生。
DNA 形式的基因则是通过细胞分裂和有丝分裂等过程来复制和传递。
3. 基因的调控:基因的表达受到多种因素的影响,包括基因的激活、抑制和剪切等。
基因的调控还可以通过转录因子、酶和蛋白质等生物分子来实现。
基因命名原则和书写规则对于基因的研究和表达非常重要,有助于科学家们更好地理解基因的功能和调控机制。
基因突变命名规则
基因突变命名规则一般遵循以下原则:
1.基因命名:采用大写字母表示基因名,如BRCA1。
2.突变类型:将突变类型作为前缀,如点突变用c.表示,缺失用del 表示,插入用ins表示等。
3.位置表示:位置表示采用cDNA序列为参照基准,如c.123C>T表示第123位碱基从C变为T。
4.突变描述:突变描述以“→”表示,如c.123C>T→p.Leu41Phe表示c.123C>T所引起的氨基酸突变为Leu41Phe。
5.多个突变:多个突变使用“,”分隔,如c.123C>T,c.456C>T表示两个点突变。
6.复杂突变:复杂突变可采用定量描写方法,如c.[123C>T;456A>G]表示两个点突变同时出现。
例如,对于BRCA1基因的突变c.68_69delAG,可以解释为:基因名称为BRCA1,突变类型为缺失(del),位置在cDNA序列的第68-69位上发生,缺失的碱基对为AG。
1.根据突变和表形来命名。
这种最常见,通常是3个字母,这3个字母的选择比较自由,往往都是最初的发现者自由命名的,因为为了防止重复命名,新基因的命名都是需要注册的,所以后来发现的同表形或者近似功能的基因往往在这3个字母后边加上数字加以区分。
同位点的等位基因可以在后面加“-”和数字区分比如某基因叫SGS3(SUPPRESSOR OF GENE SILENCING2),另外一个叫SGS2,这两个符号表示了表形或者功能相近但是不同位点的基因。
而SGS3-11、SGS3-12、SGS3-13表示了SGS3不同等位基因不同的字母大写和小写,正体和斜体可以用来表示不同的类型。
1.1基因型genotype斜体大写字母表示野生型的基因,如:SGS3基因。
斜体小写字母表示突变型基因,如:sgs3基因。
正体大写表示编码产物,比如这样一句话:“SGS3基因编码了SGS3蛋白,与SGS2基因具有近似功能,具有SGS3-11、SGS3-13等多个等位基因,目前已经克隆到了sgs3-11、sgs3-13等多个突变基因,突变位点分别是G->A(719),splice site和T-DNA,SALK039005,insertion in exon 1”。
参考出处:/cgi/content/full/18/19/23681.2表型phenotype字母正体,首字母大写,后边标正负号表示野生型和突变型。
如Sgs3+表示野生型,也就是SGS3基因的表型。
Sgs3-表示突变型,也就是sgs3的表型。
2.根据编码产物命名。
这个需要参考王镜岩、朱圣庚等编写的《生物化学》第三版上册236~332页“酶的命名和分类”。
3.根据可读框或染色体位置命名首两个字母代表物种,后边的数字代表染色体,g代表基因,后边的5个数字代表从染色体上部排到底部的顺序,由于测序时存在缺口,所以后面常常加上“.”和数字,代表这个区段的其他基因。
比如At5g23570.1 其中“At”代表拟南芥(Arabidopsis thaliana),之后的“5”代表2号染色体,“g”代表基因,“23570.1”代表染色体位置,4.其他命名此外还有Gene Ontology(GO分类)、GenBank ID、EST号、KEGG命名等等,特点都是一串数字,这里就不一一介绍了。
基因的命名一般规则
好嘞,以下是为您生成的关于“基因的命名一般规则”的文章:
嗨,朋友们!今天咱们来聊聊基因命名那些事儿。
要说这基因的命名啊,那可是有不少讲究的。
首先呢,基因的名字
得简洁明了,可不能搞那些复杂得让人摸不着头脑的称呼。
比如说,
别弄一堆稀奇古怪的字母组合,让人看了就头疼。
基因名字要具有唯一性,不能跟其他已经存在的基因重名,要不然
科学家们在研究的时候准得乱套。
就像咱们每个人都有自己独一无二
的名字一样,基因也得有自己专属的“名号”。
还有哦,基因的命名得能反映出它的功能或者特点。
比如说,如果
一个基因跟眼睛的发育有关,那它的名字里最好能有点相关的提示,
这样大家一看名字就能大概知道这个基因是干啥的啦。
那啥样的名字不行呢?像那种特别随意、没有任何规律或者含义的
名字,那肯定是不行的。
还有那种特别冗长、复杂,读起来都拗口的
名字,也得被淘汰掉。
给大家举个例子哈,比如说有个基因叫“ABC123”,啥信息也没有,这就很不好。
但要是叫“眼睛发育相关基因X”,是不是一下子就清晰
多啦?
而且呀,基因命名还得遵循国际上的一些通用标准和规范。
这就好比全世界都在说同一种语言,交流起来才方便嘛。
要是每个地方都搞自己的一套,那科学研究还不乱成一锅粥啦。
总之呢,基因的命名可不是随便瞎搞的,得认真、严谨,还得清晰易懂。
这样大家在研究基因的时候,才能顺顺利利,不会被名字给搞晕喽。
好啦,希望我讲的这些能让您对基因的命名规则有个清楚的了解。
下次见咯!。
二代测序基因座命名规则
好嘞,以下是为您生成的“二代测序基因座命名规则”相关文章:嘿,朋友们!今天咱们来唠唠二代测序基因座的命名规则。
这可是个挺重要的事儿,您可得听仔细喽!
先来说说为啥要有这命名规则呢?您想啊,如果大家都随心所欲地给基因座乱起名,那整个科学界不就乱套啦?交流起来也费劲,就像大家都说着不同的语言,谁也听不懂谁。
所以,统一的命名规则那是相当重要,能让咱们的研究更清晰、更高效。
那允许的命名方式是啥呢?首先,得用明确、准确的术语,可不能模模糊糊,让人猜不透。
比如说,得用大家都公认的基因符号和特定的编号。
就像给每个基因座都发了个“身份证”,号码得清楚明白。
那啥是禁止的呢?可千万别自己瞎创造一些稀奇古怪的名字,也别用那种只有自己能懂的代号。
举个例子,您不能因为觉得某个基因座长得像您家的小猫,就给它起名叫“咪咪”,这可不行!
还有啊,命名得遵循一定的逻辑和顺序。
比如说,按照基因在染色体上的位置,从左到右、从上到下,有个清晰的条理。
不能东一榔头西一棒子,今天这么叫,明天又换个名。
总之,这二代测序基因座的命名规则就像是个“交通规则”,让咱们在基因的世界里能有序地“行驶”,不迷路、不出错。
咱们都遵守好这
个规则,就能让基因研究更顺利,说不定哪天就能发现更多神奇的秘密,为人类健康做出大贡献呢!
好啦,希望您记住这些规则,在研究的道路上越走越顺!。
基因工程中常用术语的命名规则肖业臣 魏剑波(华南农业大学蚕丝科学系广东广州510642)1 基因的命名基因符号最初用英文的第1个字母的大写表示。
例如,T代表苏氨酸,T+代表苏氨酸合成酶野生型基因, T-代表苏氨酸合成酶缺陷型基因。
但随着基因数目的增多及众多突变类型的出现,这一套符号已经不够用了。
1906年,M.D e m erec等提出了一套新的基因命名规则:1)每个基因座位用3个小写斜体字母表示,这3个字母来自说明基因特性单词的前3个字母;2)表型相同基因不同的突变型,用3个字母后面加了1个大写字母表示;3)同一基因的不同突变位点用基因符号后面所加的阿拉伯符号表示,如果突变位点所属的基因还不确定,那么大写字母用一短线代替。
根据以上命名规则,组氨酸合成酶基因用h is表示,各个组氨酸合成酶基因用h is A、h is B表示;色氨酸合成酶基因用trp表示,各个色氨酸合成酶基因用trpA、trpB等表示,基因trpA的各个突变型分别用trpA23、trpA46表示。
如果一些基因的特性无法用1个词来表示,就要用2个或3个词的前3个首写字母来表示。
例如,R p l表明基因与核糖体的大亚基有关(由ribo s om al p ro tein large 3个单词的首字母组成)。
R p s则表明基因与核糖体的小亚基有关(由ribo s om al p ro tein s m all3个单词的首字母组成);ri m则与核糖体的装配、成熟有关(由ribo s o2 m al modificati on2个单词的首字母组成)。
表示突变型基因的符号,应该在座位符号右上角加上“+”或“-”来表示。
例如h is A-表示组氨酸缺陷型基因,h is A+表示相应的野生型基因,与链霉素抗药型有关的基因座位称为strR(或str2r),敏感的野生型基因是strS(或str2s)。
另外还有一些常见的基因符号代表特定的意义,譬如,inc代表不亲和性;rep代表复制;tra代表转移;fin代表致育抑制;o ri代表复制起点;D am代表DNA腺嘌呤甲基化酶等等。
1.根据突变和表形来命名。
这种最常见,通常是3个字母,这3个字母的选择比较自由,往往都是最初的发现者自由命名的,因为为了防止重复命名,新基因的命名都是需要注册的,所以后来发现的同表形或者近似功能的基因往往在这3个字母后边加上数字加以区分。
同位点的等位基因可以在后面加“-”和数字区分比如某基因叫SGS3(SUPPRESSOR OF GENE SILENCING2),另外一个叫SGS2,这两个符号表示了表形或者功能相近但是不同位点的基因。
而SGS3-11、SGS3-12、SGS3-13表示了SGS3不同等位基因不同的字母大写和小写,正体和斜体可以用来表示不同的类型。
1.1基因型genotype斜体大写字母表示野生型的基因,如:SGS3基因。
斜体小写字母表示突变型基因,如:sgs3基因。
正体大写表示编码产物,比如这样一句话:“SGS3基因编码了SGS3蛋白,与SGS2基因具有近似功能,具有SGS3-11、SGS3-13等多个等位基因,目前已经克隆到了sgs3-11、sgs3-13等多个突变基因,突变位点分别是G->A(719),splice site和T-DNA,SALK039005,insertion in exon 1”。
参考出处:/cgi/content/full/18/19/23681.2表型phenotype字母正体,首字母大写,后边标正负号表示野生型和突变型。
如Sgs3+表示野生型,也就是SGS3基因的表型。
Sgs3-表示突变型,也就是sgs3的表型。
2.根据编码产物命名。
这个需要参考王镜岩、朱圣庚等编写的《生物化学》第三版上册236~332页“酶的命名和分类”。
3.根据可读框或染色体位置命名首两个字母代表物种,后边的数字代表染色体,g代表基因,后边的5个数字代表从染色体上部排到底部的顺序,由于测序时存在缺口,所以后面常常加上“.”和数字,代表这个区段的其他基因。
比如At5g23570.1 其中“At”代表拟南芥(Arabidopsis thaliana),之后的“5”代表2号染色体,“g”代表基因,“23570.1”代表染色体位置,4.其他命名此外还有Gene Ontology(GO分类)、GenBank ID、EST号、KEGG命名等等,特点都是一串数字,这里就不一一介绍了。
基因大小写规则一、基因大小写规则的那些事儿嘿,小伙伴们!今天咱们来唠唠基因大小写规则这个有趣的话题。
你知道吗?在基因的世界里,大小写可不是随便用的。
基因的命名其实有着一套自己的小规则。
首先呢,很多基因的名字都是由字母和数字组成的。
大写字母在基因命名里常常有着特殊的意义。
比如说,有些基因名称里大写字母开头的部分可能代表着这个基因所属的基因家族或者是某个特定的功能类别。
就像是给基因打上了一个大大的标签,让人一眼看过去就大概知道这个基因和什么相关。
然后呢,小写字母也很重要。
小写字母有时候会用来表示这个基因在家族里的某个具体成员或者是一种特定的变体。
这就好比是家族里的兄弟姐妹,虽然都属于一个家族,但是各自有着小区别,小写字母就起到了这个区分的作用。
再说说在书写的时候。
当我们在科学论文或者是实验报告里提到基因的时候,一定要按照规定的大小写来写。
如果写错了,那可就像是给别人指错了路一样,会让其他研究这个基因的小伙伴们感到很困惑呢。
而且不同的数据库或者研究机构可能会对基因大小写有更细致的要求,这就要求我们要更加细心啦。
还有哦,在基因表达相关的研究里,大小写规则也不能忽视。
因为正确的基因名称书写有助于准确地识别基因,从而能够更好地研究基因的表达模式、调控机制等等。
如果大小写乱了套,可能就会把一个基因的研究数据和另一个搞混,那可就糟糕了。
在遗传学的研究里,大家都遵循着这些基因大小写的规则,这样才能让整个研究领域的交流更加顺畅,就像我们大家都说同一种语言一样。
我们可不能因为大小写这个小细节,就破坏了整个基因研究的大和谐呀。
基因大小写规则虽然看起来是个小事情,但在基因研究这个大舞台上,可是起着很重要的作用呢。
所以咱们一定要好好掌握这个规则,这样才能在基因的奇妙世界里畅游无阻哦。
如何命名人类基因和蛋白朱丽芳一、命名法中包括的基因的种类和定义范围:共13种。
(1)被确定为以单基因孟德尔性状遗传的表型,如BBS1(Bardet.Biedl综合征1,Bardet.Biedl Syndrome 1)。
(2)通过与已知标记连锁或相关分析所显示的贡献于复杂性状的未鉴定基因,如IDDM6(胰岛素依赖性糖尿病6,insulin.Dependent diabetes mellitus 6)。
(3)具有足够的结构、功能和表达数据的克隆DNA片段,如COX8(细胞色素C氧化酶亚单位Ⅷ,cytochrome C oxidase subunitⅧ)(4)假基因(即无功能基因拷贝),如IL9RP1(白介素9受体假基因1,interleukin 9 receptor pseudogene 1)(5)由与一个已知基因重叠的反义链编码的基因,如IGF2AS (胰岛素样生长因子2,反义;insulin—like growth factor 2,Antisense):(6)转录但不翻译的功能DNA片段,如XIST (X (失活)一特异性转录本,X(inactive)-specific transcript)。
(7)与细胞表型相关的一个基因或若干基因,如LOH18CR(杂合性丢失,18,染色体区域1;loss of heterozygosity,18,chromosomal region 1)。
(8)表明一个推测基因的EST簇,如C1ORF1(染色体1开放读框1,chromosome 1 open reading frame 1)。
(9)表达序列片段,按基因组数据库的序数编号,如DXYS155E(附录1)。
(10)由单个mRNA产生的多顺反子基因,但是它们具有独立的编码序列和各自的物理性质,以及不与其他编码序列重叠,如SNURF(SNRPN上游读框,SNRPN upstream reading frame)和SNRPN(小的核内核糖核蛋白多肽N,small nuclear ibonucleoprotein polypeptide N):(11)享有高度相似序列的未知功能基因,如FAM7A1 (序列相似性7家族,成员A1;family with sequence similarity 7,member A1)。
RefGene(Reference Gene)是一种用于命名基因的规则和约定。
它是由NCBI (National Center for Biotechnology Information)开发和维护的一套标准,用于对基因
进行唯一命名和识别。
RefGene的命名规则主要包括以下几个方面:
1. 基因符号(Gene Symbol):每个基因都有一个独特的符号,通常由拉丁字母、阿拉
伯数字和下划线组成。
基因符号应尽可能简洁明了,以方便科研人员在文献和数据库
中进行引用和搜索。
2. 基因全名(Gene Full Name):除了基因符号外,每个基因还有一个完整的名称,通常由单词和短语组成。
基因全名应该描述基因的功能、特征或所在的生物过程等信息。
3. 基因别名(Gene Alias):有些基因会有多个别名,用于指代同一个基因。
这些别名
可以是基因的简称、缩写、同义词等。
基因别名有助于在不同研究领域和数据库中对
同一基因进行关联和检索。
4. 基因家族(Gene Family):相似功能或结构的基因会被归类为一个基因家族。
基因
家族通常具有相似的命名规则和命名前缀,以便区分和识别。
需要注意的是,RefGene的命名规则是一套国际通用的标准,但在不同的研究领域和数据库中,可能存在一些特定的命名约定和规则。
因此,在具体的研究或数据库中使用RefGene命名时,还需结合相关的规范和要求进行命名和解读。