论文总字数:26553字
摘 要
已经将水稻基因组数据库中的138个ERF基因进行了生物信息学分析,通过建立并对各种植物的ERF转录因子进化树图进行比对来为保守基因序列的寻找做铺垫,显示水稻ERF转录因子家族分成5个亚家族。通过MEME和MAPINSPCET来进一步进行保守基因序列分析,得出水稻中的ERF转录因子不仅含有我们已知ERF家族中经典的保守基序1和2,而且含有部分相对保守的基序,我们已经分析出最小的基序至少有13个氨基酸,最大的基序有21个氨基酸,最后再通过建立热图来对ERF转录因子在多个时期中的多种组织内表达情形进行聚类分析,并且发现ERF基因的表达已经与水稻各个部分的生长调控过程有关,而且互相有差异的基因在基因表达谱上却能有相近表达变化。关键词: MEME,MAPINSPCET,保守基因序列,ERF转录因子,水稻
ABSTRACT: The 138 erf genes in the rice genome database have been bioinformatically analyzed, and the search for conserved gene sequences has been paved by establishing and comparing the erf transcription factor evolution tree maps of various plants. The results of this figure show that the rice erf transcription factor family is divided into five subfamilies. Furthermore, the meem and mapinspcet were used to establish the pattern to further carry out the conserved gene sequence analysis. It was concluded that the rice erf transcription factor not only contains the classical conserved motifs 1 and 2 of the erf family, but also some relatively conservative motifs. These motifs contain at least 13 motifs. amino acid residues, up to 21 amino acid residues, and finally clustered the expression of erf transcription factor family in different tissues and different growth stages by establishing a heat map, and found that the expression of related genes has been involved in different tissues of rice. During the entire growth process, different gene subclasses have similar expression profile changes.
KEYWORDS:MEME, MAPINSPCET, CONSERVED GENE SEQUENCE, ERF TRANSCRIPTION FACTOR, RICE
目 录
1 引言 3
1.1 AP2/ERF基因的研究起源 3
1.1.1 水稻AP2/ERF基因家族的研究意义 3
1.1.2 AP2/ERF转录的研究进展 4
1.1.3 本次研究的重要切入方式 5
1.2 AP2/ERF基因家族介绍 6
1.2.1 AP2/ERF基因家族的成员 6
1.2.2 AP2/ERF 类转录因子与信号转导通路 8
1.2.3 AP2/ERF 转录因子与基因相互作用 10
1.3 本研究的目的和意义 13
2 材料与方法 13
2.1 水稻ERF基因的生物信息学分析 13
2.2 ERF保守序列的鉴定和分析 17
2.4水稻ERF转录因子的保守基序分析 20
2.5水稻ERF转录因子家族所在染色体区段复制分析 22
2.6ERF转录因子家族在水稻不同组织中的表达模式分析 22
结论 24
致谢 27
1 引言
水稻是世界上最重要的主食之一。 全球对水稻和其他食品的需求随着世界人口的剧增而不断增加。中国是很早就开始农耕,大约在5千年前就已经开始种植水稻,因此在当今中国,水稻成为了主要的农作物[1]。近代以来,水稻的育种在历史上总共经历了三次重大革命,包括50年代所进行得水稻的矮化育种,于1970左右进行的水稻的杂交性状育种,以及于1980年左右才开始尝试的相关的超级水稻育种。通过具有优势的植物杂交实验,我们可以有效的提高相关作物的产量和质量。另外,由于土壤的盐碱化程度增加导致耕地流失、非生物环境条件的破坏和干旱是主要的环境因素。这对小麦和其他作物的生产力和产量有重要影响。因此,了解小麦对盐的反应,并培育改良型耐盐的小麦品种对我国粮食安全的未来是至关重要的。
1.1 AP2/ERF基因的研究起源
在1994年,JOFUKU等人[2]从拟南芥WAL-MART中分离出一个独特的AP2基因。该基因对花生生长发育具有一定的影响。它包含两个AP2/ERF乙烯响应因子结构域。在90年代OHME TAKAGI和SHINSHI[3]获得并分离了烟草中的效应蛋白结合元件,它们分别是ERF1、2、3、4,并且发现相对十分保守的ERF结构域在这些效应蛋白结合原件中都可以被发现。到1999年, KAGAYA从拟南芥中获得了全长CDNARAV1,RAV2。研究还发现,RAV1和RAV2基因表达的蛋白质包含一个B3基因域和一个AP2/ERF基因域[4],AP2/ERF基因家族是一个超基因家族。包含大约70个氨基酸组成的AP2/ERF基因域。我们还发现这些结构域存在于大多数植物中,但不同植物中与AP2/ERF相关的转录因子的数量基本不同[5]。AP2/ERF基因家族成员对植物有很大的影响。它们可以调节多种植物生物学过程,包括但不限于花的生长、果实的发育、种子的成熟和对环境压力的抵抗。此外,我们发现植物中与AP2/ERF相关的转录因子能够对植物中水杨酸、茉莉酸、乙烯、脱落酸等物质进行一定程度的调控,同时他们可以作为重要的链接因子以在众多应激信号交叉途径中产生巨大的作用。
1.1.1 水稻AP2/ERF基因家族的研究意义
目前,土壤干旱、气候低温和土壤盐碱化是影响作物生长发育的最重要的压力相关因素,最终导致作物减产和基本作物灭绝。这些问题也被称为非生物胁迫[6]。我们还发现,作物对非生物胁迫的抗性主要是由多个基因位点控制引起,形成的一种复杂数量性状。然而,我们很难通过传统的育种方法获得看似全面的抗病品种[7]。目前,利用分子生物学技术对作物中复杂抗应力分子的作用机理进行了研究已经取得了良好的效果。我们已经鉴定并克隆了许多与应激反应相关的基因。然而,植物应激反应是一个涉及许多基因的重要调控过程,调控过程非常复杂,因此使用单一抗逆境基因培育转基因抗逆境作物的效果并不理想[2]。然而,我们发现转录因子TF可以积极调节一系列与应激抵抗相关的重要基因的表达,并在应激抵抗中发挥更为明显的作用,故而逆境相关转录因子的遗传转化是提高作物抗逆境能力的一种有效途径[8]。
1.1.2 AP2/ERF转录的研究进展
植物通过一系列机制保护自己免受病原体攻击,包括预先形成和诱导的反应。 可以在整个植物中诱导防御并且取决于病原体的感知。 本地化和系统性防御依赖于激活导致诱导防御基因表达的一种或多种信号传导途径。这些途径受水杨酸(SA),茉莉酸(JA)和乙烯(ET)或其衍生物的调节。这些途径与对不同类型病原体的抗性有关,而植物对抗死体病原体的抵抗能力主要源自于JA和ET及其衍生物。在许多情况下,JA和ET途径已被证明可以调节相似类型的防御基因。转录因子,也被称为反式作用因子,是顺式作用元件,通常位于基因启动子处。通过相互作用,甚至与其他蛋白质的相互作用,相应的靶基因可以在不同的环境中调节和表达。在非生物胁迫环境中,作物会感受到干旱、低温等胁迫信号,刺激转录因子与相关顺式作用元件之间的相互作用,激活RNA聚合酶的转录复合物,从而触发特定基因的转录和表达,然后通过特异性的调控作用,使作物在干旱、低温等条件下生长[9]。我们可以找到在植物抗逆境中起重要作用的转录因子,并进一步利用这些高表达基因进行植物抗逆境研究。AP2/ERF转移基因因子家族是仅在植物中含有的一类特殊因子,我们发现在某些植物中这个家族至少会有170个成员以上。并且根据它包含的AP2/ERF结构域数量上的差异,我们可以发现该家族成员可以被分类为ERF亚家族含1个AP2/ERF结构域以及AP2亚家族含2个AP2/EREP2亚家族含2个AP2/EREP2亚家族家族含2个AP2一个域[10]。EREBP子家族也可分为DREB和ERF。EREBP亚家族的大多数转录因子在植物抗逆境中起着重要作用[10, 11]。我们发现AP2亚科的成员在花和种子的生长发育和茎芽尖分化中的分生组织[12] 起着重要作用。目前国内外对ERF转录因子进行了广泛的研究,从高羊茅[13]、水稻[14, 15]、烟草[16]、大麦[17]、棉花[18]、大豆[19]、拟南芥[20, 21]中成功分离鉴定了AP2/ERF转录因子的先例。
1.1.3 本次研究的重要切入方式
鉴于不同的ERF基因可能在不同物种之间有不同的应对盐和干旱胁迫的作用,研究小麦特异性ERF基因对了解ERF在小麦中的调节功能非常重要。通过计算机分析拟南芥的AP2 / ERF结构域氨基酸序列,再从表达的序列中鉴定出ERF基因,虽然功能特征很少,但可以发现小麦ERF的异位表达蛋白质TAERF1,属于ERF亚家族的B-2组,可以提高对盐,干旱和寒冷胁迫的耐受性,以及对转基因植物中的细菌病原体丁香假单胞菌的抗性。小麦ERF的过表达转录激活因子TAPIEP1,属于B-3 ERF组,增强转基因小麦中的对土壤真菌感染的抵抗力。从小麦中分离出盐响应性ERF基因TAERF4,属于B-1亚组; TAERF4的异位表达拟南芥增强对盐胁迫的敏感性。水稻ERF基因AP37和AP59的表达增强了水稻在营养生长期的耐旱性。AP37的过量表达提高了在严重的干旱和正常的生长条件下两者的籽粒产量,而AP59的过表达则相反。
基因芯片是重要的研究方式,基因芯片技术分析基因表达谱是一种非常有效的方式,它可以用于发现处于不同抗逆条件下发生的差异表达基因,从而获取基因表达和功能相关的信息[22]。我们可以通过基因芯片技术,来研究处于不同逆境环境下的AP2/ERF基因表达的情况,得以筛选出由于寒冷、高盐浓度以及极端干旱环境导致的出现特殊表达的有关基因,利用PCR定量的方法来对我们的实验结果进行专业分析鉴定,将具有显著差异表达的相关基因标注提取,以作为重要的基础数据来进行关于AP2/ERF基因家族的更加深入的研究。
1.2 AP2/ERF基因家族介绍
1.2.1 AP2/ERF基因家族的成员
AP2/ERF基因家族的转录因子约占植物总表达转录因子的8%。AP2/ERF基因家族与目前已知的各种植物生长发育有着不可分割的关系。例,在植物的分生组织中,可以回应植物抵抗生物和非生物的压力,调节基因表达,甚至刺激类固醇反应等。AP2/ERF基因家族目前仅在植物中有所发现。根据AP2/ERF域的特点,我们可以将其划分为三个亚科。第一个是ERF基因亚家族,通常包含一个AP2保守域;第二个包含两个AP2域;第三个包含一个AP2域和一个B3域。此外,我们可以根据AP2基因保守域内不同的氨基酸将AP2基因分为两类,即CBF/DREB和ERF。
1.2.2 AP2/ERF 类转录因子与信号转导通路
为了克服生物胁迫危害,例如病虫害与真菌,以及非生物胁迫环境危害,例如干旱,寒冷与高盐。故而在不利的环境条件下, 植物早就有了成套的应对机制, 这些回应方式同时与多种信号途径相关联, 这些信号途径往往是相互交叉的,当然亦有相对独立的信号途径。我们可以发现在抵御生物胁迫[23]威胁会伴有大量信号交叉途径,同时在抵御非生物胁迫[24]或者两者[25]时,这些信号交叉途径也被充分激活。水杨酸(Salicylic Acid, SA)、植物激素脱落酸(Abscisicacid, ABA)、乙烯(Ethylene, ET)、茉莉酸(Jasmonate, JA)等等相关的信号通路运行以及这些植物激素相互之间的作用,可以为植物抵抗生物胁迫危害和非生物胁迫危害做出巨大的贡献。在这些植物激素中,植物激素脱落酸(Abscisicacid, ABA)甚至于几乎参与了每一种胁迫反应。大量重要的信号分子进行调节对逆境的抵御方式都是通过拮抗与协同作用的。另一方面在植物处于逆境情况下的胁迫信号交叉途径中,ERF亚家族成员经常作为中间反应的连接因子,去广泛的参与胁迫信号途径。
表 3 植物中转录因子情况[26]
植物种类 | 基因数量 | 转录因子 | AP2/ERF类转录因子 |
拟南芥 | 27228 | 2437 | 166 |
大豆 | 46430 | 5671 | 381 |
杨树 | 45654 | 2758 | 211 |
苹果 | 57386 | 4021 | 274 |
葡萄 | 33514 | 2080 | 145 |
水稻 | 40577 | 2798 | 188 |
玉米 | 32540 | 5246 | 330 |
高梁 | 34496 | 2312 | 161 |
表 4 不同物种间 AP2/ERF 转录因子的分类情况[26]
分类 | 拟南芥 | 水稻 | 玉米 | 杨树 | 葡萄 | 小麦 | 大麦 | 苹果 | |
DRE亚家族 | A1 | 6 | 10 | 10 | 6 | 7 | 39 | 9 | 1 |
A2 | 8 | 4 | 4 | 18 | 4 | 5 | 3 | 0 | |
A3 | 1 | 1 | 1 | 2 | 0 | 0 | 2 | 0 | |
A4 | 16 | 15 | 11 | 26 | 13 | 1 | 1 | 9 | |
A5 | 16 | 13 | 13 | 14 | 7 | 4 | 1 | 4 | |
A6 | 10 | 9 | 10 | 11 | 5 | 8 | 2 | 4 | |
共计 | 57 | 52 | 49 | 77 | 36 | 57 | 18 | 18 | |
ERF亚家族 | B1 | 15 | 16 | 24 | 19 | 7 | 7 | 5 | 8 |
B2 | 5 | 16 | 17 | 6 | 3 | 19 | 12 | 5 | |
B3 | 18 | 18 | 11 | 35 | 37 | 8 | 1 | 9 | |
B4 | 7 | 9 | 8 | 7 | 4 | 4 | 1 | 2 | |
B5 | 8 | 6 | 9 | 8 | 4 | 0 | 0 | 2 | |
B6 | 12 | 14 | 15 | 16 | 18 | 9 | 3 | 7 | |
共计 | 65 | 79 | 84 | 91 | 73 | 47 | 22 | 33 | |
AP2亚家族 | 18 | 26 | 31 | 26 | 18 | 9 | 8 | 5 | |
RAV亚家族 | 6 | 7 | 2 | 5 | 4 | 3 | 4 | 2 | |
总计 | 147 | 164 | 167 | 200 | 132 | 117 | 53 | 58 |
1.2.3 AP2/ERF 转录因子与基因相互作用
植物防御反应的调节是复杂的,许多转录因子家族起着重要的作用。人们对在植物防御中鉴定和利用关键转录因子以设计增加对农业中植物病原体的抗性具有相当大的兴趣。正在探索的一个转录因子家族是ET反应因子(ERF)家族,其成员是JA和ET途径的整合点。在拟南芥中,由AP2 / EREBP基因家族编码的蛋白质在整个植物生命周期中具有不同的功能,包括发育的调节,对诸如干旱和寒冷等非生物胁迫的响应,以及诸如真菌病原体感染等生物胁迫的应对。 AP2 / EREBP家族分为RAV,AP2和EREBP亚家族,EREBP亚家族分为DREB或A亚组和ERF或B亚组。 ERF或B子组包含65个ERF基因并包含与疾病抗性反应相关的所有AP2 / EREBP基因。 ERF基因已被证明对JA和ET都有反应,同时在番茄中揭示了PTO R蛋白在识别番茄后对ERFS PTI4和PTI5类似的结构单元的直接调节常常出现在同一个种类的基因家族或者亚家族中,也因此常常具有相似的功能。ERF转录因子可以通过进行拮抗或激活来对植物逆境基因进行重要的表达调控。而烟草 NTERF3、拟南芥 ATERF3和 ATERF4中常含有的 EAR 结构, 这会抑制含有GCC-BOX的相关基因的表达能力[27]。PAN 等在番茄中获取并克隆了一种种 ERF 转录因子 ,并且将其命名为SLERF3, 这种转录因子可以被寒冷、盐、干旱、细菌、植物激素等诱导表达[28]。再通过分子生物学的手段将 EAR 结构域删去,就可以产生具有重要的转录因子活性的SLERF3DRD蛋白。在植物中过量表达的的SLERF3 基因能够抑制植株生长。但是转 SLERF3DRD 蛋白基因的植物却能够进行正常的生理活动, 并且高量表达的 SLERF3DRD蛋白基因可以调控基因PR2、PR1、和 PR5 的适量表达, 以此来使得植物获得更好的抵抗力。过量表达 ERF2可以诱导 PDF1.2基因的相关表达,这在转基因的拟南芥中已经可以确认,然而ERF4 过量表达又将会抑制相关基因的表达,例如PDF1.2 基因[29]。通过这里,可以发现ERF转录因子在植物中通常起到阻抑作用[30], 相反常起到激活活性的往往是不带有ERF结构域的转录因子。ERF1可以诱导植物防御素基因 PDF1.2 的表达[31]。另外拟南芥中CBF1 蛋白的AP2/ERF结构域不但可以与DRE/CRT元件, 在另一方面可以与GCC元件作用[32]。这是因为在上游的两种作用元件均有核心序列–CCGNC–,故而它们都具有相似的结合活性。又因为GCC盒是位于耐干旱、耐盐、耐低温有关的转录因子的上游区域, 所以GMERF3基因可以与GCC盒进行紧密的结合。SASAKI 等在烟草中获取了两种 AP2/ERF相关蛋白, 分别为WRAF1蛋白和WRAF2蛋白, 它们都具有相似的AP2结构域[33]。经过比对我们发现WRAF1以及WRAF2两种蛋白 在正常情况下的老叶、新叶、花、根、叶柄、茎秆并没有表达。但是经过伤害诱导之后, 这两种蛋白的出现频率比TPOXN1基因诱导的蛋白高。SASAKI等[33]研究发现在T0代的转基因烟草中即使WRAF1 以及WRAF2 基因过度表达了,但是植物的表型依然正常, 然而当实验进行到T1代, 却会出现矮化表型,而且无法开花, 这个实验依旧表明不管是WRAF1 还是WRAF2基因的过度表达都是会阻碍烟草植物的正常发育生长。
越来越多的证据表明,ERF蛋白在调节植物生物和非生物应激反应中起着至关重要的作用。小麦ERF在耐盐调控中的作用和机制研究对于理解植物适应盐碱环境的方式至关重要。包括ERF在内的TF通常在对非生物和生物胁迫的响应中被上行调节,这些调控反应通常很快。用盐或PEG溶液冲洗后土壤,TAERF3转录本诱导的程度和峰值叶子中的叶子比在根中观察到的更低更慢,表明TAERF3对耐盐应激的反应可能在应激定位组织中发生。这些数据表明TAERF3可能是小麦的重要正调节效应物来适应干旱和盐胁迫。某些植物激素,包括ABA和乙烯,在植物应对环境威胁的信号通路中起关键的作用。某些ERF蛋白,如TSRF1是乙烯信号整合的分子节点和ABA信号通路。我们以前的研究表明TAERF3是乙烯诱导型,在施用ABA合成抑制剂去抑制NA2WO4后,暗示TAERF3对ABA呈阳性反应。为了了解TAERF3响应的分子基础,我们分析了TAERF3启动子中的顺式作用元件,显示了启动子TAERF3的序列含有乙烯响应元素(GCC盒)和ABA响应元件(ACGT和ABRE),这可能部分有助于TAERF3的反应激素应用。
为了阐明拟南芥ERF家族中基因之间的系统发育关系,使用AP2 / ERF结构域的氨基酸序列进行多重比对分析表明在122种蛋白质中,氨基酸残基甘氨酸-4,天冬氨酸-6,谷氨酸-16,色氨酸-28,亮氨酸-29,甘氨酸-30和丙氨酸-38完全保守的[34]。 此外,超过95%的ERF家族成员含有精氨酸-8,甘氨酸-11,异亮氨酸-17,精氨酸-18,精氨酸-26,丙氨酸-39,天冬氨酸-43和天冬酰胺-57残基[35]。这种相同的比对表明七种蛋白质的AP2 / ERF结构域的C末端区域与共有序列具有非常低的同源性。 该区域对应于Α-螺旋的C-末端一半,其中包括高度保守的残基天冬氨酸-43和天冬酰胺-57。
图2.来自拟南芥ERF蛋白的AP2 / ERF结构域的比对。
注:黑色和浅灰色阴影表示相同和保守的氨基酸残基。 深灰色阴影表示VI-L组或组中的保守氨基酸残基。 黑色条和箭头分别代表AP2 / ERF结构域内预测的Α-螺旋和B-片区域。星号表示直接与DNA接触的氨基酸残基[35]
1.3 本研究的目的和意义
本研究旨在加深对AP2/ERF基因在水稻抗逆性机制上相关作用和机制的理解,并且希望我们可以在尽力丰满研究成果的同时,为水稻种质抗逆性能力上进行改良并且为更加高的品质和高的产量育种实验提供力所能及的帮助。主要目的有:(1)明确是否AP2/ERF对植物抗逆性有巨大帮助;(2)明确某种由AP2/ERF引发的抗逆性通路的过程;(3)阐明某种AP2/ERF基因引发的抗逆性通路的作用机制。
2 材料与方法
2.1 水稻ERF基因的生物信息学分析
在水稻基因组数据库中共鉴定出138个ERF转录因子(表5),通过数据分析,我们可以发现这些基因号中分子量范围在13306.5(ERF129)-58748.3(ERF110)之间,并且等电点的范围在4.2163(ERF6)- 11.5575(ERF21)之间,而表达出的蛋白质大小范围为125AA(ERF129)-542AA(ERF110)。
表 5水稻ERF转录因子家族基因的基本信息
序号 | 基因号(MSU) | 染色体位置(MB) | 蛋白大小(AA) | 分子量(DA) | 等电点(PI) | 基因号(RAP) |
---|---|---|---|---|---|---|
ERF1 | OS01G04020 | 1,746,418 | 339AA | 36528.6 | 4.5185 | OS01G0131600 |
ERF2 | OS01G07120 | 3,357,287 | 282AA | 31591.5 | 6.073 | OS01G0165000 |
ERF3 | OS01G10370 | 5,454,554 | 229AA | 24558.4 | ***19 | OS01G0200600 |
ERF4 | OS01G12440 | 6,813,714 | 381AA | 40507.3 | 4.5781 | OS01G0224100 |
ERF5 | OS01G21120 | 11,783,910 | 208AA | 22302.2 | 7.1866 | OS01G0313300 |
ERF6 | OS01G46870 | 26,734,014 | 300AA | 31538.7 | 4.2163 | OS01G0657400 |
ERF7 | OS01G54890 | 31,567,891 | 238AA | 24000.2 | 10.9079 | OS01G0752500 |
ERF8 | OS01G58420 | 33,766,979 | 236AA | 24270.5 | 9.9084 | OS01G0797600 |
ERF9 | OS01G59780 | 34,574,832 | 275AA | 29716.1 | 4.8336 | OS01G0813300 |
ERF10 | OS01G64790 | 37,589,452 | 352AA | 36316.6 | 6.3474 | OS01G0868000 |
ERF11 | OS01G66270 | 38,489,525 | 190AA | 19825.1 | 7.977 | OS01G0885900 |
ERF12 | OS01G73770 | 42,727,426 | 220AA | 23817.6 | 6.1627 | OS01G0968800 |
ERF13 | OS02G06330 | 3,164,423 | 204AA | 20556.6 | 5.6365 | |
ERF14 | OS02G09650 | 4,958,350 | 200AA | 21092.6 | 8.2356 | OS02G0189500 |
ERF15 | OS02G10760 | 5,688,698 | 206AA | 22444.2 | 9.3301 | OS02G0202000 |
ERF16 | OS02G13710 | 7,365,220 | 248AA | 25408.4 | 4.9562 | |
ERF17 | OS02G29550 | 17,575,129 | 223AA | 25330.5 | 9.3184 | OS02G0499000 |
ERF18 | OS02G32040 | 18,923,622 | 240AA | 25158.2 | 4.5898 | OS02G0520000 |
ERF19 | OS02G32140 | 18,986,678 | 261AA | 26408.7 | 10.3516 | OS02G0521100 |
ERF20 | OS02G34260 | 20,491,113 | 218AA | 22448.3 | 11.1567 | OS02G0546600 |
ERF21 | OS02G34270 | 20,498,875 | 217AA | 22518.4 | 11.5575 | |
ERF22 | OS02G35240 | 21,184,134 | 171AA | 18048.2 | 5.3043 | OS02G0558700 |
ERF23 | OS02G38090 | 23,024,797 | 346AA | 35945.6 | 7.5738 | OS02G0594300 |
ERF24 | OS02G42585 | 25,595,412 | 474AA | 50587.5 | 7.7256 | OS02G0638650 |
ERF25 | OS02G43790 | 26,422,182 | 304AA | 31632.1 | 6.3008 | OS02G0654700 |
ERF26 | OS02G43820 | 26,456,450 | 345AA | 36329.6 | 5.7499 | OS02G0655200 |
ERF27 | OS02G43940 | 26,524,573 | 288AA | 29450.3 | 4.7425 | OS02G0656600 |
ERF28 | OS02G43970 | 26,550,915 | 226AA | 23144.5 | 5.0812 | OS02G0657000 |
ERF29 | OS02G45420 | 27,621,211 | 262AA | 26965.8 | 5.5747 | OS02G0676800 |
ERF30 | OS02G45450 | 27,652,935 | 225AA | 30638.7 | 4.9599 | OS02G0677300 |
ERF31 | OS02G51670 | 31,648,468 | 339AA | 36300.5 | 8.098 | OS02G0752800 |
ERF32 | OS02G52670 | 32,204,392 | 243AA | 25789 | 6.9863 | OS02G0764700 |
ERF33 | OS02G54050 | 33,107,745 | 212AA | 22783.5 | 6.6764 | OS02G0781300 |
ERF34 | OS02G54160 | 33,199,809 | 366AA | 40141.5 | 4.644 | OS02G0782700 |
ERF35 | OS02G55380 | 33,920,240 | 173AA | 18704.8 | 6.9454 | OS02G0797100 |
ERF36 | OS03G05590 | 2,800,290 | 142AA | 15268.7 | 6.7995 | OS03G0150200 |
ERF37 | OS03G07830 | 3,984,900 | 319AA | 33456.5 | 6.3088 | OS03G0174400 |
ERF38 | OS03G07940 | 4,056,779 | 45040.5 | 10.9157 | OS03G0176300 | |
ERF39 | OS03G08460 | 4,343,725 | 327AA | 35853 | 6.1932 | OS03G0182800 |
ERF40 | OS03G08470 | 4,348,671 | 335AA | 35760.5 | 6.0764 | OS03G0183000 |
ERF41 | OS03G08490 | 4,367,117 | 322AA | 3380*** | 4.7462 | OS03G0183200 |
ERF42 | OS03G08500 | 4,372,115 | 330AA | 35304.8 | 4.3121 | OS03G0183300 |
ERF43 | OS03G09170 | 4,780,241 | 298AA | 31792.9 | 6.5073 | OS03G0191900 |
ERF44 | OS03G15660 | 8,635,965 | 259AA | 26070 | 5.3077 | OS03G0263000 |
ERF45 | OS03G22170 | 12,713,329 | 244AA | 26170.4 | 6.5475 | OS03G0341000 |
ERF46 | OS03G60120 | 34,192,417 | 242AA | 25487 | 10.8382 | OS03G0815800 |
ERF47 | OS03G64260 | 36,301,489 | 226AA | 24165 | 6.5094 | OS03G0860100 |
ERF48 | OS04G18650 | 10,317,017 | 129AA | 14193.6 | 5.957 | OS04G0257500 |
ERF49 | OS04G32620 | 19,651,659 | 269AA | 27806 | 10.2157 | OS04G0398000 |
ERF50 | OS04G32790 | 19,790,424 | 293AA | 29764.3 | 4.3061 | OS04G0399800 |
ERF51 | OS04G34970 | 21,248,865 | 245AA | 24655 | 7.6742 | OS04G0429050 |
ERF52 | OS04G44670 | 26,438,507 | 467AA | 49861.4 | 8.9509 | OS04G0529100 |
ERF53 | OS04G46220 | 27,370,862 | 319AA | 33140.8 | 4.7654 | OS04G0546800 |
ERF54 | OS04G46240 | 27,398,303 | 319AA | 33819.7 | 4.8782 | OS04G0547500 |
ERF55 | OS04G46250 | 27,408,986 | 329AA | 34816.6 | 5.2234 | OS04G0547600 |
ERF56 | OS04G46400 | 27,517,205 | 285AA | 29618.3 | 5.0673 | OS04G0549700 |
ERF57 | OS04G46410 | 27,523,400 | 248AA | 26202 | 4.5625 | OS04G0549800 |
ERF58 | OS04G46440 | 27,539,878 | 218AA | 23014.6 | 5.2825 | OS04G0550200 |
ERF59 | OS04G48350 | 28,820,861 | 220AA | 23899.7 | 5.36 | OS04G0572400 |
ERF60 | OS04G52090 | 30,939,177 | 223AA | 22798 | 10.2507 | OS04G0610400 |
ERF61 | OS04G55520 | 33,030,611 | 234AA | 25434.2 | 10.0932 | OS04G0648900 |
ERF62 | OS04G56150 | 33,437,188 | 140AA | 14868.6 | 5.1887 | OS04G0655700 |
ERF63 | OS04G57340 | 34,133,866 | 191AA | 19890.5 | 9.3677 | OS04G0669200 |
ERF64 | OS05G25260 | 14,662,779 | 282AA | 30331 | 10.3509 | OS05G0316800 |
ERF65 | OS05G27930 | 16,296,914 | 374AA | 40473.1 | 4.4881 | OS05G0346200 |
ERF66 | OS05G28350 | 16,600,597 | 270AA | 27626.8 | 7.8566 | OS05G0351200 |
ERF67 | OS05G29810 | 17,246,963 | 199AA | 20772.2 | 7.7097 | OS05G0361700 |
ERF68 | OS05G34730 | 20,601,261 | 198AA | 20067.4 | 9.8746 | OS05G0420300 |
ERF69 | OS05G36100 | 21,404,554 | 365AA | 37064.1 | 4.9708 | OS05G0437100 |
ERF70 | OS05G37640 | 22,029,223 | 396AA | 41158.5 | ***712 | OS05G0448675 |
ERF71 | OS05G39590 | 23,247,649 | 262AA | 27689.2 | 4.8025 | OS05G0473300 |
ERF72 | OS05G41760 | 24,427,885 | 190AA | 19789.3 | 10.1626 | OS05G0497200 |
ERF73 | OS05G41780 | 24,444,060 | 237AA | 24113.3 | 9.3484 | OS05G0497300 |
ERF74 | OS05G49010 | 28,109,440 | 283AA | 30273.6 | 8.2477 | OS05G0564700 |
ERF75 | OS05G49700 | 28,499,349 | 274AA | 2970*** | 10.119 | OS05G0572000 |
ERF76 | OS06G03670 | 1,434,731 | 215AA | 23110.5 | 4.7872 | OS06G0127100 |
ERF77 | OS06G06540 | 3,067,709 | 343AA | 36458.5 | 4.6277 | OS06G0160500 |
ERF78 | OS06G06970 | 3,310,866 | 254AA | 27668.2 | 10.7473 | OS06G0165600 |
ERF79 | OS06G07030 | 3,337,083 | 185AA | 19678.1 | 11.1922 | OS06G0166400 |
ERF80 | OS06G08340 | 4,040,908 | 179AA | 19168.3 | 6.0005 | OS06G0181700 |
ERF81 | OS06G09390 | 4,731,330 | 363AA | 39764.3 | 4.5227 | OS06G0194000 |
ERF82 | OS06G09717 | 4,960,147 | 208AA | 22187.5 | 4.5266 | OS06G0197600 |
ERF83 | OS06G09760 | 4,972,237 | 125AA | 13393.2 | 9.7514 | |
ERF84 | OS06G09790 | 4,991,219 | 210AA | 23022.6 | 4.6622 | |
ERF85 | OS06G09810 | 4,998,064 | 208AA | 21805.4 | 4.6033 | |
ERF86 | OS06G10780 | 5,629,416 | 278AA | 29197.5 | 4.9661 | |
ERF87 | OS06G11860 | 6,304,588 | 361AA | 37817.3 | 7.1939 | OS06G0222400 |
ERF88 | OS06G11940 | 6,358,046 | 224AA | 24191 | 4.6858 | OS06G0223100 |
ERF89 | OS06G36000 | 21,040,713 | 266AA | 27366.6 | 4.5754 | OS06G0553700 |
ERF90 | OS06G40150 | 23,898,256 | 244AA | 25396.5 | 10.0322 | |
ERF91 | OS06G42990 | 25,826,903 | 393AA | 40886.2 | 9.4028 | OS06G0636000 |
ERF92 | OS06G44750 | 27,025,437 | 264AA | 28123.8 | 9.3971 | OS06G0657500 |
ERF93 | OS06G47590 | 28,818,162 | 189AA | 19923.2 | 6.5253 | OS06G0691100 |
ERF94 | OS07G03250 | 1,299,598 | 315AA | 33837.8 | 7.2309 | OS07G0124700 |
ERF95 | OS07G10410 | 5,593,910 | 267AA | 29029.5 | 8.395 | OS07G0204000 |
ERF96 | OS07G12510 | 7,139,566 | 283AA | 30602.7 | 10.8225 | OS07G0227600 |
ERF97 | OS07G22730 | 12,826,359 | 222AA | 22888.3 | 8.9855 | OS07G0410300 |
ERF98 | OS07G22770 | 12,846,933 | 240AA | 25357.1 | 9.8115 | OS07G0410700 |
ERF99 | OS07G38750 | 23,251,337 | 316AA | 33367.1 | 7.4217 | OS07G0575000 |
ERF100 | OS07G42510 | 25,440,818 | 343AA | 37167.6 | 4.4297 | OS07G0617000 |
ERF101 | OS07G47330 | 28,299,591 | 319AA | 33540.8 | 7.0289 | OS07G0669500 |
ERF102 | OS07G47790 | 28,540,697 | 217AA | 23654.5 | 6.7903 | OS07G0674800 |
ERF103 | OS08G07700 | 4,303,902 | 176AA | 19447.5 | 5.5007 | OS08G0173700 |
ERF104 | OS08G27220 | 16,620,171 | 313AA | 33358.9 | 9.7012 | OS08G0360800 |
ERF105 | OS08G31580 | 19,547,321 | 281AA | 29524.9 | 7.7621 | OS08G0408500 |
ERF106 | OS08G34360 | 21,564,093 | 289AA | 30967.9 | 4.4309 | OS08G0442400 |
ERF107 | OS08G35240 | 22,236,519 | 244AA | 25966.6 | 4.5395 | OS08G0454000 |
ERF108 | OS08G36920 | 23,353,882 | 283AA | 30076.3 | 6.0545 | OS08G0474000 |
ERF109 | OS08G41030 | 25,950,258 | 190AA | 20296.3 | 9.1806 | OS08G0521600 |
ERF110 | OS08G42550 | 26,887,946 | 542AA | 58748.3 | 9.3749 | OS08G0537900 |
ERF111 | OS08G43200 | 27,320,517 | 237AA | 24470.2 | 5.6332 | OS08G0545500 |
ERF112 | OS08G43210 | 27,324,298 | 252AA | 26811.7 | 4.3989 | OS08G0545500 |
ERF113 | OS08G44960 | 28,224,320 | 137AA | 14994.3 | 8.441 | |
ERF114 | OS08G45110 | 28,321,216 | 242AA | 26280.3 | 6.4938 | OS08G0565200 |
ERF115 | OS09G11460 | 6,387,891 | 233AA | 26038.6 | 8.4969 | OS09G0286600 |
ERF116 | OS09G11480 | 6,404,474 | 251AA | 27023.8 | 4.5686 | OS09G0287000 |
ERF117 | OS09G13940 | 8,199,884 | 319AA | 35680.2 | 5.1888 | OS09G0309700 |
ERF118 | OS09G20350 | 12,216,432 | 292AA | 30752.2 | 6.671 | OS09G0369000 |
ERF119 | OS09G26420 | 15,959,324 | 397AA | 42625.8 | 4.626 | OS09G0434500 |
ERF120 | OS09G28440 | 17,306,100 | 275AA | 29189.7 | 6.2795 | OS09G0457900 |
ERF121 | OS09G35010 | 20,395,224 | 219AA | 23237.9 | 4.9735 | OS09G0522000 |
ERF122 | OS09G35020 | 20,399,334 | 247AA | 25491.2 | 5.1038 | OS09G0522100 |
ERF123 | OS09G35030 | 20,403,149 | 239AA | 25390.1 | 4.8433 | OS09G0522200 |
ERF124 | OS09G39810 | 22,821,581 | 132AA | 14686.1 | 8.0015 | OS09G0571700 |
ERF125 | OS09G39850 | 22,847,286 | 217AA | 23449.2 | 9.1838 | OS09G0572000 |
ERF126 | OS10G22600 | 11,731,592 | 322AA | 33784 | 8.7234 | OS10G0371100 |
ERF127 | OS10G25170 | 12,992,049 | 323AA | 34187.3 | 5.2297 | OS10G0390800 |
ERF128 | OS10G26590 | 13,862,953 | 228AA | 24478.5 | 7.2963 | |
ERF129 | OS10G30840 | 16,063,850 | 125AA | 13306.5 | 9.41 | |
ERF130 | OS10G38000 | 20,355,076 | 194AA | 20435 | 6.8039 | OS10G0523900 |
ERF131 | OS10G41130 | 22,099,625 | 290AA | 29728.8 | 4.4779 | OS10G0560700 |
ERF132 | OS10G41330 | 22,213,115 | 274AA | 29768.8 | 7.2154 | OS10G0562900 |
ERF133 | OS11G06770 | 3,307,500 | 262AA | 27261.2 | 6.9609 | OS11G0168500 |
ERF134 | OS11G13840 | 7,627,668 | 202AA | 21647.3 | 4.6476 | OS11G0242300 |
ERF135 | OS12G39330 | 24,202,748 | 403AA | 42370.2 | 4.6106 | OS12G0582900 |
ERF136 | OS12G40960 | 25,359,954 | 139AA | 14755.1 | 6.7139 | |
ERF137 | OS12G41030 | 25,385,164 | 141AA | 15750.6 | 7.7982 | |
ERF138 | OS12G41060 | 25,414,541 | 324AA | 34249 | 4.3968 | OS12G0603300 |
ERF123 | OS09G35030 | 20,403,149 | 239AA | 25390.1 | 4.8433 | OS09G0522200 |
ERF124 | OS09G39810 | 22,821,581 | 132AA | 14686.1 | 8.0015 | OS09G0571700 |
ERF125 | OS09G39850 | 22,847,286 | 217AA | 23449.2 | 9.1838 | OS09G0572000 |
ERF126 | OS10G22600 | 11,731,592 | 322AA | 33784 | 8.7234 | OS10G0371100 |
ERF127 | OS10G25170 | 12,992,049 | 323AA | 34187.3 | 5.2297 | OS10G0390800 |
ERF128 | OS10G26590 | 13,862,953 | 228AA | 24478.5 | 7.2963 | |
ERF129 | OS10G30840 | 16,063,850 | 125AA | 13306.5 | 9.41 | |
ERF130 | OS10G38000 | 20,355,076 | 194AA | 20435 | 6.8039 | OS10G0523900 |
ERF131 | OS10G41130 | 22,099,625 | 290AA | 29728.8 | 4.4779 | OS10G0560700 |
ERF132 | OS10G41330 | 22,213,115 | 274AA | 29768.8 | 7.2154 | OS10G0562900 |
ERF133 | OS11G06770 | 3,307,500 | 262AA | 27261.2 | 6.9609 | OS11G0168500 |
ERF134 | OS11G13840 | 7,627,668 | 202AA | 21647.3 | 4.6476 | OS11G0242300 |
ERF135 | OS12G39330 | 24,202,748 | 403AA | 42370.2 | 4.6106 | OS12G0582900 |
ERF136 | OS12G40960 | 25,359,954 | 139AA | 14755.1 | 6.7139 | |
ERF137 | OS12G41030 | 25,385,164 | 141AA | 15750.6 | 7.7982 | |
ERF138 | OS12G41060 | 25,414,541 | 324AA | 34249 | 4.3968 | OS12G0603300 |
WEBLOGO图给出的结果可以分析出138个ERF转录因子都是具有ERF保守域的,并且这些ERF保守结构域都是非常典型的,即含有1~4个约70个氨基酸的不完全重复序列,并且在分析的序列中可以发现氨基酸残基ASP(D)-59和TRP(W)-43极奇保守(图 3)。
图 3 ERF家族特征结构域在水稻中的保守性分析
2.2 ERF保守序列的鉴定和分析
接下来的实验要求我们进一步了解水稻ERF转录因子家族成员的进化关系,故而我们通过已经分析取得的水稻ERF蛋白的保守序列建立出相关的系统进化树。该图的结果经过分析可以发现水稻ERF转录因子可以被分成5个亚家族(I-V)(图 4,图5),其中亲缘关系上相近的亚家族是IV和V。
图 4水稻ERF转录因子家族的进化树分析
系统进化树采用邻接法由MEGA 5.0程序构建,BOOTSTRAP值设置为1000。
图5水稻、拟南芥ERF转录因子家族进化分析
2.4水稻ERF转录因子的保守基序分析
通过MEME程序作图来对水稻ERF转录因子的基序进行分析,我们发现都含有经典的保守基序1和保守基序2。此外,仍然可以发现大量保守程度略低的的基序,这些基序含有11- 27个氨基酸残基(图 8)。
图 8 MEME程序获得的水稻MYB转录因子的保守基序
水稻ERF转录因子的基序特征与进化树基本保持一致。从图 9可以看出,极其高度保守的MOTIF1基序已经出现在了各个亚家族中。ERF87和ERF31在亚家族II中,它们的亲缘关系十分接近并且均含MOTIF1、MOTIF2、MOTIF3、MOTIF4、MOTIF5、MOTIF9基序,且MOTIF1、MOTIF3基序以及MOTIF2、MOTIF4基序彼此临近,结合图 10发现它们分别位于2号和6号染色体,且距离接近。在亚家族V中,亲缘关系更为接近的ERF56、ERF131的N端含有MOTIF9基序,且均相邻MOTIF6基序;与MYB78、ERF40的N端序列基本一样。从亚家族III中亲缘关系较近的ERF92和ERF68可以看出,ERF68上的保守基序整体向N端平移,他们的基序顺序和长度几乎一致,而且结构非常的相近。在亚家族IV中,ERF转录因子的结构差异相对较大,如ERF1与ERF38不含有相同的基序,并且结构相似性较其他亚家族低。
图 9 ERF转录因子家族的保守基序分析
2.5水稻ERF转录因子家族所在染色体区段复制分析
染色体区段复制分析发现,水稻所有染色体均分布有ERF基因,其中12号染色体上存在4个基因,它们分别是:Os12g39330、Os12g40960O、s12g41030和 Os12g41060 ;11号染色体上存在2个基因,它们分别是:Os11g06770、Os11g13840;10号染色体上存在7个基因,它们分别是: Os07g03250 、Os07g10410、Os07g12510、Os07g22730、Os07g22770、Os07g38750、 Os07g42510 、 Os07g47330和Os07g47790。此外,水稻138个ERF基因在染色体上存在聚集现象,如在2号染色体的25MB、3号染色体的4MB、4号染色体的27MB区段位置均出现3个及以上基因聚集。
图 10 水稻ERF转录因子家族在染色体上的复制分析
2.6ERF转录因子家族在水稻不同组织中的表达模式分析
根据分析结果,相关基因的表达在水稻不同组织的所有生长过程中受到调节。 在聚类分析后,138个ERF基因的表达可以分为5个不同的子类别,但是不同的子类别具有相似的表达谱变化。 从表达谱的分析可以看出,第I亚类的ERF68和ERF11在花序,花药,花柄和其他器官中高度表达,而在其他组织中表达能力相对较低。(图 11),但经由聚类分析我们可以发现ERF11和68分别位于V和第III亚家族(图 5);进一步分析第II亚类,我们可以发现ERF22、66和103在花序发育的部分时期表达量较低,但是在子房发育早期和胚乳发育后期中表达相对较高,提示第II亚类可能更多和生殖生长有关,且在聚类分析中ERF66和ERF22位于第V类亚家族;第III和第IV亚类的ERF4、10、37和51在叶片、叶鞘、花序和胚中表达相对较低,在根和胚乳中表达相对较高,其中ERF10为第I亚家族成员,ERF4、37和51则均为第II亚家族成员;剩余已知亚类的基因表达则相对分散。
图 11水稻ERF转录因子家族在不同组织及不同生长阶段的表达聚类分析
结论
我们通过信息学的方式对水稻抗逆基因ERF进行研究分析,先通过国家水稻数据中心获取138个ERF转录因子,分子量在13306.5~58748.3之间,等电点范围为4.2163~11.5575。以水稻ERF蛋白的保守序列成功建立了系统进化树,成功将ERF转录家族分为5个子类别,由此可以发现 IV和V基因亚家族亲缘关系较为接近。对比水稻、拟南芥中ERF的进化关系,我们可以得出ERF基因早就已经在物种中进行了分化,这种分化早于水稻、拟南芥这些物种开始分化。利用蛋白质保守基序在线搜索程序—MEME得到10个保守基序,结合ERF转录因子所在染色体区域的复制情形,可以发现部分ERF转录因子亲缘关系近,相对位置也较近近,如ERF87和ERF31。
分析ERF转录家族在水稻不同组织中的表达,发现表达谱的III和IV亚类ERF转录因子在根中高表达。从表达谱的分析结果可以看出,第I亚类的ERF68和ERF11在花序、花药、雌蕊等器官中表达情况较高,而在其他组织中表达能力相对较低,但经由聚类分析我们可以发现ERF11和68分别位于V和第III亚家族;第II亚类的ERF22、66和103在叶片、根和花序发育的部分时期表达量较低,但是在子房发育早期和胚乳发育后期中表达相对较高,提示第II亚类可能更多和生殖生长有关,且在聚类分析中ERF66和ERF22位于第V类亚家族;第III和第IV亚类的ERF4、10、37和51在叶片、叶鞘、花序和胚中表达相对较低,在根和胚乳中表达相对较高
综上, 通过对水稻的生物信息学研究, 分析其AP2/ERF转录因子家族基因的鉴定、结构特征、进化特点、染色体定位及复制情况, 从而对水稻ERF转录因子有了更全面的了解。
参考文献
[1] Zuo X, Lu H, Jiang L, Zhang J, Yang X, Huan X, He K, Wang C, Wu N. Proceedings of the National Academy of Sciences of the United States of America, 2017, 114(25):6486.
剩余内容已隐藏,请支付后下载全文,论文总字数:26553字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;