水稻AP2/ERF家族在植物逆境中的信息学研究

 2023-09-13 08:51:54

论文总字数:26553字

摘 要

已经将水稻基因组数据库中的138个ERF基因进行了生物信息学分析,通过建立并对各种植物的ERF转录因子进化树图进行比对来为保守基因序列的寻找做铺垫,显示水稻ERF转录因子家族分成5个亚家族。通过MEME和MAPINSPCET来进一步进行保守基因序列分析,得出水稻中的ERF转录因子不仅含有我们已知ERF家族中经典的保守基序1和2,而且含有部分相对保守的基序,我们已经分析出最小的基序至少有13个氨基酸,最大的基序有21个氨基酸,最后再通过建立热图来对ERF转录因子在多个时期中的多种组织内表达情形进行聚类分析,并且发现ERF基因的表达已经与水稻各个部分的生长调控过程有关,而且互相有差异的基因在基因表达谱上却能有相近表达变化。

关键词: MEME,MAPINSPCET,保守基因序列,ERF转录因子,水稻

ABSTRACT: The 138 erf genes in the rice genome database have been bioinformatically analyzed, and the search for conserved gene sequences has been paved by establishing and comparing the erf transcription factor evolution tree maps of various plants. The results of this figure show that the rice erf transcription factor family is divided into five subfamilies. Furthermore, the meem and mapinspcet were used to establish the pattern to further carry out the conserved gene sequence analysis. It was concluded that the rice erf transcription factor not only contains the classical conserved motifs 1 and 2 of the erf family, but also some relatively conservative motifs. These motifs contain at least 13 motifs. amino acid residues, up to 21 amino acid residues, and finally clustered the expression of erf transcription factor family in different tissues and different growth stages by establishing a heat map, and found that the expression of related genes has been involved in different tissues of rice. During the entire growth process, different gene subclasses have similar expression profile changes.

KEYWORDS:MEME, MAPINSPCET, CONSERVED GENE SEQUENCE, ERF TRANSCRIPTION FACTOR, RICE

目 录

1 引言 3

1.1 AP2/ERF基因的研究起源 3

1.1.1 水稻AP2/ERF基因家族的研究意义 3

1.1.2 AP2/ERF转录的研究进展 4

1.1.3 本次研究的重要切入方式 5

1.2 AP2/ERF基因家族介绍 6

1.2.1 AP2/ERF基因家族的成员 6

1.2.2 AP2/ERF 类转录因子与信号转导通路 8

1.2.3 AP2/ERF 转录因子与基因相互作用 10

1.3 本研究的目的和意义 13

2 材料与方法 13

2.1 水稻ERF基因的生物信息学分析 13

2.2 ERF保守序列的鉴定和分析 17

2.4水稻ERF转录因子的保守基序分析 20

2.5水稻ERF转录因子家族所在染色体区段复制分析 22

2.6ERF转录因子家族在水稻不同组织中的表达模式分析 22

结论 24

致谢 27

1 引言

水稻是世界上最重要的主食之一。 全球对水稻和其他食品的需求随着世界人口的剧增而不断增加。中国是很早就开始农耕,大约在5千年前就已经开始种植水稻,因此在当今中国,水稻成为了主要的农作物[1]。近代以来,水稻的育种在历史上总共经历了三次重大革命,包括50年代所进行得水稻的矮化育种,于1970左右进行的水稻的杂交性状育种,以及于1980年左右才开始尝试的相关的超级水稻育种。通过具有优势的植物杂交实验,我们可以有效的提高相关作物的产量和质量。另外,由于土壤的盐碱化程度增加导致耕地流失、非生物环境条件的破坏和干旱是主要的环境因素。这对小麦和其他作物的生产力和产量有重要影响。因此,了解小麦对盐的反应,并培育改良型耐盐的小麦品种对我国粮食安全的未来是至关重要的。

1.1 AP2/ERF基因的研究起源

在1994年,JOFUKU等人[2]从拟南芥WAL-MART中分离出一个独特的AP2基因。该基因对花生生长发育具有一定的影响。它包含两个AP2/ERF乙烯响应因子结构域。在90年代OHME TAKAGI和SHINSHI[3]获得并分离了烟草中的效应蛋白结合元件,它们分别是ERF1、2、3、4,并且发现相对十分保守的ERF结构域在这些效应蛋白结合原件中都可以被发现。到1999年, KAGAYA从拟南芥中获得了全长CDNARAV1,RAV2。研究还发现,RAV1RAV2基因表达的蛋白质包含一个B3基因域和一个AP2/ERF基因域[4],AP2/ERF基因家族是一个超基因家族。包含大约70个氨基酸组成的AP2/ERF基因域。我们还发现这些结构域存在于大多数植物中,但不同植物中与AP2/ERF相关的转录因子的数量基本不同[5]。AP2/ERF基因家族成员对植物有很大的影响。它们可以调节多种植物生物学过程,包括但不限于花的生长、果实的发育、种子的成熟和对环境压力的抵抗。此外,我们发现植物中与AP2/ERF相关的转录因子能够对植物中水杨酸、茉莉酸、乙烯、脱落酸等物质进行一定程度的调控,同时他们可以作为重要的链接因子以在众多应激信号交叉途径中产生巨大的作用。

1.1.1 水稻AP2/ERF基因家族的研究意义

目前,土壤干旱、气候低温和土壤盐碱化是影响作物生长发育的最重要的压力相关因素,最终导致作物减产和基本作物灭绝。这些问题也被称为非生物胁迫[6]。我们还发现,作物对非生物胁迫的抗性主要是由多个基因位点控制引起,形成的一种复杂数量性状。然而,我们很难通过传统的育种方法获得看似全面的抗病品种[7]。目前,利用分子生物学技术对作物中复杂抗应力分子的作用机理进行了研究已经取得了良好的效果。我们已经鉴定并克隆了许多与应激反应相关的基因。然而,植物应激反应是一个涉及许多基因的重要调控过程,调控过程非常复杂,因此使用单一抗逆境基因培育转基因抗逆境作物的效果并不理想[2]。然而,我们发现转录因子TF可以积极调节一系列与应激抵抗相关的重要基因的表达,并在应激抵抗中发挥更为明显的作用,故而逆境相关转录因子的遗传转化是提高作物抗逆境能力的一种有效途径[8]

1.1.2 AP2/ERF转录的研究进展

植物通过一系列机制保护自己免受病原体攻击,包括预先形成和诱导的反应。 可以在整个植物中诱导防御并且取决于病原体的感知。 本地化和系统性防御依赖于激活导致诱导防御基因表达的一种或多种信号传导途径。这些途径受水杨酸(SA),茉莉酸(JA)和乙烯(ET)或其衍生物的调节。这些途径与对不同类型病原体的抗性有关,而植物对抗死体病原体的抵抗能力主要源自于JA和ET及其衍生物。在许多情况下,JA和ET途径已被证明可以调节相似类型的防御基因。转录因子,也被称为反式作用因子,是顺式作用元件,通常位于基因启动子处。通过相互作用,甚至与其他蛋白质的相互作用,相应的靶基因可以在不同的环境中调节和表达。在非生物胁迫环境中,作物会感受到干旱、低温等胁迫信号,刺激转录因子与相关顺式作用元件之间的相互作用,激活RNA聚合酶的转录复合物,从而触发特定基因的转录和表达,然后通过特异性的调控作用,使作物在干旱、低温等条件下生长[9]。我们可以找到在植物抗逆境中起重要作用的转录因子,并进一步利用这些高表达基因进行植物抗逆境研究。AP2/ERF转移基因因子家族是仅在植物中含有的一类特殊因子,我们发现在某些植物中这个家族至少会有170个成员以上。并且根据它包含的AP2/ERF结构域数量上的差异,我们可以发现该家族成员可以被分类为ERF亚家族含1个AP2/ERF结构域以及AP2亚家族含2个AP2/EREP2亚家族含2个AP2/EREP2亚家族家族含2个AP2一个域[10]。EREBP子家族也可分为DREB和ERF。EREBP亚家族的大多数转录因子在植物抗逆境中起着重要作用[10, 11]。我们发现AP2亚科的成员在花和种子的生长发育和茎芽尖分化中的分生组织[12] 起着重要作用。目前国内外对ERF转录因子进行了广泛的研究,从高羊茅[13]、水稻[14, 15]、烟草[16]、大麦[17]、棉花[18]、大豆[19]、拟南芥[20, 21]中成功分离鉴定了AP2/ERF转录因子的先例。

1.1.3 本次研究的重要切入方式

鉴于不同的ERF基因可能在不同物种之间有不同的应对盐和干旱胁迫的作用,研究小麦特异性ERF基因对了解ERF在小麦中的调节功能非常重要。通过计算机分析拟南芥的AP2 / ERF结构域氨基酸序列,再从表达的序列中鉴定出ERF基因,虽然功能特征很少,但可以发现小麦ERF的异位表达蛋白质TAERF1,属于ERF亚家族的B-2组,可以提高对盐,干旱和寒冷胁迫的耐受性,以及对转基因植物中的细菌病原体丁香假单胞菌的抗性。小麦ERF的过表达转录激活因子TAPIEP1,属于B-3 ERF组,增强转基因小麦中的对土壤真菌感染的抵抗力。从小麦中分离出盐响应性ERF基因TAERF4,属于B-1亚组; TAERF4的异位表达拟南芥增强对盐胁迫的敏感性。水稻ERF基因AP37AP59的表达增强了水稻在营养生长期的耐旱性。AP37的过量表达提高了在严重的干旱和正常的生长条件下两者的籽粒产量,而AP59的过表达则相反。

基因芯片是重要的研究方式,基因芯片技术分析基因表达谱是一种非常有效的方式,它可以用于发现处于不同抗逆条件下发生的差异表达基因,从而获取基因表达和功能相关的信息[22]。我们可以通过基因芯片技术,来研究处于不同逆境环境下的AP2/ERF基因表达的情况,得以筛选出由于寒冷、高盐浓度以及极端干旱环境导致的出现特殊表达的有关基因,利用PCR定量的方法来对我们的实验结果进行专业分析鉴定,将具有显著差异表达的相关基因标注提取,以作为重要的基础数据来进行关于AP2/ERF基因家族的更加深入的研究。

1.2 AP2/ERF基因家族介绍

1.2.1 AP2/ERF基因家族的成员

AP2/ERF基因家族的转录因子约占植物总表达转录因子的8%。AP2/ERF基因家族与目前已知的各种植物生长发育有着不可分割的关系。例,在植物的分生组织中,可以回应植物抵抗生物和非生物的压力,调节基因表达,甚至刺激类固醇反应等。AP2/ERF基因家族目前仅在植物中有所发现。根据AP2/ERF域的特点,我们可以将其划分为三个亚科。第一个是ERF基因亚家族,通常包含一个AP2保守域;第二个包含两个AP2域;第三个包含一个AP2域和一个B3域。此外,我们可以根据AP2基因保守域内不同的氨基酸将AP2基因分为两类,即CBF/DREB和ERF。

1.2.2 AP2/ERF 类转录因子与信号转导通路

为了克服生物胁迫危害,例如病虫害与真菌,以及非生物胁迫环境危害,例如干旱,寒冷与高盐。故而在不利的环境条件下, 植物早就有了成套的应对机制, 这些回应方式同时与多种信号途径相关联, 这些信号途径往往是相互交叉的,当然亦有相对独立的信号途径。我们可以发现在抵御生物胁迫[23]威胁会伴有大量信号交叉途径,同时在抵御非生物胁迫[24]或者两者[25]时,这些信号交叉途径也被充分激活。水杨酸(Salicylic Acid, SA)、植物激素脱落酸(Abscisicacid, ABA)、乙烯(Ethylene, ET)、茉莉酸(Jasmonate, JA)等等相关的信号通路运行以及这些植物激素相互之间的作用,可以为植物抵抗生物胁迫危害和非生物胁迫危害做出巨大的贡献。在这些植物激素中,植物激素脱落酸(Abscisicacid, ABA)甚至于几乎参与了每一种胁迫反应。大量重要的信号分子进行调节对逆境的抵御方式都是通过拮抗与协同作用的。另一方面在植物处于逆境情况下的胁迫信号交叉途径中,ERF亚家族成员经常作为中间反应的连接因子,去广泛的参与胁迫信号途径。

3 植物中转录因子情况[26]

植物种类

基因数量

转录因子

AP2/ERF类转录因子

拟南芥

27228

2437

166

大豆

46430

5671

381

杨树

45654

2758

211

苹果

57386

4021

274

葡萄

33514

2080

145

水稻

40577

2798

188

玉米

32540

5246

330

高梁

34496

2312

161

4 不同物种间 AP2/ERF 转录因子的分类情况[26]

分类

拟南芥

水稻

玉米

杨树

葡萄

小麦

大麦

苹果

DRE亚家族

A1

6

10

10

6

7

39

9

1

A2

8

4

4

18

4

5

3

0

A3

1

1

1

2

0

0

2

0

A4

16

15

11

26

13

1

1

9

A5

16

13

13

14

7

4

1

4

A6

10

9

10

11

5

8

2

4

共计

57

52

49

77

36

57

18

18

ERF亚家族

B1

15

16

24

19

7

7

5

8

B2

5

16

17

6

3

19

12

5

B3

18

18

11

35

37

8

1

9

B4

7

9

8

7

4

4

1

2

B5

8

6

9

8

4

0

0

2

B6

12

14

15

16

18

9

3

7

共计

65

79

84

91

73

47

22

33

AP2亚家族

18

26

31

26

18

9

8

5

RAV亚家族

6

7

2

5

4

3

4

2

总计

147

164

167

200

132

117

53

58

1.2.3 AP2/ERF 转录因子与基因相互作用

植物防御反应的调节是复杂的,许多转录因子家族起着重要的作用。人们对在植物防御中鉴定和利用关键转录因子以设计增加对农业中植物病原体的抗性具有相当大的兴趣。正在探索的一个转录因子家族是ET反应因子(ERF)家族,其成员是JA和ET途径的整合点。在拟南芥中,由AP2 / EREBP基因家族编码的蛋白质在整个植物生命周期中具有不同的功能,包括发育的调节,对诸如干旱和寒冷等非生物胁迫的响应,以及诸如真菌病原体感染等生物胁迫的应对。 AP2 / EREBP家族分为RAV,AP2和EREBP亚家族,EREBP亚家族分为DREB或A亚组和ERF或B亚组。 ERF或B子组包含65个ERF基因并包含与疾病抗性反应相关的所有AP2 / EREBP基因。 ERF基因已被证明对JA和ET都有反应,同时在番茄中揭示了PTO R蛋白在识别番茄后对ERFS PTI4PTI5类似的结构单元的直接调节常常出现在同一个种类的基因家族或者亚家族中,也因此常常具有相似的功能。ERF转录因子可以通过进行拮抗或激活来对植物逆境基因进行重要的表达调控。而烟草 NTERF3、拟南芥 ATERF3ATERF4中常含有的 EAR 结构, 这会抑制含有GCC-BOX的相关基因的表达能力[27]。PAN 等在番茄中获取并克隆了一种种 ERF 转录因子 ,并且将其命名为SLERF3, 这种转录因子可以被寒冷、盐、干旱、细菌、植物激素等诱导表达[28]。再通过分子生物学的手段将 EAR 结构域删去,就可以产生具有重要的转录因子活性的SLERF3DRD蛋白。在植物中过量表达的的SLERF3 基因能够抑制植株生长。但是转 SLERF3DRD 蛋白基因的植物却能够进行正常的生理活动, 并且高量表达的 SLERF3DRD蛋白基因可以调控基因PR2、PR1、PR5 的适量表达, 以此来使得植物获得更好的抵抗力。过量表达 ERF2可以诱导 PDF1.2基因的相关表达,这在转基因的拟南芥中已经可以确认,然而ERF4 过量表达又将会抑制相关基因的表达,例如PDF1.2 基因[29]。通过这里,可以发现ERF转录因子在植物中通常起到阻抑作用[30], 相反常起到激活活性的往往是不带有ERF结构域的转录因子。ERF1可以诱导植物防御素基因 PDF1.2 的表达[31]。另外拟南芥中CBF1 蛋白的AP2/ERF结构域不但可以与DRE/CRT元件, 在另一方面可以与GCC元件作用[32]。这是因为在上游的两种作用元件均有核心序列–CCGNC–,故而它们都具有相似的结合活性。又因为GCC盒是位于耐干旱、耐盐、耐低温有关的转录因子的上游区域, 所以GMERF3基因可以与GCC盒进行紧密的结合。SASAKI 等在烟草中获取了两种 AP2/ERF相关蛋白, 分别为WRAF1蛋白和WRAF2蛋白, 它们都具有相似的AP2结构域[33]。经过比对我们发现WRAF1以及WRAF2两种蛋白 在正常情况下的老叶、新叶、花、根、叶柄、茎秆并没有表达。但是经过伤害诱导之后, 这两种蛋白的出现频率比TPOXN1基因诱导的蛋白高。SASAKI等[33]研究发现在T0代的转基因烟草中即使WRAF1 以及WRAF2 基因过度表达了,但是植物的表型依然正常, 然而当实验进行到T1代, 却会出现矮化表型,而且无法开花, 这个实验依旧表明不管是WRAF1 还是WRAF2基因的过度表达都是会阻碍烟草植物的正常发育生长。

越来越多的证据表明,ERF蛋白在调节植物生物和非生物应激反应中起着至关重要的作用。小麦ERF在耐盐调控中的作用和机制研究对于理解植物适应盐碱环境的方式至关重要。包括ERF在内的TF通常在对非生物和生物胁迫的响应中被上行调节,这些调控反应通常很快。用盐或PEG溶液冲洗后土壤,TAERF3转录本诱导的程度和峰值叶子中的叶子比在根中观察到的更低更慢,表明TAERF3对耐盐应激的反应可能在应激定位组织中发生。这些数据表明TAERF3可能是小麦的重要正调节效应物来适应干旱和盐胁迫。某些植物激素,包括ABA和乙烯,在植物应对环境威胁的信号通路中起关键的作用。某些ERF蛋白,如TSRF1是乙烯信号整合的分子节点和ABA信号通路。我们以前的研究表明TAERF3是乙烯诱导型,在施用ABA合成抑制剂去抑制NA2WO4后,暗示TAERF3对ABA呈阳性反应。为了了解TAERF3响应的分子基础,我们分析了TAERF3启动子中的顺式作用元件,显示了启动子TAERF3的序列含有乙烯响应元素(GCC盒)和ABA响应元件(ACGT和ABRE),这可能部分有助于TAERF3的反应激素应用。

为了阐明拟南芥ERF家族中基因之间的系统发育关系,使用AP2 / ERF结构域的氨基酸序列进行多重比对分析表明在122种蛋白质中,氨基酸残基甘氨酸-4,天冬氨酸-6,谷氨酸-16,色氨酸-28,亮氨酸-29,甘氨酸-30和丙氨酸-38完全保守的[34]。 此外,超过95%的ERF家族成员含有精氨酸-8,甘氨酸-11,异亮氨酸-17,精氨酸-18,精氨酸-26,丙氨酸-39,天冬氨酸-43和天冬酰胺-57残基[35]。这种相同的比对表明七种蛋白质的AP2 / ERF结构域的C末端区域与共有序列具有非常低的同源性。 该区域对应于Α-螺旋的C-末端一半,其中包括高度保守的残基天冬氨酸-43和天冬酰胺-57。

图2.来自拟南芥ERF蛋白的AP2 / ERF结构域的比对。

注:黑色和浅灰色阴影表示相同和保守的氨基酸残基。 深灰色阴影表示VI-L组或组中的保守氨基酸残基。 黑色条和箭头分别代表AP2 / ERF结构域内预测的Α-螺旋和B-片区域。星号表示直接与DNA接触的氨基酸残基[35]

1.3 本研究的目的和意义

本研究旨在加深对AP2/ERF基因在水稻抗逆性机制上相关作用和机制的理解,并且希望我们可以在尽力丰满研究成果的同时,为水稻种质抗逆性能力上进行改良并且为更加高的品质和高的产量育种实验提供力所能及的帮助。主要目的有:(1)明确是否AP2/ERF对植物抗逆性有巨大帮助;(2)明确某种由AP2/ERF引发的抗逆性通路的过程;(3)阐明某种AP2/ERF基因引发的抗逆性通路的作用机制。

2 材料与方法

2.1 水稻ERF基因的生物信息学分析

在水稻基因组数据库中共鉴定出138个ERF转录因子(表5),通过数据分析,我们可以发现这些基因号中分子量范围在13306.5(ERF129)-58748.3(ERF110)之间,并且等电点的范围在4.2163(ERF6)- 11.5575(ERF21)之间,而表达出的蛋白质大小范围为125AA(ERF129)-542AA(ERF110)。

表 5水稻ERF转录因子家族基因的基本信息

序号

基因号(MSU)

染色体位置(MB)

蛋白大小(AA)

分子量(DA)

等电点(PI)

基因号(RAP)

ERF1

OS01G04020

1,746,418

339AA

36528.6

4.5185

OS01G0131600

ERF2

OS01G07120

3,357,287

282AA

31591.5

6.073

OS01G0165000

ERF3

OS01G10370

5,454,554

229AA

24558.4

***19

OS01G0200600

ERF4

OS01G12440

6,813,714

381AA

40507.3

4.5781

OS01G0224100

ERF5

OS01G21120

11,783,910

208AA 

22302.2

7.1866

OS01G0313300

ERF6

OS01G46870

26,734,014

300AA

31538.7

4.2163

OS01G0657400

ERF7

OS01G54890

31,567,891

238AA

24000.2

10.9079

OS01G0752500

ERF8

OS01G58420

33,766,979

236AA

24270.5

9.9084

OS01G0797600

ERF9

OS01G59780

34,574,832

275AA

29716.1

4.8336

OS01G0813300

ERF10

OS01G64790

37,589,452

352AA

36316.6

6.3474

OS01G0868000

ERF11

OS01G66270

38,489,525

190AA

19825.1

7.977

OS01G0885900

ERF12

OS01G73770

42,727,426

220AA 

23817.6

6.1627

OS01G0968800

ERF13

OS02G06330

3,164,423

204AA 

20556.6

5.6365

ERF14

OS02G09650

4,958,350

200AA 

21092.6

8.2356

OS02G0189500

ERF15

OS02G10760

5,688,698

206AA

22444.2

9.3301

OS02G0202000

ERF16

OS02G13710

7,365,220

248AA 

25408.4

4.9562

ERF17

OS02G29550

17,575,129

223AA 

25330.5

9.3184

OS02G0499000

ERF18

OS02G32040

18,923,622

240AA

25158.2

4.5898

OS02G0520000

ERF19

OS02G32140

18,986,678

261AA 

26408.7

10.3516

OS02G0521100

ERF20

OS02G34260

20,491,113

218AA

22448.3

11.1567

OS02G0546600

ERF21

OS02G34270

20,498,875

217AA 

22518.4

11.5575

ERF22

OS02G35240

21,184,134

171AA 

18048.2

5.3043

OS02G0558700

ERF23

OS02G38090

23,024,797

346AA 

35945.6

7.5738

OS02G0594300

ERF24

OS02G42585

25,595,412

474AA

50587.5

7.7256

OS02G0638650

ERF25

OS02G43790

26,422,182

304AA 

31632.1

6.3008

OS02G0654700

ERF26

OS02G43820

26,456,450

345AA

36329.6

5.7499

OS02G0655200

ERF27

OS02G43940

26,524,573

288AA 

29450.3

4.7425

OS02G0656600

ERF28

OS02G43970

26,550,915

226AA 

23144.5

5.0812

OS02G0657000

ERF29

OS02G45420

27,621,211

262AA

26965.8

5.5747

OS02G0676800

ERF30

OS02G45450

27,652,935

225AA

30638.7

4.9599

OS02G0677300

ERF31

OS02G51670

31,648,468

339AA

36300.5

8.098

OS02G0752800

ERF32

OS02G52670

32,204,392

243AA 

25789

6.9863

OS02G0764700

ERF33

OS02G54050

33,107,745

212AA 

22783.5

6.6764

OS02G0781300

ERF34

OS02G54160

33,199,809

366AA

40141.5

4.644

OS02G0782700

ERF35

OS02G55380

33,920,240

173AA

18704.8

6.9454

OS02G0797100

ERF36

OS03G05590

2,800,290

142AA 

15268.7

6.7995

OS03G0150200

ERF37

OS03G07830

3,984,900

319AA

33456.5

6.3088

OS03G0174400

ERF38

OS03G07940

4,056,779

45040.5

10.9157

OS03G0176300

ERF39

OS03G08460

4,343,725

327AA 

35853

6.1932

OS03G0182800

ERF40

OS03G08470

4,348,671

335AA

35760.5

6.0764

OS03G0183000

ERF41

OS03G08490

4,367,117

322AA 

3380***

4.7462

OS03G0183200

ERF42

OS03G08500

4,372,115

330AA 

35304.8

4.3121

OS03G0183300

ERF43

OS03G09170

4,780,241

298AA 

31792.9

6.5073

OS03G0191900

ERF44

OS03G15660

8,635,965

259AA 

26070

5.3077

OS03G0263000

ERF45

OS03G22170

12,713,329

244AA 

26170.4

6.5475

OS03G0341000

ERF46

OS03G60120

34,192,417

242AA 

25487

10.8382

OS03G0815800

ERF47

OS03G64260

36,301,489

226AA 

24165

6.5094

OS03G0860100

ERF48

OS04G18650

10,317,017

129AA

14193.6

5.957

OS04G0257500

ERF49

OS04G32620

19,651,659

269AA

27806

10.2157

OS04G0398000

ERF50

OS04G32790

19,790,424

293AA

29764.3

4.3061

OS04G0399800

ERF51

OS04G34970

21,248,865

245AA

24655

7.6742

OS04G0429050

ERF52

OS04G44670

26,438,507

467AA

49861.4

8.9509

OS04G0529100

ERF53

OS04G46220

27,370,862

319AA

33140.8

4.7654

OS04G0546800

ERF54

OS04G46240

27,398,303

319AA

33819.7

4.8782

OS04G0547500

ERF55

OS04G46250

27,408,986

329AA

34816.6

5.2234

OS04G0547600

ERF56

OS04G46400

27,517,205

285AA

29618.3

5.0673

OS04G0549700

ERF57

OS04G46410

27,523,400

248AA

26202

4.5625

OS04G0549800

ERF58

OS04G46440

27,539,878

218AA

23014.6

5.2825

OS04G0550200

ERF59

OS04G48350

28,820,861

220AA

23899.7

5.36

OS04G0572400

ERF60

OS04G52090

30,939,177

223AA

22798

10.2507

OS04G0610400

ERF61

OS04G55520

33,030,611

234AA

25434.2

10.0932

OS04G0648900

ERF62

OS04G56150

33,437,188

140AA

14868.6

5.1887

OS04G0655700

ERF63

OS04G57340

34,133,866

191AA

19890.5

9.3677

OS04G0669200

ERF64

OS05G25260

14,662,779

282AA

30331

10.3509

OS05G0316800

ERF65

OS05G27930

16,296,914

374AA

40473.1

4.4881

OS05G0346200

ERF66

OS05G28350

16,600,597

270AA

27626.8

7.8566

OS05G0351200

ERF67

OS05G29810

17,246,963

199AA

20772.2

7.7097

OS05G0361700

ERF68

OS05G34730

20,601,261

198AA 

20067.4

9.8746

OS05G0420300

ERF69

OS05G36100

21,404,554

365AA 

37064.1

4.9708

OS05G0437100

ERF70

OS05G37640

22,029,223

396AA

41158.5

***712

OS05G0448675

ERF71

OS05G39590

23,247,649

262AA 

27689.2

4.8025

OS05G0473300

ERF72

OS05G41760

24,427,885

190AA

19789.3

10.1626

OS05G0497200

ERF73

OS05G41780

24,444,060

237AA

24113.3

9.3484

OS05G0497300

ERF74

OS05G49010

28,109,440

283AA 

30273.6

8.2477

OS05G0564700

ERF75

OS05G49700

28,499,349

274AA 

2970***

10.119

OS05G0572000

ERF76

OS06G03670

1,434,731

215AA

23110.5

4.7872

OS06G0127100

ERF77

OS06G06540

3,067,709

343AA

36458.5

4.6277

OS06G0160500

ERF78

OS06G06970

3,310,866

254AA

27668.2

10.7473

OS06G0165600

ERF79

OS06G07030

3,337,083

185AA

19678.1

11.1922

OS06G0166400

ERF80

OS06G08340

4,040,908

179AA 

19168.3

6.0005

OS06G0181700

ERF81

OS06G09390

4,731,330

363AA

39764.3

4.5227

OS06G0194000

ERF82

OS06G09717

4,960,147

208AA

22187.5

4.5266

OS06G0197600

ERF83

OS06G09760

4,972,237

125AA

13393.2

9.7514

ERF84

OS06G09790

4,991,219

210AA 

23022.6

4.6622

ERF85

OS06G09810

4,998,064

208AA

21805.4

4.6033

ERF86

OS06G10780

5,629,416

278AA

29197.5

4.9661

ERF87

OS06G11860

6,304,588

361AA

37817.3

7.1939

OS06G0222400

ERF88

OS06G11940

6,358,046

224AA

24191

4.6858

OS06G0223100

ERF89

OS06G36000

21,040,713

266AA

27366.6

4.5754

OS06G0553700

ERF90

OS06G40150

23,898,256

244AA

25396.5

10.0322

ERF91

OS06G42990

25,826,903

393AA

40886.2

9.4028

OS06G0636000

ERF92

OS06G44750

27,025,437

264AA

28123.8

9.3971

OS06G0657500

ERF93

OS06G47590

28,818,162

189AA

19923.2

6.5253

OS06G0691100

ERF94

OS07G03250

1,299,598

315AA

33837.8

7.2309

OS07G0124700

ERF95

OS07G10410

5,593,910

267AA

29029.5

8.395

OS07G0204000

ERF96

OS07G12510

7,139,566

283AA

30602.7

10.8225

OS07G0227600

ERF97

OS07G22730

12,826,359

222AA

22888.3

8.9855

OS07G0410300

ERF98

OS07G22770

12,846,933

240AA

25357.1

9.8115

OS07G0410700

ERF99

OS07G38750

23,251,337

316AA

33367.1

7.4217

OS07G0575000

ERF100

OS07G42510

25,440,818

343AA

37167.6

4.4297

OS07G0617000

ERF101

OS07G47330

28,299,591

319AA

33540.8

7.0289

OS07G0669500

ERF102

OS07G47790

28,540,697

217AA

23654.5

6.7903

OS07G0674800

ERF103

OS08G07700

4,303,902

176AA 

19447.5

5.5007

OS08G0173700

ERF104

OS08G27220

16,620,171

313AA

33358.9

9.7012

OS08G0360800

ERF105

OS08G31580

19,547,321

281AA

29524.9

7.7621

OS08G0408500

ERF106

OS08G34360

21,564,093

289AA

30967.9

4.4309

OS08G0442400

ERF107

OS08G35240

22,236,519

244AA

25966.6

4.5395

OS08G0454000

ERF108

OS08G36920

23,353,882

283AA

30076.3

6.0545

OS08G0474000

ERF109

OS08G41030

25,950,258

190AA

20296.3

9.1806

OS08G0521600

ERF110

OS08G42550

26,887,946

542AA 

58748.3

9.3749

OS08G0537900

ERF111

OS08G43200

27,320,517

237AA 

24470.2

5.6332

OS08G0545500

ERF112

OS08G43210

27,324,298

252AA  

26811.7

4.3989

OS08G0545500

ERF113

OS08G44960

28,224,320

137AA 

14994.3

8.441

ERF114

OS08G45110

28,321,216

242AA 

26280.3

6.4938

OS08G0565200

ERF115

OS09G11460

6,387,891

233AA  

26038.6

8.4969

OS09G0286600

ERF116

OS09G11480

6,404,474

251AA 

27023.8

4.5686

OS09G0287000

ERF117

OS09G13940

8,199,884

319AA  

35680.2

5.1888

OS09G0309700

ERF118

OS09G20350

12,216,432

292AA

30752.2

6.671

OS09G0369000

ERF119

OS09G26420

15,959,324

397AA  

42625.8

4.626

OS09G0434500

ERF120

OS09G28440

17,306,100

275AA

29189.7

6.2795

OS09G0457900

ERF121

OS09G35010

20,395,224

219AA 

23237.9

4.9735

OS09G0522000

ERF122

OS09G35020

20,399,334

247AA

25491.2

5.1038

OS09G0522100

ERF123

OS09G35030

20,403,149

239AA 

25390.1

4.8433

OS09G0522200

ERF124

OS09G39810

22,821,581

132AA 

14686.1

8.0015

OS09G0571700

ERF125

OS09G39850

22,847,286

217AA 

23449.2

9.1838

OS09G0572000

ERF126

OS10G22600

11,731,592

322AA  

33784

8.7234

OS10G0371100

ERF127

OS10G25170

12,992,049

323AA 

34187.3

5.2297

OS10G0390800

ERF128

OS10G26590

13,862,953

228AA  

24478.5

7.2963

ERF129

OS10G30840

16,063,850

125AA 

13306.5

9.41

ERF130

OS10G38000

20,355,076

194AA

20435

6.8039

OS10G0523900

ERF131

OS10G41130

22,099,625

290AA 

29728.8

4.4779

OS10G0560700

ERF132

OS10G41330

22,213,115

274AA 

29768.8

7.2154

OS10G0562900

ERF133

OS11G06770

3,307,500

262AA 

27261.2

6.9609

OS11G0168500

ERF134

OS11G13840

7,627,668

202AA 

21647.3

4.6476

OS11G0242300

ERF135

OS12G39330

24,202,748

403AA

42370.2

4.6106

OS12G0582900

ERF136

OS12G40960

25,359,954

139AA 

14755.1

6.7139

ERF137

OS12G41030

25,385,164

141AA

15750.6

7.7982

ERF138

OS12G41060

25,414,541

324AA

34249

4.3968

OS12G0603300

ERF123

OS09G35030

20,403,149

239AA 

25390.1

4.8433

OS09G0522200

ERF124

OS09G39810

22,821,581

132AA 

14686.1

8.0015

OS09G0571700

ERF125

OS09G39850

22,847,286

217AA 

23449.2

9.1838

OS09G0572000

ERF126

OS10G22600

11,731,592

322AA  

33784

8.7234

OS10G0371100

ERF127

OS10G25170

12,992,049

323AA 

34187.3

5.2297

OS10G0390800

ERF128

OS10G26590

13,862,953

228AA  

24478.5

7.2963

ERF129

OS10G30840

16,063,850

125AA 

13306.5

9.41

ERF130

OS10G38000

20,355,076

194AA

20435

6.8039

OS10G0523900

ERF131

OS10G41130

22,099,625

290AA 

29728.8

4.4779

OS10G0560700

ERF132

OS10G41330

22,213,115

274AA 

29768.8

7.2154

OS10G0562900

ERF133

OS11G06770

3,307,500

262AA 

27261.2

6.9609

OS11G0168500

ERF134

OS11G13840

7,627,668

202AA 

21647.3

4.6476

OS11G0242300

ERF135

OS12G39330

24,202,748

403AA

42370.2

4.6106

OS12G0582900

ERF136

OS12G40960

25,359,954

139AA 

14755.1

6.7139

ERF137

OS12G41030

25,385,164

141AA

15750.6

7.7982

ERF138

OS12G41060

25,414,541

324AA

34249

4.3968

OS12G0603300

WEBLOGO图给出的结果可以分析出138个ERF转录因子都是具有ERF保守域的,并且这些ERF保守结构域都是非常典型的,即含有1~4个约70个氨基酸的不完全重复序列,并且在分析的序列中可以发现氨基酸残基ASP(D)-59和TRP(W)-43极奇保守(图 3)。

图 3 ERF家族特征结构域在水稻中的保守性分析

2.2 ERF保守序列的鉴定和分析

接下来的实验要求我们进一步了解水稻ERF转录因子家族成员的进化关系,故而我们通过已经分析取得的水稻ERF蛋白的保守序列建立出相关的系统进化树。该图的结果经过分析可以发现水稻ERF转录因子可以被分成5个亚家族(I-V)(图 4,图5),其中亲缘关系上相近的亚家族是IV和V。

图 4水稻ERF转录因子家族的进化树分析

系统进化树采用邻接法由MEGA 5.0程序构建,BOOTSTRAP值设置为1000。

图5水稻、拟南芥ERF转录因子家族进化分析

2.4水稻ERF转录因子的保守基序分析

通过MEME程序作图来对水稻ERF转录因子的基序进行分析,我们发现都含有经典的保守基序1和保守基序2。此外,仍然可以发现大量保守程度略低的的基序,这些基序含有11- 27个氨基酸残基(图 8)。

图 8 MEME程序获得的水稻MYB转录因子的保守基序

水稻ERF转录因子的基序特征与进化树基本保持一致。从图 9可以看出,极其高度保守的MOTIF1基序已经出现在了各个亚家族中。ERF87和ERF31在亚家族II中,它们的亲缘关系十分接近并且均含MOTIF1、MOTIF2、MOTIF3、MOTIF4、MOTIF5、MOTIF9基序,且MOTIF1、MOTIF3基序以及MOTIF2、MOTIF4基序彼此临近,结合图 10发现它们分别位于2号和6号染色体,且距离接近。在亚家族V中,亲缘关系更为接近的ERF56、ERF131的N端含有MOTIF9基序,且均相邻MOTIF6基序;与MYB78、ERF40的N端序列基本一样。从亚家族III中亲缘关系较近的ERF92和ERF68可以看出,ERF68上的保守基序整体向N端平移,他们的基序顺序和长度几乎一致,而且结构非常的相近。在亚家族IV中,ERF转录因子的结构差异相对较大,如ERF1与ERF38不含有相同的基序,并且结构相似性较其他亚家族低。

图 9 ERF转录因子家族的保守基序分析

2.5水稻ERF转录因子家族所在染色体区段复制分析

染色体区段复制分析发现,水稻所有染色体均分布有ERF基因,其中12号染色体上存在4个基因,它们分别是:Os12g39330、Os12g40960O、s12g41030和 Os12g41060 ;11号染色体上存在2个基因,它们分别是:Os11g06770、Os11g13840;10号染色体上存在7个基因,它们分别是: Os07g03250 、Os07g10410、Os07g12510、Os07g22730、Os07g22770、Os07g38750、 Os07g42510 、 Os07g47330和Os07g47790。此外,水稻138个ERF基因在染色体上存在聚集现象,如在2号染色体的25MB、3号染色体的4MB、4号染色体的27MB区段位置均出现3个及以上基因聚集。

图 10 水稻ERF转录因子家族在染色体上的复制分析

2.6ERF转录因子家族在水稻不同组织中的表达模式分析

根据分析结果,相关基因的表达在水稻不同组织的所有生长过程中受到调节。 在聚类分析后,138个ERF基因的表达可以分为5个不同的子类别,但是不同的子类别具有相似的表达谱变化。 从表达谱的分析可以看出,第I亚类的ERF68和ERF11在花序,花药,花柄和其他器官中高度表达,而在其他组织中表达能力相对较低。(图 11),但经由聚类分析我们可以发现ERF11和68分别位于V和第III亚家族(图 5);进一步分析第II亚类,我们可以发现ERF22、66和103在花序发育的部分时期表达量较低,但是在子房发育早期和胚乳发育后期中表达相对较高,提示第II亚类可能更多和生殖生长有关,且在聚类分析中ERF66和ERF22位于第V类亚家族;第III和第IV亚类的ERF4、10、37和51在叶片、叶鞘、花序和胚中表达相对较低,在根和胚乳中表达相对较高,其中ERF10为第I亚家族成员,ERF4、37和51则均为第II亚家族成员;剩余已知亚类的基因表达则相对分散。

图 11水稻ERF转录因子家族在不同组织及不同生长阶段的表达聚类分析

结论

我们通过信息学的方式对水稻抗逆基因ERF进行研究分析,先通过国家水稻数据中心获取138个ERF转录因子,分子量在13306.5~58748.3之间,等电点范围为4.2163~11.5575。以水稻ERF蛋白的保守序列成功建立了系统进化树,成功将ERF转录家族分为5个子类别,由此可以发现 IV和V基因亚家族亲缘关系较为接近。对比水稻、拟南芥中ERF的进化关系,我们可以得出ERF基因早就已经在物种中进行了分化,这种分化早于水稻、拟南芥这些物种开始分化。利用蛋白质保守基序在线搜索程序—MEME得到10个保守基序,结合ERF转录因子所在染色体区域的复制情形,可以发现部分ERF转录因子亲缘关系近,相对位置也较近近,如ERF87和ERF31。

分析ERF转录家族在水稻不同组织中的表达,发现表达谱的III和IV亚类ERF转录因子在根中高表达。从表达谱的分析结果可以看出,第I亚类的ERF68和ERF11在花序、花药、雌蕊等器官中表达情况较高,而在其他组织中表达能力相对较低,但经由聚类分析我们可以发现ERF11和68分别位于V和第III亚家族;第II亚类的ERF22、66和103在叶片、根和花序发育的部分时期表达量较低,但是在子房发育早期和胚乳发育后期中表达相对较高,提示第II亚类可能更多和生殖生长有关,且在聚类分析中ERF66和ERF22位于第V类亚家族;第III和第IV亚类的ERF4、10、37和51在叶片、叶鞘、花序和胚中表达相对较低,在根和胚乳中表达相对较高

综上, 通过对水稻的生物信息学研究, 分析其AP2/ERF转录因子家族基因的鉴定、结构特征、进化特点、染色体定位及复制情况, 从而对水稻ERF转录因子有了更全面的了解。

参考文献

[1] Zuo X, Lu H, Jiang L, Zhang J, Yang X, Huan X, He K, Wang C, Wu N. Proceedings of the National Academy of Sciences of the United States of America, 2017, 114(25):6486.

剩余内容已隐藏,请支付后下载全文,论文总字数:26553字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;