论文总字数:13408字
摘 要
为探究在低氧胁迫下乌苏里拟鲿皮肤基因表达变化情况,首先对乌苏里拟鲿进行低氧处理,然后切取低氧和对照组乌苏里拟鲿的皮肤,用转录组测序分析的方法对其进行分析。对低氧和对照乌苏里拟鲿皮肤的基因表达进行了差异分析。最终得到1751个差异性表达基因,包括上调基因842个(48%),下调基因909个(52%)。然后对差异相关基因的q值进行排序,挑选与低氧胁迫相关的q值最小的前20个基因,上调和下调分别10个。通过研究发现,这20个基因的KEGG富集中有8个基因与信号通路显著相关,这些通道分别是阿尔茨海默病、紧密连接通路、JAK-stat信号通路、HIF-1信号通路、醛固酮的合成与分泌、内质网蛋白质加工通路等。在这其中信号通路基因最多的是阿尔茨海默病,多达158个基因。表明了低氧情况下要比正常情况下更容易使乌苏里拟鲿的皮肤基因差异表达变化,产生致病因素。通过本研究,为乌苏里拟鲿烂身病的防治和今后该鱼抗逆新品种的选育提供科学依据和理论支持。关键词: 乌苏里拟鲿,皮肤,低氧胁迫,基因
Abstract: In order to investigate the changes of gene expression in skin of Pseudobagrus ussuriensis under hypoxia stress. Firstly, hypoxic stree was carried out for P. ussuriensis, and then skin tissues of hypoxic stressed and control groups were taken for transcriptome sequencing analysis. The differentially expressed genes of skin and gene-related signaling pathways of Pseudoptera Usuri under normal conditions and hypoxic stress can be obtained bywere analysisanalyzed, . A total of 1751 differential expressed genes including 842 (42%) down-regulated and 909 (52%) up-regulated genes were identified. sequencing Q values of differentially related genes, selection of the first 20 Twenty genes with 10 up-regulated and 10 down-regulated ones with the lowest Q value associated with hypoxia stress, there were 10 up-regulation and 10 down-regulation respectivelywere selected based on their q values for further analysis. The results showed that eight of the 20 genes were significantly correlated with signaling pathways in KEGG enrichment. These pathways are Alzheimer"s disease, tight junction pathway, JAK-stat signaling pathway, HIF-1 signaling pathway, aldosterone synthesis and secretion, endoplasmic reticulum protein processing pathway. Among them, Alzheimer"s disease has the largest number of these genes indicating that hypoxia is more likely than normal to induce gene differential expression changes in the skin of P. ussuriensis. Findings of this study will provide scientific basis and theoretical support for the prevention and control of hypoxia in P. ussuriensis and for the breeding of new stress-resistant strains in future.
Keywords: Pseudobagrus ussuriensis, skin, hypoxia, gene
目 录
1 前言 4
2 材料与方法 4
2.1 实验材料 4
2.2 实验方法 4
3 结果与分析 6
3.1测序数据质量评估、转录本拼接和基因功能注释 6
3.2 SNP和InDel分析、基因表达水平分析 8
3.3 低氧相关的差异基因的GO、Kegg富集分析 11
4讨论 13
结论 15
致谢 18
1 前言
乌苏里拟鲿(Pseudobagrus ussuriensis)又名乌苏里鮠(Leiocassis ussuriensis),俗名牛尾巴,隶属于鲶形目,鲿科,拟鲿属,属于中型肉食性鱼类,喜欢底栖,生长快,分布于黑龙江至珠江各个水系,数量较多[1]。乌苏里拟鲿在自然河流中的个体比较大,生长比较快,截止今天在各大河流中发现的最长的乌苏里拟鲿约1米[2]。乌苏里拟鲿的肉比较鲜嫩,有较高经济价值。
乌苏里拟鲿的鱼体长度较长,头部比较宽,比较扁平,尾部比较扁。乌苏里拟鲿的体表比较平滑,没有鱼鳞。有一层皮膜盖在了鱼的头顶,存在横裂的状态。前鼻孔是管状,前鼻孔跟后鼻孔距离比较远。有4对须,有1对鼻须。乌苏里拟鲿有强硬的背鳍,它的后缘具有齿痕。它的背面和侧面呈现灰黄色,上面的颜色比下面深。乌苏里拟鲿的腹部呈现白色,背鳍、尾鳍呈现黑色[3]。
河流中的氧气浓度与地面上的氧气浓度存在较大的差异。在一般情况下,水中溶氧浓度低于2 mg/L时称为水体低氧或缺氧(Hypxia)[4]。自然条件中,水体的富营养化会使水体中的氧气浓度迅速下降,导致了乌苏里拟鲿的大量死亡。因此,低氧胁迫已经成为了鱼类养殖死亡的重要原因。
目前,乌苏里拟鲿的研究主要集中于其人工养殖[5-7]、营养价值[8, 9]、杂交培育[10, 11]及微卫星文库[12]的构建等方面。暂还未涉及乌苏里拟鲿对低氧胁迫的研究。乌苏里拟鲿的低氧耐受性比较差,长期处于低氧的情况下容易死亡。针对养殖中低氧下鱼死亡的现状,本研究拟通过转录组测序方法,分析乌苏里拟鲿低氧处理下个体和正常个体皮肤基因的表达变化,以期初步了解在低氧过程中皮肤的表达状况,对皮肤基因进行进一步分析。通过本研究结果,为乌苏里拟鲿低氧下死亡的防治和今后该鱼抗逆新品种的选育提供科学依据和理论支持。
2 材料与方法
2.1 实验材料
本研究挑选6尾长度和重量相近的乌苏里拟鲿幼苗,该幼苗都来自江苏省淮安市水产技术指导站。试验条件为低氧胁迫下,所以需要用保鲜膜将培养器皿封闭起来,并且将溶氧仪放入其中,检测氧气浓度。
2.2 实验方法
2.2.1正常条件和低氧条件下乌苏里拟鲿的培养
用水族箱作为容器来培养乌苏里拟鲿,用保鲜膜将水族箱封闭起来以达到低氧的条件,正常条件下则不需要保鲜膜。低氧胁迫试验期间,水族箱中的溶氧量慢慢降低。在水族箱中溶氧量降低的同时,一些乌苏里拟鲿幼苗开始出现浮头甚至于休克。此时,挑选出浮头或休克的乌苏里拟鲿幼苗。用解剖刀将正常条件下和低氧胁迫下的乌苏里拟鲿幼苗的皮肤组织取出,存放于低温液氮罐中保存。将取出的皮肤组织送至北京诺禾致源科技有限公司进行转录组测序分析。
2.2.2 RNA提取、文库构建和转录组测序
用Trizol法对乌苏里拟鲿皮肤组织中的RNA进行提取,然后对提取的RNA进行样本检测。接下来检查RNA的降解程度有没有污染,采用琼脂糖凝胶电泳的方法。随后用Nanodrop的方法检测纯度,采用Qubit的方法对RNA浓度进行测量,用Agilent 2100来检测 RNA完整性。
提取的RNA样本检测合格后,用带有Oligo的磁珠富集[13, 14]生物mRNA。用多聚体(dt)磁珠纯化mRNA。将纯化的mRNA片段化,用随机六聚体引物合成第一链cDNA,随后进行第二链cDNA合成、末端修复和接头连接。用Ampure XP系统纯化这些片段,以优选长度为150-200 bp的cDNA片段。将3μL用户酶和所选大小的接头连接cDNA的混合物在37°C下培养15分钟,然后在95°C下培养5分钟。然后进行聚合酶链反应(PCR),利用Ampure XP系统纯化扩增子,在Agilent Bioanalyzer 2100系统上评估文库质量。在Illumina Hiseq 4000平台上对每个cDNA库进行测序,并生成成对的末端读取。
2.2. 3重新组装、功能注释和分类
首先通过内部perl脚本处理fastq格式的原始读取。清除包含适配器的读取、不确定的N核苷酸(比率为Ngt;10%)和低质量的原始读取,产生准确的读取。同时,Q源和GC-计算了清洁数据的含量。使用Trinity平台[15]高质量的干净读取用于转录组组装,默认情况下最小k-mer覆盖率设置为2,所有其他参数设置为默认值,无参考基因组。我们是根据以下数据库对单基因进行了基因功能注释:Nr(蛋白序列数据库)、Nt(核酸序列数据库)、Pfam(最全面的蛋白结构域注释的分类系统)、KOG/COG(前者针对真核生物,后者针对原核生物)、KEGG、(新测序物种的基因组或转录组的功能注释)、GO(基因本体论)、Swiss Prot(人工注释和审查的蛋白质序列数据库)。
2.2. 4 SNP/InDel与基因表达水平分析
SNP全称Single nucleotide polymorphisms,是指在基因组上由单个核苷酸变异形成的遗传标记,其数量很多,多态性丰富[16]。SNP位点有有4种不同的变异方法,但是真正的变异形式只有颠换和转换两种(2:1)。SNP序列上出现次数最多的是CG,在这之中最多的是C转变为T,C通常为甲基化的,脱去氨后,转变为甲基嘧啶。在一般情况下,SNP的变异率大于1%。InDel (insertion-deletion)是指相对于参考基因组,样本中发生的小片段的插入缺失,该插入缺失可能含一个或多个碱基[17]。我们通过samtools[18]工具对比对结果进行染色体坐标排序、去掉重复的reads等处理,最后通过变异检测软件samtools分别进行SNP和InDel 查找,最后进行过滤,得到分析结果。
样本的基因表达水平用RSEM来评估,得到其read count数目,然后进行FPKM转换。所以将read count数进行了FPKM转换。从而分析基因的表达水平。进行基因差异表达分析的数据为基因表达水平分析中得到的read count数据。为了验证转录组数据的基因表达结果,随机选择了一些DEG进行实时qPCR。针对qPCR的特异性引物对使用NCBI引物3-blast设计,这取决于RNA序列数据中提供的相应序列。利用OriginPro9.1软件,对qpcr和RNA序列数据进行线性回归分析。采用SPSS17.0软件进行t检验,检测两种数据的差异显著性。
3 结果与分析
3.1测序数据质量评估、转录本拼接和基因功能注释
通过Illumina HiSeqTM平台[19]对两组的6个乌苏里拟鲿皮肤组织样本的相应的转录组测序,一共产生了44602608条原始序列和43082490条过滤后的测序序列,达96.59%的原始数据的读取,包含了对准确读取的各项内容进行计算评估(表1)。
紧接着对转录本进行拼接,用Trinity对clean reads进行拼接。用高质量的clean reads组装成196883条平均长度为1778 bp的转录本,产生了大小为265 bp到103875 bp、N50长度为1912 bp,N90长度为463 bp的73772个单基因(表2,表3),就暂时的研究来看,该转录组的组装质量十分良好。
我们进行了七大数据库的基因功能注释,在这当中存在44996个单基因在至少一个数据库中具有同源性,3460个单基因在这7个数据库中都能够匹配(表4)。KOG是一个对同源基因产物进行分类的数据库。根据KOG注释的结果,73772个unigenes对KOG数据库产生7846个蛋白,分为26个组,包括1个未命名蛋白组。GO分析是一套国际标准化的基因功能描述的分类系统,我们这次的分析将25630个单基因分为生物过程、分子功能和细胞成分,在这之中生物过程包含26个子分类、分子功能包括10个子分类和细胞成分包括20个子分类。在生物学过程中,包括了生物调节、运动、代谢过程、对刺激反应、节律过程相关基因的调控,为乌苏里拟鲿低氧胁迫下皮肤的反应提供了解释。KEGG是通过确定分子水平上的信号通路来了解生物系统的高级功能的数据库。在现在的研究中,kegg分类显示7921个单基因在第二分类中被分类成32个途径。信号转导是其中最丰富的kegg途径,其次是免疫系统和内分泌系统,最少的是其他次要的生物代谢。基因功能注释的结果为进一步研究乌苏里拟鲿皮肤在低氧下的表达提供了一个很有作用的数据库。
表1乌苏里拟鲿皮肤转录组序列数据产出质量情况
样本名称 | 原始序列条数 | 清洁序列条数 | 清洁数据量 | 错误率(%) | Q20(%) | Q30(%) | GC(%) |
HP_F | 44602608 | 43082490 | 6.46G | 0.03% | 96.26 | 90.63 | 46.38 |
C1_F | 52579878 | 50569328 | 7.59G | 0.03amp; | 96.76 | 91.69 | 45.61 |
表2乌苏里拟鲿皮肤转录组序列拼接长度频数分布情况
长度范围 | 200-500bp | 500-1kpb | 1k-2kpb | gt;2kpb | Total |
转录本数 | 51294 | 47206 | 40539 | 57884 | 196883 |
单一基因数 | 26729 | 24727 | 11991 | 10325 | 73772 |
表3乌苏里拟鲿皮肤转录组序列拼接长度分布情况
最小长度 | 平均长度 | 长度中位数 | 最大长度 | N50 | N90 | 核苷酸总数 | |
转录本 | 301 | 1778 | 999 | 103875 | 3213 | 705 | 349980196 |
单一基因 | 265 | 1172 | 629 | 103875 | 1912 | 463 | 86460909 |
表4乌苏里拟鲿皮肤转录组单一基因注释情况
单一基因数 | 百分比(%) | |
NR数据库注释 | 23207 | 31.45 |
NT数据库注释 | 37047 | 50.21 |
KO数据库注释 | 7331 | 9.93 |
SwissPort数据库注释 | 20953 | 28.4 |
PFAM数据库注释 | 25630 | 34.74 |
GO数据库注释 | 25630 | 34.74 |
KOG数据库注释 | 7846 | 10.63 |
所有数据库中注释 | 3460 | 4.69 |
在至少1个数据库中注释 | 44996 | 60.99 |
总数 | 73772 | 100 |
3.2 SNP和InDel分析、基因表达水平分析
SNP位点有4种不同的变异方法,但是真正的变异形式只有颠换和转换两种(2:1)。SNP序列上出现次数最多的是CG,在这之中最多的是C转变为T,C通常为甲基化的,脱去氨后,转变为甲基嘧啶。在一般情况下,SNP的变异率大于百分之一。InDel是参照的基因组,RNA中片段发生缺失。通过samtools工具对比对结果进行染色体坐标排序、去掉重复的reads等处理,最后通过变异检测软件samtools分别进行SNP和InDel 搜寻。然后对单基因进行检测,对他们的p值进行由小到大的排序,从这当中挑选出20个与低氧胁迫相关的基因,这其中上调和下调分别10个。将上调基因和下调基因列于下表5,可以看到这20个相关基因的InDel标记点全部都有,SNP标记位点除3个基因以外其他基因也全有。表明了低氧胁迫使乌苏里拟鲿的皮肤组织基因转录组发生了显著性的突变,尤其是有关调控与路径的基因突变位点更多。
图1低氧胁迫组皮肤表达基因的 FPKM密度分布图
图2对照组皮肤表达基因的FPKM密度分布图
图3不同实验条件下基因表达水平对比图
图4不同实验条件下基因表达水平对比图
表5差异基因中突变位点分析表
基因ID | 基因本体生物学途径 | BP描述 | InDel突变数 | SNP突变数 |
上调基因 | ||||
Cluster-22482.13030 | -- | 硫转移酶活性 | 2 | 4 |
Cluster-22482.13430 | -- | 激酶活性 | 3 | 3 |
Cluster-22482.14829 | GO:0006308 | DNA分解过程 | 2 | 41 |
Cluster-22482.15453 | GO:0008643 | 糖运输 | 2 | 2 |
Cluster-22482.16492 | GO:0000256 | 嘌呤核苷代谢 | 2 | 34 |
Cluster-22482.16596 | GO:0006813 | 钾离子输运 | 5 | 1 |
Cluster-22482.17140 | GO:0031110 | 核分裂 | 2 | 2 |
Cluster-22482.17748 | -- | 核酸结合 | 2 | 1 |
Cluster-22482.18550 | GO:0009089 | 氧化还原过程 | 4 | 2 |
Cluster-22482.3297 | GO:0032979 | 蛋白质从内侧插入线粒体膜 | 3 | 1 |
下调基因 | ||||
Cluster-22482.10449 | GO:0006355 | 转录调节 | 7 | 13 |
Cluster-22482.14492 | -- | 钙离子结合 | 2 | 0 |
Cluster-22482.15249 | -- | 蛋白质结合 | 3 | 3 |
Cluster-22482.12363 | -- | 碳水化合物结合 | 1 | 13 |
Cluster-22482.8557 | GO:0007165 | 多糖转运 | 7 | 3 |
Cluster-22482.12129 | GO:0055085 | 跨膜运输 | 12 | 13 |
Cluster-22482.9952 | GO:0055114 | 氧化还原法 | 2 | 15 |
Cluster-22482.13379 | -- | 钙离子结合 | 3 | 1 |
Cluster-22482.13598 | GO:0006508 | 蛋白水解 | 12 | 11 |
Cluster-22482.9756 | -- | 钙离子结合 | 9 | 3 |
根据图1可知,低氧胁迫下乌苏里拟鲿的皮肤的FPKM非标准正态分布可知,当基因的log10(FPKM)值在0.1到0.5之间的时,对应log10(FPKM)的相对密度有最高值,则表示该表达量水平的基因数最多。
根据图2可知,在正常情况下的乌苏里拟鲿的皮肤的FPKM非标准正态分布可知,当基因的log10(FPKM)值在-2到4之间的时,对应log10(FPKM)的相对密度有最高值,即该表达量水平的基因数最多。
图3,4是对不同实验条件下基因的FPKM做密度盒形图及分布图。表3的横坐标为基因的log10(FPKM)值,数值越大,则基因的表达量越高;纵坐标为对应log10(FPKM)的密度,颜色不同则表示样品的种类不同,该图从表达量的总体分布角度来衡量各样品之间的差异。表达了低氧情况和正常情况乌苏里拟鲿皮肤组织基因之间差异显著。表4的FPKM盒形图,纵坐标是log10(FPKM 1),横坐标是样品名称,每个区域的盒形图对五个统计量,该图从表达量总体的离散角度来衡量各样品之间的差异。通过离散的角度的差异,显示出低氧情况和正常情况乌苏里拟鲿皮肤组织基因之间差异显著。
3.3 低氧相关的差异基因的GO、KEGG富集分析
3.3.1 GO富集分析
为了确定低氧胁迫对乌苏里拟鲿皮肤基因转录组变化的功能意义,对572个低氧相关的差异基因进行了GO富集分析(图5)。将这差异基因列成柱状分析图,根据图1可知,GO富集的三大类别中,生物过程和细胞成分所占比例较高,分子功能所占的比例最少。GO富集分析显示,在生物过程、细胞成分和分子功能的三大类中,18个子类显著富集(q小于0.01)。我们将q值进行由小到大的排序,分别在上调和下调基因中挑选前十个显著的表达基因。在这之中,催化活性过程(GO:0003824)和活性氮代谢过程(GO:2001057)是前两个显著富集(q=0和q=0)。在筛选到的3160条差异表达显著的序列中,其中有1874条与生物过程相关,在生物过程中主要有细胞成分组织和细胞器的组织;有443条与细胞组分相关,有843条与分子功能相关,主要分子功能是蛋白质结合、焦磷酸酶活性。
图5乌苏里拟鲿低氧胁迫皮肤转录组差异基因GO注释柱状图
3.3.2 KEGG富集分析
将差异基因制成KEGG富集散点图(如图6),根据下图对q值以及Rich factor(差异基因与注释基因的比值)的比较,从图中发现,紧密连接(tight junction)通路富集的基因数目最多,viral myocarditis(病毒性心肌炎)、DNA replication(DNA复制)和phagosome(紧密连接)等在这其中kegg富集尤为显著。基因相互协调行使其生物学功能,经过Pathway显著性富集能够确定差异表达基因参与的最主要的生化代谢途径和信号转导途径。为了确定低氧胁迫对乌苏里拟鲿皮肤组织的转录变化的功能意义,对572个差异相关基因进行了Kegg富集。通过对差异相关基因的q值进行排序,挑选前二十个q值最小的与低氧胁迫相关基因,上调和下调分别10个。通过研究发现,这20个基因的KEGG富集中有8个基因与信号通路显著相关,这些通道分别是阿尔茨海默病(ko05010)、精氨酸和脯氨酸的代谢过程通路(ko00330)、紧密连接通路(ko04530)、JAK-stat信号通路(ko04630)、HIF-1信号通路(ko04066)、醛固酮的合成会分泌(ko04925)、内质网蛋白质加工通路(ko04141)等,在这其中信号通路基因最多的是阿尔茨海默病(ko05010),多达158个基因。表明了低氧情况下要比正常情况下更容易使乌苏里拟鲿的皮肤基因差异表达,产生致病因素。
剩余内容已隐藏,请支付后下载全文,论文总字数:13408字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;