· 用户注册 · 设为首页 · 加入收藏 · 联系站长 · · ·
 | 网站首页 | 文章中心 | 图片中心 | 影音在线 | 下载中心 | 许愿祝福 | 我要投稿 | 
您现在的位置: 生物小吧 >> 文章中心 >> 高校教程 >> 遗传学 >> 正文 今天是:
第二节 基因组学
作者:农学院    文章来源:浙江大学精品课程网    点击数:2816    更新时间:2007/7/5
         【字体:

                

  基因组学(genomics) :
  遗传学研究进入分子水平后发展起来的一个分支,主要研究生物体内基因组的分子特征。
  * 研究对象:
  以整个基因组为研究单位,而不以单个基因为单位作为研究对象。
  * 研究目标:
  认识基因组的结构、功能和进化;
  阐明整个基因组所包含的遗传信息和相互关系;
  充分利用有效资源,预防和治疗人类疾病。
  重要组成部分:
  基因组计划(genome project)大体上可分为:
  ⒈ 构建基因组的遗传图谱;
  ⒉ 构建基因组的物理图谱;
  ⒊ 测定基因组DNA的全部序列;
  ⒋ 绘制基因组的转录本图谱;
  ⒌ 分析基因组的功能。
  基因组计划研究开始于1990年。
  美国启动被誉为“人体阿波罗计划”的“人类基因组计划” ,投资30亿美元,计划历时15年测定人类基因组的30亿个核苷酸对的排列次序构建高分辨率的人类基因组遗传图谱和物理图谱发展生物信息学。
基因组计划

人类基因组计划
人类基因组计划

  2001年12月14日,美、英等国科学家宣布绘制出拟南芥基因组的完整图谱。
  在美国提出人类基因组计划后,日本和中国分别于1991年和1992年启动了“水稻基因组计划”。
  2002年4月5日《Science》以14页的篇幅刊登和宣布中国科学家独立绘制完成水稻基因组草图序列(总数:4.6亿),是继人类基因组工作草图之后完成测定的最大基因组。
  材料:籼稻“9311”。
  完成单位:华大基因研究中心、中科院遗传与发育生物学研究所等12个单位,2001年7月启动。
  水平:水稻基因组的总基因数约为46022-55615个(接近人类基因数的两倍),工作框架图序列已覆盖水稻整个基因组92%以上的基因。
  方法:“鸟枪射击法”,利用国产曙光2000、曙光3000超级计算机(1000亿次/秒)对随机DNA碎片进行排序和组装,确定其在基因组的正确位置。
  计划:功能基因分析和蛋白质研究。
  2002年12月21日《Nature》宣布中国独立绘制完成粳稻基因组第四号染色体精确测序图,我国对国际水稻基因组测序计划贡献率为10%。
  材料:粳稻“日本晴”。
  完成单位:中科院国家基因研究中心等4家单位。
  水平:第四号染色体中的总碱基数目为0.35亿碱基对,覆盖了该染色体全长序列98%的区域,只剩下7个小空洞,碱基序列的精确度达到99.99%。完整测定的着丝粒序列在高等生物中属于首次。
  计划:对预测鉴定的4658个基因作进一步分析,并对着丝粒功能等作研究。
  国际水稻基因组测序计划:
  国际水稻(粳稻)基因组计划始于1998年,日本、美国、中国、法国等国家和地区参加。
  染色体4:36Mb(占9-10%)。

国际水稻基因组测序计划

  一、基因组图谱的构建:

  基因组中核苷酸顺序的测定方法:
  利用现有DNA测序方法,每个测序反应通常只能得到 800个核苷酸的序列。
  小基因组物种常用鸟枪射击法。
  大基因组测序存在两个问题:
  * 片段数(n)庞大,片段间连接和装配非常复杂,重叠数为2n2–2n;
  * 基因组中相同或相似的重复序列在连接和装配时容易出错。
  解决方法:大规模序列测定前,构建基因组图谱可作为序列测定中制定测序方案的依据,以便锚定测知的核酸序列在染色体上的位置。
  测序方法:
  * 克隆连续序列法(clone contig):
  将基因组DNA切割成长度为0.1-1Mb的大片段克隆到YAC或BAC载体上分别测定单个克隆的序列再装配连接成连续的DNA分子。
  * 定向鸟枪射击法(directed shotgun):
  以基因组图谱中标记为依据测序装配和构建不同DNA片段的序列。

定向鸟枪射击法


   基因组图谱根据构建的途径,可分为两种:
  * 遗传图谱:
  根据遗传性状(如已知基因位点、功能未知的DNA标记、可鉴别的表型性状)的分离比例将其定位在基因组中,构建相应的连锁图谱。
  * 物理图谱:
  将各种标记直接定位在基因库中的某一点上。

  ㈠、遗传图谱的构建:

  1. 图谱标记:可用基因或DNA作为可鉴别的标记(marker)。
  ⑴. 基因标记:基因控制性状的表现,利用可鉴别的形态、生化等表型性状作标记根据连锁交换原理来分析基因之间的连锁关系和遗传距离绘制连锁图谱。
  缺点:基因数目有限、所构建遗传图谱不详细、标记间的遗传距离较大。

两种基因组图谱构建

基因标记

  ⑵. DNA标记:
  每种生物DNA具有稳定性。
  DNA本身可作为构建遗传图谱的标记,主要有以下3种类型:
  ①. 限制性内切酶多态性:

DNA标记

  限制性内切酶能识别和切割特异核苷酸序列,DNA序列能或不能被某一酶酶切,实际上相当于一对等位基因的差异。
  如一对同源染色体二个DNA分子,一个具有某种酶的酶切位点,另一个无此位点酶切后形成的DNA片段长度就会有差异,即多态性(RFLP)根据该等位基因的遗传,将RFLP作为标记定位在基因组的某一位置上。
  ②. 简单序列长度多态性
  (simple sequence length polymor-phisms,SSLP) :
  SSLP是一些长度不等的重复序列、有多个等位基因位点。
  * 多次重复序列(variable number of tandem repeats,VNTR) :
  也称微随体(minisatellite),重复序列长度为几十个核苷酸。
  * 简单重复序列(simple tandem repeats,STRs):
  又称为小随体(microsatellite) ,常只有2-4个核苷酸重复单位。
  利用STR作为标记更为普遍:
   STR分布在整个基因组中,而VNTR主要集中在染色体末端;
  STR的PCR检测速度更快、准确性更高,因为STR长度通常在300bp以下,而VNTR相反。
  ③. 单核苷酸多态性
  (simple nucleotide polymorphisms,SNPs) :
  基因中点突变数量多,其中有些可产生RFLP(发生在酶切位点)。
  人类基因组中的编码序列中约有20万个SNPs标记,非编码序列中约有多10倍以上的标记。
DNA标记

  SNP位点可用寡核苷分子杂交来检测:
  * DNA芯片技术:将不同的寡核苷酸固定在芯片上标记待测DNA一次就可检测很多SNPs标记;
  * 特异等位基因动力学杂交法:利用液体杂交法检测,在酶标偶联反应板的96孔中进行分子杂交用一种只与双链DNA结合的荧光染料检测当两条DNA分子完全互补配对时,形成双链DNA时才有信号检测SNPs。

DNA芯片技术

  2.遗传图谱的构建:
  ⑴. 人类基因组遗传图谱的构建:
  家系分析法:分析8个家系134个成员(186个减数分裂)根5264个STR(简单重复序列)标记绘制而成(X染色体分析是利用12家系170个成员[105个减数分裂])将5264个标记定位在2335个位点?构建的人类基因组遗传图谱密度为每个标记599 kb。
  ⑵. 植物基因组遗传图谱的构建:
  ①. 选择亲本:
  亲缘关系远,遗传差异性大,亲本间分子标记多态性强。
  ②. 产生构图群体:
  配制组合?建立分离群体:
  * 单交组合产生的F2;
  * 衍生的F3、F4家系;
  * 由连续多代自交或姐妹交产生的重组近交系(recombinant inbred lines,RIL);
  * 通过单倍体加倍而成的双单倍体(doubled haploids,DH);
  * 利用回交或三交(复交)产生的后代群体。
  ③. 遗传标记的染色体定位:
  有单体、三体、代换系与附加系分析等方法,依据染色体剂量的差异?将遗传标记定位在特定染色体上。
  当供体材料总DNA等量时,DNA杂交带的信号强弱与该标记位于的染色体剂量成正比。
  ④. 标记间的连锁分析:
  通过分析分离群体内双亲间有多态性的遗传标记的连锁交换情况和趋于协同分离的程度即可确定标记间的连锁关系和遗传距离。
人类染色体
遗传图谱的构建

  (二)、物理图谱的构建:

  1. 构建物理图谱的原因:
  ⑴. 遗传图谱的分辩率有限:
  低等生物可重复进行多次杂交、测交在短期内可产生大量群体、得到大量重组交换的子代群体构建高密度的遗传图谱。
  人类或其它高等生物难以获得大量的子代群体,减数分裂的后代有限限制连锁分析。
  ⑵. 遗传图谱的精确性不高:
  染色体上有一些重组热点,其发生重组的频率高于其它位点?影响重组热点邻近区段的遗传图谱准确性。


  2. 构建物理图谱的三条途径:
  ⑴. 限制性酶图谱:
  利用限制性内切酶绘制图谱,对于DNA分子长度小于50kb的片段,一般没有困难。而对于>50kb的DNA分子,可选用稀有切点内切酶酶切DNA。
遗传图谱

  * 用识别位点较多核苷酸的内切酶:
  如Not I,为8个核苷酸出现的频率为1/48=1/65536bp;
  而识别位点为6个核苷酸的出现频率为1/46=1/4094bp。
  * 选用其酶切位点在基因组中出现频率低的内切酶 :
  人类基因组中,5’-CG-3’出现的频率很低:
  Sma I(5’-CCCGGG-3’)酶切DNA,每78kb有一个切点;
  BssH II(5’-GCGCGC-3’)酶切DNA,每390kb有一个切点;
  Not I(5’-GCGGCCGC-3’)酶切DNA,每10 Mb只有一个酶切点。
限制性酶图谱

  ⑵. 荧光原位杂交(fluorescent in situ hybridization,FISH) :
  物理图谱构建方法:荧光标记的探针与DNA分子杂交染色体上杂交信号(即探针DNA在染色体上的图谱位点)在显微镜下可直接观察。
  步骤:取有丝分裂中期的细胞制片将染色体变性成单链将标记DNA探针变性后杂交到染色体上观察分析。
  右图为pSc119.2探针均可与小麦B组染色体杂交,产生黄色的杂交信号。
  ⑶. 序列标签位点:
  已知序列为标签的位点(sequence tagged sites, STS)作探针,与基因组DNA杂交?绘制物理图谱。
  STS的要求:
  * 为已知序列,便于PCR检测;
  * 基因组中仅此一个位点,无重复。
小麦B组染色体杂交

  常用的两大类型STS:
  ①. 特异DNA序列:
  * 表达的序列标签(expressed sequence tag,EST),表达的序列来自cDNA。
  * 简单序列长度多态性(SSLP)也可用于物理图谱的构建,比较遗传图谱和物理图谱。
  * DNA随机片段,测序后经分析比较,非重复序列可作为STS。
  ②.DNA片段:
   分为两种不同类型:
  * 辐射杂交系(radiation hybrid) :指啮齿动物细胞含有另一个生物染色体片段的细胞株。

  细胞遗传学研究表明:
  用3000-8000radX射线处理后人类染色体会出现随机断裂将处理细胞与正常仓鼠或其它啮齿动物细胞融合断裂的人类染色体可与仓鼠染色体融合复制利用100个人类基因组辐射后与缺失仓鼠细胞融合形成的辐射杂交系(能在HAT培养基上生长的就是含有人类染色体片断的细胞进行人类基因组物理图谱的构建。
  * 克隆的DNA片段序列:
  利用YAC或BAC克隆的DNA,测序后可作为分子标记。
  不同克隆测定后,进一步分析克隆之间的重叠部分,将各克隆连接进来,可作为STS使用。

克隆的DNA片段

细胞遗传学研究

  3. 人类基因组物理图谱:
  人类基因组序列开始测定时,已有45万个EST,其中有一些重复序列经计算机分析筛选后得到49625个,各代表一个基因再从中筛选出3万个EST、二个辐射杂交系库(分别有83和93个细胞株)、一个有32000个克隆的YAC文库用于构建图谱。
  构建的物理图谱密度为每个标记183kb,EST分布结果表明基因在染色体上的排列是不均匀的。
  将上述遗传图谱及其它物理图谱整合构成更加完整的人类基因组图谱,作为基因组序列测定的框架和分析依据。

  二、基因组图谱的应用:

  基因组图谱中除了构建遗传图谱和物理图谱外,还可进一步根据标记类型细分为不同的称谓。
  如RFLP图谱、RAPD图谱、AFLP图谱等,目前已在拟南芥、番茄、水稻等30多种植物中构建了基因图谱。
  基因图谱的构建除了进行测序之外,还有许多用途。

  1. 基因定位:
  借助基因组图谱,可使基因定位在精度、深度、广度等方面有极大的提高。已陆续在一些农作物上定位了许多重要农艺性状和经济性状的基因,在复杂数量性状位点(quantitative trait loci,QTL) 定位分析方面,也取得了很大进展。

基因定位

  2. 基因组比较分析:
  已经在禾本科玉米、水稻、高粱、大麦、小麦和黑麦,茄科番茄、胡椒、马铃薯,十字花科拟南芥、甘蓝、花椰菜、油菜等进行遗传图谱比较分析,并从分子水平上了解物种间同源性,研究基因组的进化和染色体的演变。

  3. 标记辅助选择(marker-assisted selection MAS):
  饱和基因组图谱可用来确定与任何一个目的基因紧密连锁的分子标记?根据图谱间接选择目的基因,可降低连锁累赘,加速目的基因的转移与利用,提高回交育种的效率。

  4. 基因的克隆与分离:
  根据饱和基因组图谱,可找到一个与目的基因紧密连锁的分子标记,作为染色体步行(chromosome walking)起始点进行基因的克隆和分离,此法亦称图位克隆法(map-based cloning),为基因产物未知的基因克隆提供了捷径。
  下图为染色体步行法。

基因的克隆与分离
   三、后基因组学(post-genomics) :

  在完成基因组图谱构建以及全部序列测定的基础上研究全基因组的基因功能、基因之间相互关系和调控机制为主要内容的学科。
  目前人类基因组计划已将计划完成全序列测定的时间从2005年提前到2003年。
  2001年4月26日,公布了人类基因序列框架草图。

  自从1996年酵母菌基因组全序列测定以来,全世界已有1000多个实验室、5000多名科学家从事酵母菌后基因组学的研究,共发表论文7000多篇,鉴定1060个新基因的功能,但仍然还有约1600个阅读框架的功能不清楚。
  后基因组学主要技术:
  DNA微列阵技术;
  蛋白质组学;
  酵母菌双杂交系统;
  生物信息学等技术。
  1. DNA微列阵(DNA microarrays) :
  是利用DNA芯片技术?同时进行大量分子杂交,分析比较不同组织或器官的基因表达水平,筛选突变基因,从核酸
水平分析基因表达模式。

DNA微列阵
研究芯片技术
水稻生物芯片

  2. 蛋白质组学(proteomics) :
  在蛋白质水平研究基因组的基因表达分析基因组的蛋白质类型、数量、空间结构变异以及相互作用的机制。
  蛋白质组学比基因组学更为复杂:
  DNA线状结构与二级结构的功能差异不大,但多肽链需折叠成一定的三维空间结构才形成有功能的蛋白质;同一种蛋白质经不同的加工修饰可形成不同的功能,因此蛋白质的多样性远复杂于基因本身。

  3. 酵母菌双杂交系统(two hybrid-systems) :
  利用酵母菌同一个细胞中共同表达不同蛋白质,以鉴定蛋白质之间互作的一种分析方法。
  真核生物的基因表达受转录因子控制。
  转录因子具有DNA结合及激活转录两功能,分别由不同区域完成,而且将这两部分分割成两个片段后分别克隆仍能装配成一个完全有功能的转录因子。
  设计思路如下:
  酵母双杂交系统(见下图):
  ⒈当报告基因(如半乳糖苷酶基因)缺少转录因子时处于关闭状态;
  ⒉将酵母菌转录因子 DNA结合区域和RNA酶激活区域分开分别克隆;
  ⒊将DNA结合区域与待测目的基因(蛋白质A)和报告基因共同串连起来形成融合基因。同时将激活区域序列与另一类DNA序列(蛋白质X)也串连起来;
  ⒋将两类融合分子共转化酵母细胞,如蛋白质X能与蛋白质A互作结合、RNA聚合酶激活因子与启动子区域DNA结合使报告基因表达,易于鉴定。

酵母双杂交系统

  4. 生物信息学(bioinformatics) :
  是一种用计算机贮存原始资料,分析生物信息,将DNA芯片以及蛋白质双向电泳结果转变成为可读的遗传学信息的学科。
  生物信息学是现代生物技术与计算机科学的结合,收集、加工和分析生物资料和信息。

计算机贮存生物信息

  生物信息学是在未来生命科学中起关键作用的学科之一 。
  应用生物信息学可以将来自不同的基因组理论和应用综合并标准化,利用大量的生物信息资料了解遗传网络系统、信号传递及相互关系,计算机还可进行一些生物模拟研究。
  利用生物信息学能够分析从微生物、动物、植物以及人类基因组序列测定产生的大量资料阐明遗传信息。

文章录入:admin    责任编辑:admin 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    生物小吧