摘 要:模式生物在生命科学的研究中有着重要的意义,特别是随着功能基因组计划的开展,数种生物的基因组序列已获得,这对基因功能的深入研究打下了坚实的基础。文章简要介绍了几种经典模式生物的概况。
关键词:模式生物;基因组;分子生物学
模式生物是人们研究生命现象过程中长期和反复作为研究材料的物种,如海胆、果蝇、线虫、拟南芥等。早在20世纪最初的20年中,人们就发现,如果把关注的焦点集中在相对简单的生物上,则发育现象难题可以得到部分解答。因为这些生物的细胞数量少,分布相对单一,变化也较好观察。由于进化的原因,细胞生命在发育的基本模式方面具有相当大的同一性,所以利用位于生物复杂性阶梯较低级位置上的物种,来研究发育共同规律是可能的。尤其是当在有不同发育特点的生物中发现共同形态形成和变化特征时,发育的普遍原理也就得以建立。因为对这些生物的研究具有帮助我们理解生命世界一般规律的意义,所以它们被称为“模式生物”。随着科学的发展,其范围也在不断的扩大。
1987年美国国立卫生院研究所(National Institute of Health,NIH)和美国能源部(Departmentof Energy,DOE)联合提出了“人类基因组计划”(Human GenomeProject,HGP),并于1990年10月1日正式启动,同时包括已经完成基因组测序的黑猩猩、小鼠、大鼠和河豚鱼等,以及猕猴、猪、牛、狗、兔、荷兰猪、大象、小袋鼠、负鼠、鸭嘴兽、九带犰狳、刺猬、刺头猬、香鼠、鸡、斑马鱼、三刺鱼、文昌鱼、八目鳗、蜗牛、海鞘、海胆、蜜蜂、甲虫、珊瑚虫、淡水纤毛虫、旋毛虫、十几种果蝇、数种线虫、30余种真菌等。这些重要代表物种不仅涵盖了生命进化过程中的各个主要环节,也包括了与人类生物医学研究相关的几乎所有物种。而且这个物种范围还在不断增加,各个计划完成的时间也在不断加快。由于模式生物在现代生命科学舞台上扮演着举足轻重的角色,已经成为各国生物学家关注的焦点。目前HGP已揭开了新的一页,从基因组与环境相互作用的高度阐明基因组的功能,亦即功能基因组学,其内容包括建立单核苷酸多态性(SNP)为代表的DNA系列变异的系统目录,通过对进化不同阶段的生物体基因组序列的比较,发现基因组结构组成和功能调节的规律,并利用模式生物体的基因敲除和转基因来揭示基因的功能[1]。为了顺利完成人类基因组计划特别是功能基因组计划,开展一些模式生物基因组的研究是必要的,于是相继启动了模式生物基因组计划(modelorganism genome project,MOGP)如大肠埃希菌(Escherichiacoli)、流感嗜血杆菌(Haemophilusinfluenzae)、酿酒酵母(Saccharomycescerevisiae)、秀丽线虫(Caenorhabditiselegans)、果蝇(Drosophilamelanogaster)、拟南芥(Arabidopsisthaliana)、小鼠(Musmusculus)等的基因组研究计划[2]。2000年6月26日,HGP与Celera公司的负责人共同宣布了人类基因组工作框架图的完成;2001年2月并分别将自己测定的框架图发表在Nature和Science[3]。发表的工作框架图已能覆盖人类基因组的97%,其中至少92%的序列已组装得准确无误,并认为编码蛋白质的为3万~4万多个,不是以前估计的10万~14万个。模式生物基因组计划作为HGP的重要组成部分,在HGP特别是比较基因组学研究和完成过程中扮演了重要的角色,对提前完成HGP的主要目标起到前所未有的作用。现通过介绍模式生物基因组研究进展情况,来揭示生物体间的本质联系。
1 几种经典模式生物的概况
模式生物的种类较多,以下简要介绍几种经典的模式生物,其基因组学的基本概况见表1。
1.1 海胆
海胆(Echinoidea)是棘皮动物门海胆纲的通称,分2亚纲,22目,化石种5000种,现生种800种,分隶于225个属。中国已知约100种。海胆(seaurchin)是生物科学史上最早被使用的模式生物,它的卵细胞和胚胎对早期发育生物学的发展有举足轻重的作用。早在1875年,OscerHertiwig(1849年-1922年)就开始以海胆为材料研究受精过程中细胞核的作用。1891年,HansDriesh(1876年-1941年)在显微镜下把刚刚完成第一次卵裂的海胆胚胎一分为二,结果发现,分开后的两个细胞各自形成了一个完整的幼虫。证明了胚胎具有调整发育的能力,为现代发育生物学奠定了第一个观念里程碑。
1.2 大肠埃希菌
大肠埃希菌(Escherichiacoli)是Escherich在1885年发现的,在相当长的一段时间内,一直被当作正常肠道菌群的组成部分,认为是非致病菌。直到20世纪中叶,才认识到一些特殊血清型的大肠埃希菌对人和动物有致病性。大肠埃希菌作为外源基因表达的宿主,遗传背景清楚,技术操作简单,培养条件简单,大规模发酵经济,倍受遗传工程专家的重视。目前大肠埃希菌是应用最广泛、最成功的表达体系,常作为高效表达的首选体系。20世纪70年代,通过对大肠埃希菌的研究发现了操纵子学说并且绘制成了完整基因图谱,基因组全序列完成,全长为5Mb,共有4 288个基因,同时也搞清了所有基因的氨基酸序列。62%的基因功能已经阐明,仍有38%基因功能尚未完全搞清[4]。
1.3 流感嗜血杆菌
1995年7月,流感嗜血杆菌(Haemophilusinfluenzae)第一个细菌基因组全序列发表,大小为1.8 Mb,1703个基因或开放阅读框(ORF)。从其DAN全序列中鉴定出76个基因,其中32个(与其他病原菌同源)均表达细胞表面蛋白[5]。389种无已知蛋白质可比,347种与推导的蛋白质相符,已知作用的有1007种。富含G-C的区域是6个rRNA操纵子和Mu样原噬菌体区,G-C含量超过40 %。这是微生物以至整个生物学领域的一个里程碑。
1.4 酿酒酵母
酿酒酵母(Sacharomycescerevisiae)是一种单细胞生物,能够在基本培养基上生长,使得实验者能够通过改变环境控制其生长。因为酿酒酵母与同为真核生物的动物和植物细胞具有很多相同的结构,又容易培养,酵母被用作研究真核生物的模式生物,也是目前被人们了解最多的生物之一。在人体中重要的蛋白质很多都是在酵母中先被发现其同源物的,其中包括有关细胞周期的蛋白、信号蛋白和蛋白质加工酶。酵母在单倍体和二倍体的状态下均能生长,并能在实验条件下相互转换,对其基因功能的研究十分有利。酵母的生命周期短,适合经典的遗传学分析,使得在酵母16条染色体上构建精细的遗传图谱成为可能。酵母是最简单的真核生物,个体小,生长快,生长周期仅为70min左右,易培养,易操作,对人体无毒害作用。遗传基因结构研究得比较清楚。1996年4月国际互联网的公共数据库中公布,基因组为15Mb。将所有的酵母基因同GenBank数据库中的哺乳动物基因进行比较(不包括EST顺序),发现有将近31%编码蛋白质的酵母基因或者开放阅读框与哺乳动物编码蛋白质的基因有高度的同源性[3]。通过对酵母蛋白质间的相互作用的研究,初步绘制了6 000种蛋白质之间的互作图谱。有关酵母的基因组和蛋白质组数据可登录SGD、YPD[6]。
1.5 秀丽线虫
秀丽线虫(Caenorhabditiselegans)是医学研究中的一种重要模式生物。2002年诺贝尔生理医学奖得主布瑞纳、苏斯顿及霍维兹的重要贡献有二,一是建立了线虫的模式生物系统,他们运用对线虫优越及完善的遗传分析技术,发现了许多影响线虫发育的基因,其中包括作用于计划性细胞死亡的一些重要基因,这让研究者有机会一窥计划性细胞死亡的机制。另一贡献是将牵涉到细胞死亡的重要基因,在人类基因体中找到同源基因,而让细胞死亡机制能在人类基因中进行进一步研究。这些重要成就不仅让大家了解线虫,又因线虫及人类基因体之间的保守性,将这些研究应用在人类的疾病及医学上有卓越贡献。秀丽线虫是了解的最清楚的模式生物之一,线虫虫体长1.5mm,容易培养和保存,一次杂交仅需3d时间,突变体性状特征明显。成虫个体有959个体细胞组成302个神经元构成神经网络。1990年进行基因组计划的研究,于1998年12月完成了基因组测序,基因组大小100Mb,分布于6条染色体,预测有19 099基因[7]。秀丽线虫的数据库有NEX-TIDB,秀丽线虫收入SWISS - PROT的蛋白质已超过1 000个[8]。细胞程序性死亡的遗传调控机制,RNAi及其遗传机制的发现是秀丽线虫对当代生命科学发展的又一重要贡献。
1.6 果蝇
果蝇(Drosophilamelanogaster)曾三度飞进卡罗林斯卡医学院的颁奖大厅,为主人领回诺贝尔生物医学奖桂冠(1933年摩根,1946年缪勒,1995年刘易斯、尼尔森-沃哈德和维斯郝斯)。摩根1933年因发现了果蝇白眼突变的性连锁遗传,提出了基因在染色体上直线排列以及连锁互换定律被授予诺贝尔奖。1946年,摩根的学生,被誉为“果蝇的突变大师”的缪勒,证明X射线能使果蝇的突变率提高150倍,因而成为诺贝尔奖获得者。在近代发育生物学研究领域中,果蝇的发生遗传学独领风骚。1995年,诺贝尔奖再次授予三位在果蝇研究中辛勤耕耘的科学家。果蝇为进一步阐明基因-神经(脑)-行为之间关系的研究提供了理想的动物模型[9]。果蝇世代周期短,一般10 d~12d,体小容易饲养,培养费用低廉,繁殖力强,分布广泛。染色体数目少,黑腹果蝇只有4对染色体,幼虫唾液腺中有巨大的唾液腺染色体,其上的横纹和间带区分地十分清楚,2000年3月宣布了基因组全序列为180Mb。有13 601基因,其中一半的基因功能还没有搞清楚,有1600个碱基跨度区仍未能完全测序。果蝇基因组的完成使人们确信“全基因组鸟枪法”(Whole genomeshotgun)和“片段处理法”的结合将成为解译大基因组最有效的方法。同时,其他生物的“遗传图”也可以建立在果蝇研究的经验基础上[10]。果蝇的基因组数据库可参看Fly Base[11]。
1.7 拟南芥
拟南芥(Arabidopsisthaliana)是典型的十字花科植物,虽然没有任何经济价值,但因为具有一些独特的生物学特性而成为当今分子生物学家、遗传学家和发育生物学家的宠儿。其个体小,成熟个体只有约15cm高,大量的植株可以种在一块很小的地方,而且也可在培养皿中生长。生长周期短,播种后2 d~3 d就开始萌发,20d左右植株就开始开花结果,40d左右种子成熟并且每株能产生上万粒种子。1996年拟南芥基因组国际合作项目启动,至2000年12月,第一个植物基因组——拟南芥基因组被全部测序,遗传图谱、物理图谱建立,序列大小为125Mb。基因组测序区段覆盖了全基因组的115. 4Mb,分析共含有25 498个基因,编码蛋白来自11 000个家族。
1.8 小鼠
自1979年Mintz等人将SV40病毒DNA导入小鼠(Musmusculus)早期胚胎的囊胚腔,得到了第一个承载有人工导入的外源基因的嵌合体小鼠以来,小鼠已成为生物学、医学、分子生物学、分子遗传学、免疫学等广泛领域的模式动物,是人类的近缘亲戚的哺乳动物,只有几亿年的进化距离,基因组与人类的差不多,大小为3000 Mb,基因的数目与人的也差不多,已经发现的人类基因,小鼠不仅都有,而且都很相似[12]。现已育成千余个独立的远交群和近交系,是生物医学研究中广泛使用的模式生物。因此,小鼠是人类基因组研究主要模式生物之一。
1.9 河豚鱼
河豚鱼(Globefish fish)是一种新的模式生物。其基因组特点是大小只有300 Mb~400Mb(为人类基因组的1/7~1/8),重复序列少且成簇排列,基因间序列少而小,内含子普遍比人的小,基因数目却与人的大致相当。河豚鱼作为脊椎动物基因组研究的模式生物,在比较测序、基因分离、基因结构功能的研究、基因转移等方面有着极高的科学价值和广泛的应用前景。
1.10 斑马鱼
斑马鱼(Daniorerio)为一种热带硬骨鱼,是研究脊椎动物器官发育和人类疾病的重要遗传学模型之一[13],其显著优势在于体积小(3 cm~4 cm),可在较小的空间大量繁殖;产卵量高(每周200多个);发育快,许多组织在受精后24h开始形成;成熟周期短;体外受精且胚胎透明,可在体视解剖镜下观察。斑马鱼的基因组中大约含有30000个基因,这个数目与人类差不多,而且它的许多基因与人类存在一一对应的关系。它个体小,周期产卵,产卵周期短,产卵量多,卵大;胚胎在体外发育,胚胎发育速度快,早期胚胎完全透明;单倍体、雌核发育二倍体的制作和突变体的获得均较容易;精子可以冷冻保存,所有这些特点使斑马鱼非常适合于遗传学的研究[14]。其透明状态的胚胎是在体外发育生长,它的神经中枢系统、内脏器官、血液以及视觉系统,在分子水平上85%与人相同,尤其是心血管系统,早期发育与人类极为相似,在胚胎发育过程中可以全程观察和研究其心脏发育及血液流动状态。借助显微镜,甚至可看到每个心肌细胞和血液细胞。而且斑马鱼一生可产卵数千枚,24h胚胎发育成熟。高速繁殖有利于基因筛选,早期发育与人类极为相似,目前斑马鱼成为研究人类疾病及动物胚胎发育的最佳模式生物[15]。特别在母体产生的因子(如蛋白质和mRNA)对启动胚胎发育的影响[16]、体轴的形成机制[17]、胚层的诱导与分化[18]、胚胎中细胞的运动机制[19]、器官的形成、左右不对称发育[20]、原始生殖细胞的起源等方面做出巨大贡献。
表1 几种经典模式生物基因组学的基本概况
Table 1 General situation of genomics inseveral kinds of classicModel Organisms
名称 Name | 分类 Classification | 测序完成期 Sequencing date | 基因组长度 Genome length |
大肠埃希菌 Escherichiacoli | 细菌 Bacteria | 1997 | 5 Mb |
流感嗜血杆菌 Haemophilusinfluenzae | 细菌 Bacteria | 1995 | 1. 8Mb |
酿酒酵母 Sacharomycescerevisiae | 真核生物 Eukaryotes | 1996 | 15 Mb |
秀丽线虫 Caenorhabditiselegans | 蠕虫 Worms | 1998 | 100 Mb |
果蝇 Drosophilamelanogaster | 昆虫纲双翅目 Insecta Diptera | 2000 | 180 Mb |
拟南芥 Arabidopsisthaliana | 十字花科 Cruciferae | 2000 | 125 Mb |
小鼠 Musmusculus | 哺乳纲 Mammalia | 1999 | 3 000 Mb |
河豚鱼 Globefishfish | 节枝动物门甲壳纲 Arthropoda Crustacea | 1999 | 300 Mb~400 Mb |
斑马鱼 Daniorerio | 脊椎动物 Vertebrate | 正在完成中 In completing | 约30 000个基因 Approximately 30 000 genes |
在人类基因组研究中十分注重模式生物的研究,这是由于要认识人体基因的功能,直接用人体作为实验对象非常困难。但是,生物是从共同祖先演化而来的,所以对生命活动有重要功能的基因在进化上是保守的,也就是说,这些基因的结构和功能,在低等生物和高等生物中是相似的。因此,可以用比较容易研究的生物作为模型来研究其基因的结构和生物学功能,由此获得的信息可以使用于其他比较难以研究的生物,特别是推测相似的人体基因的功能。模式生物中很多基因与人类具有很高的同源性,通过对模式生物基因结构和功能的研究可以推测人类相应基因的功能。模式生物基因组研究最直接的应用体现在生物信息学领域。当人们发现了一个功能未知的人类新基因时,可以迅速地在模式生物基因组数据库中,检索得到与之同源且功能已知的模式生物基因,并获得其功能方面的相关信息,从而加快对该人类基因的功能研究。
2 小结
综上所述,在短短的几十年期间,以这些模式生物为研究对象的重大科学发现层出不穷,模式生物已经在现代生命科学基础研究中具有不可替代的重要地位。但是,模式生物在我国的研究才刚刚起步,与国际领先研究水平差距还很大。好在全世界的研究者始终坚持材料、资源、信息和数据的无偿共享,使这一领域的研究得以飞速发展。2002年,我国启动了家蚕模式生物的研究计划,试图建立另具特色的新模式生物,并以此为契机,推动我国特有模式生物的研究。随着越来越多的研究者的加入,也随着分子生物学的飞速发展,以及越来越多物种的基因组被测序,许多生物都有可能成为很好的模式生物。经典模式生物的数据库不断的完善将会加快对分子生物学的研究进展。我们坚信,有关模式生物的研究必将继续为人类探索生命规律的调控机制做出更大贡献。最终使我们真正了解我们最关心的模式生物——人类。