1.1 获得不能培养的生物的多样性:生物群落DNA概念
过去的十年见证了一些新的、不依赖于培养的、基于分子生物学的方法的开发,比如荧光原位杂交(fluorescence in situ hybridization,FISH)和16S rDNA克隆文库。这些方法引发了一系列的生态学研究,彻底改变了人们对微生物多样性的看法。这些技术包含在某一时刻用探针(FISH)或者提取一个生活环境(habitat)中所有微生物的基因组(DNA材料)来直接检测样品中的微生物。而这个提取到所有微生物的基因组就是生物群落DNA(the community DNA)或“宏基因组(metagenome)”。
在随后的基于聚合酶链反应(PCR)的研究中,以宏基因组为模板,一个特异的基因或者DNA序列被数百万次地扩增,这表明不能培养的微生物中存在着巨大的多样性。在此类研究中,通过PCR扩增感兴趣的基因或者DNA片断后,接着就是克隆和确定它的序列。简而言之,克隆就是将外源DNA序列通过DNA重组技术插入到一个含有遗传标记(比如抗生素抗性基因)的载体(通常是一个质粒)中,这个遗传标记的作用是选择出那些插入了外源DNA的载体。然后将这个载体导入一个宿主细胞中,接着在培养基中繁殖细胞,并涂布到选择性培养基中(含有用于选择标记的抗生素的富培养基)。这样外源DNA就能随着细胞的复制被数百万次的复制。
Pace及其同事最早提出了克隆核糖体基因(ribosomal gene,rDNA)来从环境样品中寻找不能培养的微生物,并通过比较所获得的rDNA序列和公开的数据库中已知生物体的序列数据,绘制它们在种族史上的关系图。随后这一方法被作为分析许多不同环境的多样性的一种标准方法,显示了从未由培养获得的、令人惊讶的新微生物种类的多样性。
作为一个分子生态学的研究进展,已经有证据表明许多新的血统都是在地理学上广泛分布的,并常常显示了微生物种类的丰富组成。尽管如此,由于对大多数已经发现的种类来说,分离和培养仍然比较困难,因此对于这些在环境中检测到的新的微生物种类的代谢潜力,分子微生物生态学研究给予我们的信息仍然很有限。
1.2 拆分代谢功能 :BAC策略
开发那些不能通过传统的培养技术培养的微生物(无法培养的微生物)的代谢潜力的另一种方法是一种分子策略,包括使用细菌人工染色体(bacterial artificial chromosome,BAC )来克隆非常大的DNA片段(20kb到500kb),它可以携带环境样品中整个基因簇(gene cluster)或者甚至是一个完整的生物化学途径。在寻找新的酶活时,该策略包括克隆这些来源于环境生物群落DNA(宏基因组)的大的DNA片断,以及分析所得到的复杂的宏基因组文库。
BAC是来源于大肠杆菌F的质粒的特殊克隆体系。该质粒在一个细胞中只复制1~2个拷贝数。BAC同样具有大多数克隆载体都具有的典型特征,包括一个多克隆位点和一个快速的克隆选择机制(clone seledtion mechanism)。BAC最早起源于绘制染色体图谱(chromosome mapping)和分析人类基因组。它能携带超过300kb的DNA插入,能够在异源的细菌宿主中表达原核基因。这个异源的细菌宿主也就是指一个与基因最初的克隆来源不同种类的细菌菌株,它们可能含有不同的基因表达和调控体系。这些载体能够在大肠杆菌中稳定地保持大片断的DNA插入,也是目前细菌和真菌基因组计划中最常用的载体。此外,对于某些特定的原核生物,比如许多原始生物(Archaea),由于它们在高拷贝数的质粒中不稳定,以前人们根本无法克隆其基因组,然而现在,BAC克隆使得研究它们的基因组成为可能。
BAC在宿主细胞中的底拷贝数可以避免所克隆的插入之间发生基因重组。但是,BAC对功能筛选研究的一个重要缺陷就是,对于载体自身及携带了基因组插入的载体,DNA的收率太低。Wild等描述了一种新的BAC载体,它不仅保留了低拷贝数的BAC载体的所有优势,还具有一个可调控的、控制严谨的增扩体系。该体系基于oriV复制起始,因而依赖于TrfA复制蛋白。该载体系统可以在L-阿拉伯糖(L-arabinose)的条件诱导下达到每个宿主细胞约100个载体的拷贝数。可扩增的克隆和文库,因其基因的高水平表达,非常有利于高通量的DNA测序和基于酶活的筛选。该系统也可以进一步被葡萄糖和海藻糖(拷贝数的抑制剂)调控,这提高了宿主细胞中BAC的稳定性,使得系统非常强大和可靠。
人们已经从海洋环境中用BAC载体建立起包含大的DNA插入(高达40kb,有时甚至超过100kb)的复杂的基因组文库,这为洞察那些不能培养的浮游海洋古生物的基因组潜力提供了可能。这一环境克隆方法也已经成功用于研究土壤中的微生物群落。尽管如此,由于宏基因组方法的成功完全取决于提取的DNA纯度和可克隆性,而土壤样品中存在的诸如腐殖酸(humic acid)和棕黄酸(fulvic acid)等高分子里量的抑制剂使土壤样品比含水样品更难于制备宏基因组文库。目前已经提出了许多从土壤中提取DNA的操作步骤,基本上可以将它们分为以下两类。
在第一类方法,也称为直接法中,微生物在土壤基质中被裂解。直接用裂解缓冲液重悬土壤,接着用洗涤剂和酶充分处理。这类方法中大多数都包括剧烈地机械搅动和使用玻璃珠破碎微生物细胞(玻璃珠敲打)。得到的DNA接着再用酚/氯仿进行萃取,并在琼脂糖凝胶上区分大小。这种方法的优点是DNA收率高,并且由于破碎细胞壁的成功率较高,样品中不同种类的微生物的DNA分布相对比较好。尽管如此,由于机械剪切力的不同,得到的DNA片断的大小范围一般是从1kb到50kb。
在第二类方法,也称为间接法中,需要在裂解前用物理方法从土壤颗粒和胶体中分离出微生物。这减少了有机和无机的土壤化合物对DNA提取和纯化步骤的抑制作用,也可以极大地减少释放出来的基因组DNA所受的机械应力(mechanical stress)。在许多开发土壤宏基因组以寻求具有生物活性的新产物的研究中,这种方法是首选。将土壤中的细菌细胞通过搅拌机进行分离,随后在一个梯度发生基质(gradient-making matrix)中进行离心回收。然后用琼脂糖封闭土壤生物质,并在固化性的细胞上进行裂解。之后,用限制性核酸内切酶部分消化基因组DNA,再在脉冲电场凝胶电泳(pulsed-field gel electrophoresis,PFGE)中区分片断大小。通过电洗脱(electrolution)将那些高分子量的DNA片断从琼脂糖中回收出来,再连接到BAC载体中得到宏基因组文库。间接法的一个优点是在DNA制备中减少了大量非微生物的土壤成分的污染。然而它的缺点却是:从土壤基质中制备细菌组分时会损失一部分微生物,结果导致DNA收率低。除此之外,由于该方法的机械应力较小,一些具有较厚细胞壁的微生物种类,比如说革兰阳性细菌,可能没有被裂解,因此最后得到的宏基因组DNA中也缺少它们。
当使用BAC策略克隆细菌基因组时,由于外源基因也是来源于原核生物的,因此在BAC克隆中很容易获得基因表达。在含有BAC系统的大肠杆菌中,可以在一个合理的频率内检测到一个来自于蜡状芽胞杆菌(Bacillus cereus)的异源DNA的表达,这说明低拷贝数的BAC载体也可以用于在大肠杆菌中表达外源DNA。
正如前面指出的那样,BAC文库为获得环境中的微生物多样性提供了一种具有前景的、强有力的方法,使得人们能够分析不同微生物,尤其是那些不能培养的微生物的功能基因。在这个意义上,与传统的寻求新的天然产物的方法(基于提取、培养和筛选纯的微生物培养物)相比,从一个宏基因组的BAC文库中可以同时获得范围更广的具有生物活性的化合物。