Floyd Romesberg | 化学家做生物，上帝也挡不住！

来源：未来论坛（ID：futureforum） 2019-05-14

导读：Floyd Romesberg教授的成长背景和科学道路，使我们明白跨界科研的创造性优势。他师从无机化学大师David Collum。有趣的是，他带着研究锂电池、金属锂化学的学术经历，进入了生物领域，用他的化学思维去研究生物医药。在过去18年里，Floyd建立了三个完全不同的项目，每个领域都世界领先。

其中之一是蛋白质动力学。他借助锂化学的热力学原理，以光谱学研究蛋白质如何移动，不是折叠，而是如何移动。他研究当蛋白质移动时，它们是如何影响我们身体功能的。他是我们称之为生物物理学科的领军人物。

Floyd Romesberg踏足的第二个领域是抗生素。他对广谱或窄谱抗生素概念非常有兴趣，成功开发了两种革兰氏阴性效果的抗生素。今年52岁的他已经拥有两家公司，其中一家已经上市，另一家公司刚完成一轮总额6500万美元的投资。

在建立第三个项目的时候，他决定和上帝好好聊聊。所以他花了18年时间去研究核酸，上帝说人只能将ATCG作为DNA序列的密码，他却通过疏水作用力用其他分子改变了DNA在新生命体中的编码方式。在第44期理解未来讲座中，Floyd就和我们分享了他是如何和上帝沟通的。下面是Floyd的精彩演讲《可储存与检索新增遗传信息的半人工合成生命体》（部分文字有调整）：

基因是什么？遗传信息的载体

我实验室做的工作是想看看能否可以自己不制造分子和替代品，而是让人体自身的细胞为我们制造分子。分子是有可能会根据我们的需求定制的。因为生命由细胞构成，细胞都有细胞核，细胞核由染色体构成，染色体是DNA分子经过缠绕与蛋白质共同形成的。染色体的分子结构，也就是著名的DNA的双螺旋结构。

DNA就是一个螺旋状的生物大分子。我们人类的遗传信息都储存在DNA序列中，而DNA用ATCG四种碱基来编码遗传信息。这四种碱基相互之间有配对关系，A和T配对，C和G配对，经过配对之后就形成双链结构，又因为化学稳定的倾向性，最终形成了双螺旋结构，这就是DNA序列。这个序列有多长呢？有30亿个碱基对，也就是30亿个A-T、G-C字母对。不同的DNA区别仅在于字母的排列顺序不同。

DNA是可以复制的。当细胞分裂的时候，细胞核也要分裂，基因组也会分裂，每次分裂之前它的DNA一定要复制一遍。怎样复制？既然DNA通过ATCG四个字母来编码遗传信息，那谁来解码呢？怎么解码呢？

负责解码的是RNA聚合酶，它是一个蛋白，在DNA上面可以把双螺旋打开，像一只手一样把双链结构分开，分开之后单链就露出来了，然后RNA就会以单链序列为模板把信息抄写到另一个分子——RNA分子上。RNA分子结构和DNA很像，也是四个碱基，即AUGC,A对U，G对C，也就是说能根据DNA的碱基配对，把DNA序列原封不动的拷贝到RNA分子上，这个过程叫做转录。

单链RNA分子形成以后，会被从细胞核运到细胞质里。之后更神奇了，有一个巨大的分子机器叫做核糖体，它就好像一个组装机器的流水线，把RNA上面的四个字母以每三个字母搭配一种氨基酸（氨基酸是组成蛋白的基本材料，人体有20种常见的氨基酸）转变为氨基酸序列，这个生产线过完之后就会形成一长串氨基酸链，这个链经过折叠后就变成了蛋白。不同的三个字母搭配不同的氨基酸会组成不同的蛋白，而蛋白是大多数生命的细胞里最重要的活性大分子。所以蛋白的组成在很大程度上的决定了你的细胞是什么样子，每个物种是什么样子。

上帝说就4个字母，我问如果是6个呢？

我和我的团队感兴趣的是如果超越四个碱基和双链结构呢？能不能是五个或者六个字母呢？能不能是三链结构呢?那会生成什么样的蛋白质呢？会产生什么样的结果呢？在告诉大家方法论前，我先来讲讲我这样做的动机。

动机分两种，概念性动机和实用性动机。从有人以来，人们就开始思考，生命是什么？生命由什么组成？分子吗？如果是，那是什么分子？对于这个问题，人们有不同的解读。有人说生命和分子已经如此完美，它们是造物主存在的证据。上帝将生命注入物质，注入到分子中，这样分子才得以在生命中发挥作用。有些人则和达尔文站在一起，认为生命是进化得来的。不过不论你同意哪种观点，有一点是可以确定的，那就是自然造物已经如此完美，而经历过数十亿年的进化，大自然已经没有多少空间留给化学家去造物了。那化学家还能做什么呢？

从实用角度看，从胰岛素开始，蛋白质药物已经颠覆了整个医药产业。如今蛋白质治疗剂的种类越来越多，它做了很多小分子药物做不了的事情。我们是不是可以这方面入手开发出新的蛋白或者蛋白药物呢？

如果你对此感兴趣，就必须设法做出我提到的第五个和第六个字母，这样才可以在生物体中编码出和常见的二十个氨基酸不一样的氨基酸。自然系统的工作方法，正如我提到的G配对C、A配对T，它是通过共享氢原子来实现，科学家称之为氢键。因此G具有粘附于C的氢键模式，A具有与T互补的氢键模式。现在，为了搭配出第五和第六个人工的字母对，来形成第三对人工碱基对，科学家借助了核苷酸。我们必须考虑应当尝试利用什么样的作用力。在自然界中有很多种作用力，我们不必非要使用自然界赖以用于信息和存储和检索的那个作用力。

疏水作用力，就是你了

事实上，有一种强大的作用力称为疏水作用力。它被认为是控制早期蛋白质折叠过程的主要作用力。举例说明，如果你把水和油混合起来，它们会互相逃避，不会混在一起。因此，如果我们制作疏水性的核苷酸类似物，像油一样它们不会和类似水一样的碱基配对，但它们可能会相互配对。所以我们可以使用这种作用力，因为它和大自然所用的作用力不一样。那么我们是否可以利用疏水作用或其他堆积作用力来实现遗传信息的稳定储存和检索呢？这就是最初的想法。所以我的实验室开始沿着这个方向探索。我是个化学家，我们从药物化学的角度思考问题。我们试着用化学药物开发的方法制造类似物。

大家从下图可以看到一部分碱基，它是双链螺旋字母的一部分。你们可以看到结构，双链之间的梯子，这些通常相是会互相作用的部分。里面还有一些额外的糖和形成寡核苷酸或DNA的磷酸盐，这里就不详细描述了。我们设计的所有类似物都是疏水性的，它们被设计成用疏水作用力彼此配对，而非互补氢键作用。然后我们开始尝试制造这些类似物。

就像我上面说的，我们用的是药物化学的方法。我们首先尝试的是制作一些简单的碱基对，把它们放入DNA，看看细胞中的DNA聚合酶在复制DNA信息的时候能否能识别它们，以此分析这些人造碱基对的能力。刚开始的时候，我们只能在试管里做实验，因为早期的碱基表现欠佳。它们几乎无法被DNA聚合酶识别。我们瞪大眼睛仔细看，但看不到任何被识别的迹象。后来我们发现了一些稍微活跃一点的碱基，我们把它们收集起来，仔细观察它们有什么不同之处。据此我们开始混合、匹配并组合差异，提升它们的多样性。这是医药化学研究化学药物的方法。

他们建立了所谓的结构活性关系，以了解分子设计中的特定变化如何影响其行为。一旦构建这些关系，你就可以用这些关系设计其他类似物以继续完成该过程。所以我们筛选了很多类似物。这些类似物，现在在实验室中被称为“第一代类似物”。你可以看到它们都相当的大，随着我们越做越好，我们开始探索一些更小的（如下图）。这些，现在在实验室中被我们称为“第二代类似物”。你看，我们正在探索很多不同类型的东西。我们正在研究不同的氟、处于不同位置的氟原子，或这种取代基，这是甲基中的氧或仅仅是简单的甲基，许多不同大小的环。

第一代类似物

第二代类似物

经过不停探索，大约14年后终于找到了一对，我们称之为dNaM-dTPT3。我在这里展示它在DNA里的样子，也正好可以再次向大家展示维持天然碱基对的氢键。

这是碱基A和T及令他们粘在一起形成双链的互补氢键。如我所说，它也是能够被复制和信息最终以蛋白质形式表达的能力基础。这里有两个A-T对。这是我们的碱基对（灰色部分）。我们的没有额外的氢键，但它们却能抱在一起。首先我认为这是一个非常有概念意义的结果。如果观察自然形成的DNA双链体，你会发现，那些互补的氢键是它们中最明显的部分，并且每个人都认为它们是DNA必不可少的。而我们告诉大家，也许任何你可以驾驭的作用力，任何你作为化学家可以理解和研究的作用力，你都可以调配，并用来储存和表达信息。所以我们开始重复利用这种疏水作用力。

我们很想在活体细胞内尝试这一发现。但在此之前，我想先告诉大家一些关于我们研究机制的细节，因为我认为这个故事非常精彩，是我最喜欢的实验室故事之一。开发出这些人工碱基对后，我们假设即使没有氢键，它看起来也会很像天然碱基对。大家都认为聚合酶的能力是复制DNA序列信息然后将其转移到蛋白质中。每个聚合酶会识别特定的天然碱基对，也就是GC或AT。事实上，这对碱基被称为沃森-克里克碱基对。可能大家都听说过，它是化学领域最着名的结构之一。因此，在圣地亚哥大学的最后阶段，我们解出了双链DNA中非天然碱基对的结构。下图里有十个不同结构，这是十个不同结构的叠加，这里是平均结构。

大家从上图中可以看到，这些美丽的碱基对从上到下地排列在DNA里。中间这个是我们的，看起来不像天然碱基对。我把这个碱基放大，就是这个交互的部分允许它们配对。这是一个GC碱基对，G通过氢键和C配对。无论是CG还是GC，TA或AT都无关紧要。所有这些碱基对形成完全相同的结构。无论是在双链DNA或者在合成碱基对的过程中，它们总是形成相同的结构。我们的人工碱基对的配对方式就完全不一样。科学家称之为嵌插作用。

让我们用药物研发的思维来看这个问题。假设你发现了一种可以杀死细菌的分子，然后你拿去找辉瑞或诺华，让他们把它做成药。他们会问你：“它的靶标是什么？作用机制是什么？”如果你的回答是：“谁在乎呢！我已经证明它有活性了。”那药企什么支持都不会给你。因为医药研发花费巨大，药物研发有严格流程，你想得到资金支持，必须弄明白你的分子的靶标和作用机制。

所以在这里概念是类似的。我们已知DNA聚合酶可识别看起来像这样的东西，我们的小东西看起来不像这样（如上图）。事实上，我们的家伙看起来像一个大自然的错配。众所周知，DNA聚合酶已经进化为拒绝自然错配，所以我们在这里必须做些伪装。我们希望研究复制过程中的结构。我和康斯坦斯大学的朋友安迪·马克斯(Andreas Marx)合作，我们得到了各种各样的结构。

为了说明这一点，我必须先简要地讲讲DNA聚合酶是如何工作的。它负责复制DNA。它看起来像一只右手。在酶里面你正在复制的DNA模板就像这样待在里面。当你把正确的单体加入到正在生长的DNA中的时，它会使酶的指状结构域落在酶的手掌和拇指区域上，形成非常紧密的封闭复合物。它就像一个拳头，有选择地非常具体地识别我说的那些沃森-克里克碱基对。我们的任务是找到任何类似这样的东西，这就要思考两件事。

两件需要思考的事

第一个是我们的碱基对的结构要足够强大，以驱动聚合酶中同样大的构象变化。

第二个是个问题，聚合酶到底在识别什么？如此紧密复杂的识别是什么？因为我们的碱基对看起来完全不像沃森-克里克碱基对，它看起来像是一个应该被拒绝的错误配对。我们和安迪一起开发了一些结构，我只会向大家展示一些重要的部分。这是二元复合物，二元意味着它由两个部分组成。在这种情况下，它由正在合成的DNA和合成它的聚合酶组成。所以还没有三磷酸盐、也没有单体被添加到正在增长的DNA中。这是我展示的唯一的聚合酶部分，它被称为O和O 1螺旋，它是我提到的那个手指域的基础。而这里是我们的小家伙从开发的螺旋中跳出来，无所适从。

现在这个是在科学中被称为三元复合物的，因为它由三个部分组成，分别是：DNA模板、聚合酶和添加到DNA生长链中的单体。可以看到我们的单体进入我们的人工碱基，你可以看到它去结合的模板现在已经转变为正在发展的双链体，进入不断增长的DNA链。在聚合酶中也获得了大的构象变化。这里是这个结构的轮廓，在这儿大家可以看到构象的变化。

现在为了说明它与由天然碱基对形成引起的构象变化完全相同，这里是三元结构，它正在合成我们的天然碱基对，另一个在合成GC碱基对。所以你看，它们的结构即使在侧链的水平上也是绝对重叠，这一部分突出的蛋白质肉眼可见也是重叠的。甚至催化所需的水和催化相关的镁离子也是重叠的。

所以非天然碱基对的形成驱动了从开放到闭合聚合酶复合物的几乎相同构象变化。

现在我们来思考：它识别的到底是什么？

因为我们的配对并不像沃森-克里克碱基对。人工碱基确实形成了沃森-克里克形式的结构，但只发生在必要的在复制过程中。因此，科学家们讨论出一种机制，通过该机制，天然碱基对合成为所谓的诱导契合机制。它的形成驱动了聚合酶的这种大的构象变化。人工的碱基对不会被各种各样奇怪的机制复制，它只是通过相同机制的微妙变异来复制。它的结构驱动聚合酶的大的构象变化，但聚合酶的大的构象变化会驱动碱基对的相互构象变化。选择疏水效应可能是我们最幸运的事，因为疏水效应很强，但它不是很有方向性，它能够按照必要的方式移动。并且它足够灵活，可以从聚合酶中获取方向以形成正确的结构，这样它就可以合成。

从大肠杆菌开始

我们花了15年的时间优化这其中的化学合成工作。现在我们已经有了一个可以很好地复制的碱基对，可以被聚合酶很好地识别，我们可以用人工碱基对制造大量含有它的DNA，它们能非常好地保留高特异性和高效率。因此，我们有了向长期目标发起进攻的信心，我们已经掌握了让其在鲜活组织中工作的系统能力，再回到开始的那个问题：我们能否靠扩展基因字母表，使活细胞、活生命体可以做更多事情？为了做到这一点，首先要思考的是我们要使用什么样的生命体。我们选择了大肠杆菌，因为操作大肠杆菌的工具最为先进。

我们面对的第一个挑战是如何把我们的人造核苷酸的三磷酸盐，也就是那两个新的字母，放进细胞里？经过大约六个月的工作，我们注意到有一种不太相干的生物体，一种藻类，它利用核苷三磷酸转运蛋白，在双层脂质膜间运输这些相同类型的单体。这种运输工具的功能是将这些单体从膜的一侧取出并传递到另一侧。我们就想，如果把这些蛋白植入大肠杆菌，它们是否可以把我们的单体加入到细菌生长的培养基中，并把它们带到细菌内部，这样它就可以使用它们了。在这里我用这些小孔来显示它们。

结果非常好，我们的起始材料得以进入活细胞。接下来的问题是：细胞会怎么对它们？如果我们给细胞一块含有人造碱基对的DNA，它能复制并随之生长吗？我们花了14或15年的时间才做到这一点，而我已经准备好再花14到15年来让它在大肠杆菌中工作。结果只用了大约三个星期。自从地球上所有生命的最后一个共同祖先以来，地球上所有生命一直用四个字母、两对碱基对，每一个生物都是如此。而这些含有6个字母，即三对人工碱基的大肠杆菌细胞正在生长、分裂。这太令人兴奋了！

既然我们可以将DNA存储在这些活细胞中，我们能使用它吗？我们能让这些细胞用超过20种简单的氨基酸来制造蛋白质，或者用我们挑选出的氨基酸，以便能够制造出更多样化的蛋白质。所以我必须告诉你一些关于它工作方式的更多细节。

现在转运蛋白dXTP和dYTP只是DNA复制的起始材料。XTP和YTP是你要生产的单体的起始材料，这些单体用于复制DNA。它们会被用于将DNA转移到RNA中。你必须制作两片RNA，一种代表信息的mRNA和一种代表转移的tRNA。在这两种分子起作用的方式是它们进入细胞的核糖体，mRNA排成列，mRNA具有编码蛋白质的DNA序列，然后tRNA进入并引入氨基酸。在这种情况下，它会引入不同于普通天然氨基酸的人工氨基酸。而且我们不会用含有新序列中的人工碱基对来编码人工氨基酸。所以我们就想看看我们是否能够表达蛋白质。我们去年年底发表了一篇论文，阐明了我们能够合成蛋白质。

让我简要介绍一下细节。我在这里展示下蛋白质的产生，它恰好是一种荧光蛋白质，所以你可以看到荧光产生了多少蛋白质。这是一个自然的序列，我们在这里生产了几种不同的蛋白质，它们的生产非常有效率。如果你不添加所有必要的成分，你得到的蛋白质会很少。这个凝胶很复杂，但是如果你集中在这最后一条通路，这就是如果你没有所有必需品的情况，而如果你都有，那就会看到转变。因此，我们加入的人工氨基酸有一个小标签，可以让我们在上面附加东西，这就是我们判断人工氨基酸存在的办法。在这种情况下，我们附着的是一个荧光基团，它只是一个发光的分子，所以它被叫做TAMRA。

所以当你附上它时，你会看到一条带子。这就是所谓的电凝胶，一种电泳凝胶。你会看到蛋白质通过凝胶迁移并形成一条带的过程。你看，这条带子是红色的因为它上面有荧光基团，就是说它含有人工氨基酸。你们看一下质谱数据就知道这个蛋白质纯度非常高。这是一个自然控制，这是两个自然控制，它们是非常纯净的，而这些是我们的。我们确实受到了一些污染。请注意，突破就在这里，所以这些是10％到90％，这是低到2％，立竿见影，我们的污染全部小于2％。这已经和通过其他方法引入人工氨基酸的标准一样好了。这是一个小细节，但我想强调一下，因为它很重要。

引入的人工氨基酸对应在复制过程中丢失的DNA序列。所以错误不是在蛋白质生产过程中出现的，而是DNA在保留人工碱基对时出现的，这确实是最困难的一步。我想说的重点是，我们已经在实验室中开发了一种方法，可以提高保留率，将DNA的保真度提高几个数量级。它们没有出现在这里，因为在这些早期的研究中，我们想要表明的是，如果不使用自然编码所用的单一氢键作用，我们也可以使用完全不同的作用力来编码信息。因此，不仅我们的字母是新的，而且它们配对的方式、它们使用作用力的方式，都与自然完全不同。

这回到了我之前提到过的关于生命分子的概念问题：生命的分子有多特别？他们有什么特权？这些数据表明也许生命的分子并不那么特别，也许化学家可以理解和培养的许多不同种类的分子、不同的作用力，都是合适的。

我们成立了一家生物技术公司，该公司正将这个技术商业化，生产用于治疗特定疾病的蛋白质。这是我演讲想展示的最后一个部分。我们称之为SSO，即半合成生命体（semi-synthetic organism）。这是他们成长和分裂的实际情况。自从最后一个共同的祖先以来，地球上的所有生命都被四个字母、两对碱基对、以及20个天然氨基酸编码而成。而这些正在成长的细胞是有着六个字母、三个碱基对，以及它们在这种情况下是用21个氨基酸来制造蛋白质。

我的演讲就到这里，谢谢大家。

本文经公众号“未来论坛（ID：futureforum）”授权转载

声明：化学加刊发或者转载此文只是出于传递、分享更多信息之目的，并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益，请作者持权属证明与本网联系，我们将及时更正、删除，谢谢。电话：18676881059，邮箱：gongjian@huaxuejia.cn

投稿合作邮箱：gongjian@huaxuejia.cn

手机号绑定

请输入校验码

请选择用户类型

绑定企业

Floyd Romesberg | 化学家做生物，上帝也挡不住！

来源：未来论坛（ID：futureforum） 2019-05-14