利用X射线揭示蛋白质的原子级三维结构已经在理解这些分子如何在细菌,病毒,植物和人类中发挥作用方面取得了无数进展 - 并指导了精确药物的开发以对抗疾病等作为癌症和艾滋病。但是许多蛋白质不能生长成足够大的晶体,因为它们的原子排列会被破译。为了应对这一挑战,美国能源部(DOE)布鲁克海文国家实验室的科学家和哥伦比亚大学的同事已经开发出一种从微小晶体中解决蛋白质结构的新方法。
该方法依赖于独特的样品处理,信号提取和数据组装方法,以及能够在Brookhaven的国家同步加速器光源II(NSLS-II)上聚焦强X射线的光束线 - 美国能源部科学办公室用户设施 - 到百万分之一米的位置,大约是人类头发宽度的五十分之一。.
“我们的技术确实打开了处理以前难以接近的微晶的大门,包括难以结晶的细胞表面受体和其他膜蛋白,柔性蛋白质和许多复杂的人类蛋白质,”布鲁克海文实验室科学家刘群说。该研究的相应作者于2019年5月3日在IUCrJ(国际晶体学联合会期刊)上发表。
解读蛋白质结构
自1958年以来,蛋白质晶体学一直是解决蛋白质结构的主要方法,随着时间的推移,随着X射线源变得越来越强大,可以进行更精确的结构测定。为了确定一种蛋白质结构,科学家们测量了像NSLS-II产生的那些x射线如何衍射或反弹,由同一蛋白质分子的许多拷贝组成的有序晶格中的原子以相同的方式排列。衍射图案传达有关原子位于何处的信息。但这还不够。
“只有衍射的X射线波的振幅才会记录在探测器上,而不是它们的相位(波浪之间的时间),”刘说。“两者都需要重建三维结构。这就是所谓的结晶相问题。”
晶体学家通过从不同类型的散射中收集相位数据来解决这个问题,称为反常散射。当比蛋白质的主要成分碳,氢和氮重的原子吸收并重新发射一些X射线时,就会发生异常散射。当X射线能量接近那些重原子喜欢吸收的能量时,就会发生这种情况。科学家为了这个目的,有时人为地将重原子如硒或铂插入蛋白质中。但是在整个蛋白质分子中天然存在的硫原子也可以产生这样的信号,尽管它们较弱。尽管这些异常信号很弱,但是大晶体通常具有足够的硫原子拷贝,使其具有足够的硫原子以使其可测量。
“一旦你知道了硫的位置,就可以计算出其他蛋白质原子的相位,因为硫和其他原子之间的关系是固定的,”刘说。
但根据定义,微小的晶体没有那么多感兴趣的蛋白质拷贝。因此,Brookhaven / Columbia团队不是从单个大晶体中的蛋白质重复拷贝中寻找衍射和相位信息,而是开发出一种从许多微小晶体中进行测量的方法,然后汇总集体数据。
微小的水晶,效果很好
为了处理微小的晶体,该团队开发了带有微型孔的样品网格。在将含有微晶的溶剂倒在这些安装好的网格上之后,科学家们除去了溶剂并冻结了被困在网格上的晶体。
“尽管如此,我们仍然面临挑战,因为我们无法看到微小晶体在我们的网格上的位置,”刘说。“为了找到答案,我们在NSLS-II的Frontier Microfocusing Macromolecular Crystallography(FMX)光束线上使用微衍射来测量整个网格。逐行扫描,我们可以找到隐藏这些晶体的位置。”
正如FMX的主要光束线科学家Martin Fuchs所解释的那样,“FMX光束线可以将X射线束的全部强度聚焦到1微米或百万分之一米的大小。我们可以精确控制光束尺寸到将它与晶体的大小相匹配 - 在当前实验的情况下为5微米。这些能力对于获得最佳信号至关重要,“他说。
另一位FMX光束线科学家Wuxian Shi指出,“电网测量中收集的数据包含有关晶体位置的信息。此外,我们还可以看到每个晶体的衍射情况,这使我们只能选择最好的晶体数据采集。”
然后,科学家们能够操纵样品架,将每个映射出的感兴趣的微晶放回精密X射线束的中心进行数据收集。
他们使用光束线上可用的最低能量 - 调整为尽可能接近硫原子的吸收能量 - 并收集异常散射数据。
“大多数晶体束线无法达到优化异常信号的硫吸收边缘,”哥伦比亚大学的共同作者Wayne Hendrickson说。“幸运的是,NSLS-II是世界领先的同步加速器光源,提供明亮的X射线,覆盖广泛的X射线能量。即使我们的能量水平略高于硫的理想吸收能量,它也会产生异常信号我们需要。”
但科学家们仍然需要做些工作来提取这些重要的信号,并从许多微小的晶体中收集数据。
“我们实际上获得了数千条数据,”刘说。“我们使用了大约1400个微晶,每个微晶都有自己的数据集。我们必须将这些微晶的所有数据放在一起。”
他们还必须清除受强烈X射线损坏或原子排列略有变化的晶体数据。
NSLS-II的结构生物学项目副光子部门主管兼项目经理Sean McSweeney表示,“单个微晶在被X射线损坏之前不能充分地衍射X射线以获得结构解决方案。”“对于只有几微米的晶体,特别是细菌细胞的大小,尤其如此。我们需要一种方法来解释这种损伤和晶体结构的变化,因此不会影响我们的结果。”
他们通过复杂的多步骤工作流程完成了这些目标,该过程筛选了数据,可能由辐射损坏或不相容的晶体引起的丢弃的异常值,并最终提取异常散射信号。
“这是关键的一步,”刘说。“我们开发了一种计算程序,以确保只有兼容的数据以一种方式合并,以使各个微晶与衍射图案对齐。这为我们提供了结构测定所需的信噪比。”
应用该技术
该技术可用于确定已经证明难以结晶成大尺寸的任何蛋白质的结构。这些包括细胞表面受体,允许动物和植物等高级生命形态的细胞通过释放激素,传递神经信号或分泌与细胞生长和免疫相关的化合物来感知和响应周围的环境。
“为了通过进化适应环境,这些蛋白质具有延展性,并且具有许多不均匀的修饰,”刘说。“很难在水晶中获得大量的重复副本,因为它们不能很好地包装。”
在人类中,受体是药物的共同目标,因此了解其各种结构可以帮助指导新的,更有针对性的药物的开发。
但该技术并不仅限于小晶体。
“我们开发的方法可以处理小蛋白质晶体,但它也可以用于任何大小的蛋白质晶体,任何时候你需要结合多个样品的数据,”刘说。