我的LC/MS谱里有什么?
2021年4月13日
作者:Charis Lam代表先进化学发展公司。
从复杂的样本中识别未知数是一个复杂的难题。使用现代技术,线索很多:一次LC/MS运行可以产生几百个时间点(以0.5 Hz采样的30分钟运行将产生900个时间点),每个时间点都与质谱有关。但并非所有这些观点都有用。退化科学家必须从噪声中分离出有用的信号,然后从一系列质量-电荷信号到一个假定的结构。
手动操作是令人生畏的。有了计算方面的帮助,这就容易多了,但如果没有正确的帮助,它仍然需要比紧迫的项目截止日期所需的时间更长的时间。
一个好的反公式工作流应该:
1.适应整个变性过程。在软件包之间来回切换会增加不必要的工作。
2.默认简单,设计灵活。不管是哪种样品,基本的脱配方过程都是一样的:将色谱图谱反褶积成单个的成分痕迹;然后使用光谱模式,保留时间,或分子离子质量来确定假定的结构。默认步骤可以自动执行。但细节可能会影响样本之间的性能:例如,不同的背景噪声会改变峰值检测的精度。因此,必要时应提供更精细的控制。
3.允许建立内部数据库以及搜索商业数据库。根据要分析的样品和要回答的问题,化合物可能会在大型商业数据库中找到,该数据库汇集了数千种化学物质的信息。或者它们可能是专有化合物,只在公司内部知道。然后,必须根据专有数据建立内部数据库,以便对新的光谱进行搜索。
在这里,我们提出了一个使用ACD/MS结构ID的LC/MS数据变性工作流程。该工作流程是专门为通过数据库搜索进行未知识别而设计的,使用内部和商业数据库的光谱匹配和公式搜索。
图1。从LC/MS数据中识别未知数的四步工作流程。
工作流程概述
图1说明了工作流的四个步骤。
1.样品色谱被反卷积成其组分萃取离子色谱(XICs)。XIC中的每个峰都与其组成的MS1和MS2光谱相关联。
2.MS2谱是根据已知谱库进行搜索的。假定的候选对象在数据库中存在匹配的地方被确定。
3.对于不在数据库中的化合物,分子离子质量用于生成候选分子式。然后在更多的数据库中搜索公式,以完成候选结构的列表。片段包含和排除列表有助于缩小搜索范围。
4.原始数据和经过处理的数据,以及相关的候选结构,被上传到数据库,在那里它们可以从任何地方进行审查,并由多个团队成员访问。
示例数据
采用电喷雾正电离(ESI)高分辨率LC/MS/MS对含有维拉帕米的大鼠血液样本进行分析,并将分析数据导入MS Structure ID。(为了证明工作流程准确识别样本成分,数据被视为未知成分,目的是“发现”维拉帕米及其衍生物。)
步骤1:反褶积
图2说明了反褶积过程。顶部示踪显示了总离子色谱图(TIC),显示了许多部分分解的成分。指定的数据分析区域以白色突出显示。下面的痕迹,在多色,显示反卷积的痕迹。每种颜色代表一个组件XIC。在TIC中无法解析的组件在XIC迹线中被清晰地分开。
在最简单的情况下,反卷积只需要点击一个按钮,但科学家也可以通过调整最小信噪比、峰值形状相似性和组件识别阈值来微调组件分离。
每个组分的峰值都与一个组分质谱相关联,该质谱对该组分的信号进行平均,并从共洗脱组分中去除杂散信号。如果可用,包括MS1和MS2光谱。
图2。(上)反褶积后部分分解的TIC迹和分离的XIC迹。(左下)数据分析区域的特写,显示了不同组件的清晰分离。(右下)每个组分都与其质谱相关联。
第二步:光谱搜索
反褶积后,在谱库中自动检索组分质谱。匹配项填充在表格中,表格显示候选结构、其分子式、实验光谱与结构计算或数据库质量之间的质量差,以及基于光谱匹配度的命中质量指数(HQI)。还显示了保留时间(并可用于进一步过滤)。
o -去甲基化维拉帕米被确定为候选结构,其质量差为2.995 ppm, HQI接近90%。镜像图显示实验光谱(上)与其数据库匹配(下)之间具有良好的一致性。
图3。(左)步骤2通过光谱搜索数据库识别化合物。(右上)返回的组件表显示了候选结构。(右下)对比实验光谱和数据库光谱的镜像图。
第三步:公式搜索
有些成分没有通过光谱搜索识别出来,因为它们在数据库中没有匹配。为了识别这些化合物,质量和公式搜索如图4所示。首先,将分子离子的质荷比转化为一个假定的分子式。然后在更多的数据库中搜索该公式以找到候选结构。
图4的左下角面板显示了公式生成器,它将m/z值和各种元素约束作为输入。在本例中,假设m/z为455.291322的化合物中含有H+、H和C,也可能含有N和o,并对每种元素的原子数进行了限制。由于目标是正ESI电离的小分子,H+设为1。C和H的限制更广,但C和H的预期远高于N和O,这是合理的。
图4。(上)显示精确质量转换为候选分子式的漫画。该公式在化学数据库中进行检索。片段包含和排除列表缩小了搜索结果。(左下)显示公式生成步骤的对话框的一部分。(右下)确定的结构,维拉帕米。
分子式发生器得到C27H39N2O4的候选分子式。实验质量与理论质量之间的误差为1.949 ppm,公式拟合质量(基于同位素模式)为0.980(满分1)。
然后在更多的化学数据库中进行质量和公式搜索。搜索的输入包括质量、期望的离子类型([M+H]+)、元素组成和包含列表。元素组成可以是精确的,也可以是一个范围。例如,C27H39N2O4的候选公式可以扩展到C(27-30)H(36-38)N(2-3)O(1-4)的公式范围,返回模糊匹配。
由于质量公式搜索比光谱搜索有更多的匹配,包含和排除列表缩小了候选对象的范围。如图4所示,这些列表指定了分子内预期的(或不预期的)片段。这些信息可能来自样本的先验知识,或者来自IR等其他技术,这些技术可以深入了解官能团。
质量公式搜索正确地将维拉帕米确定为首选药物。
步骤4:数据库
完成的项目被上传到共享数据库。数据库记录包含每一步生成的所有信息:未处理的色谱图、XIC迹线、相关光谱、组分质量和保留时间、候选结构、每个匹配的数据库记录引用等等。因此,任何具有数据库访问权限的人都可以以任何深度查看信息,从而使协作更加容易。
一个全能的未知识别工作流
该工作流满足介绍中确定的所有标准。
1.它能适应整个脱配方过程。从用户的角度来看,反褶积和光谱搜索是在一个步骤中完成的。(当然,软件是按顺序运行的。)大量搜索是必要时添加的,但它发生在同一接口内。所有必要的信息,从tic到XICs,从光谱到结构等等,都可以在同一个窗口中查看,便于比较信息并立即了解整个项目。
2.工作流复制了可以复制的东西:反褶积、光谱搜索、大量搜索和数据库的简单四步过程。因此,基本原理很简单,如果默认设置有效(或者如果许多类似的样本可以使用相同的设置进行分析),那么只需单击几个按钮就可以了。但是,还可以对各个设置进行细粒度控制,以便根据特定需求定制工作流。
3.示例包括搜索内部数据库和商业数据库。此外,该软件本身允许创建数据库,因此科学家可以通过向数据库中添加收集到的新光谱来轻松扩展可搜索光谱的数量。雷电竞网址由于数据库可以由整个组织共享,因此这些知识可以在团队之间迅速传播。
结论
LC/MS仍然是复杂样品变形最广泛使用的方法之一。它的灵敏度和分辨率有助于化学分离和检测,但将数据转化为已知结构仍然是一项复杂的任务。然而,正如本文所示,专用工具可以简化这个过程。