算法简介
目前使用的所有电荷去卷积算法都是迭代算法,这些算法会收敛到去卷积中性质谱以及中性质量的电荷分布,这些分布共同解释观察到的 m/z谱。最广泛使用的去卷积算法是 MaxEnt 和 ReSpect,大约于 30年前开发出来,并授权给大多数质谱仪器制造商。
基于最大熵的算法可以减少背景噪音并解决紧密间隔的质量问题,但为了获得更大熵值,往往引起峰分裂,产生artifacts。例如,在较宽的目标质量范围内,去卷积可能会产生“harmonic”artifacts,即具有比率关系的质量的 m/z 系列的重合,导致真实质量的1/n或n倍的虚假质量峰值; 在相对较窄的目标质量范围内,off-by-one分配也会产生另一种类型的artifacts,即真实质量两侧的小峰。
随着治疗性生物制品复杂性不断提高,artifacts在实际应用中往往具有很大误导性。例如,在双特异性抗体分析中,harmonic artifacts可能被误认为半抗,聚集或者错配;在ADC分析中,off-by-one artifacts可能会导致载药量定量出现偏差。
为了解决这些问题,Protein Metrics开发了“简约”电荷去卷积算法,即用最少数量的中性质量峰解释观察到的m/z谱。简而言之,Protein Metrics使用迭代算法来推断 m/z 谱每个小区间内的电荷混合。 对于第一个去卷积质谱,所有电荷值均设置为同等可能性; 然后根据先前去卷积的质谱计算新的电荷值,并重复该过程。 Protein Metrics对具有许多不同电荷的 m/z 间隔应用了“简约”偏差,因为映射到相同 m/z 的多个真实质量比由电荷不确定性引起的去卷积artifacts少得多。在每次迭代中,该算法都会更新电荷向量,从而提供观察到的 m/z 谱的每个点处的每个电荷的概率。新的电荷向量给出新的去卷积质谱,并且每次迭代都会减少观察到的 m/z 谱与根据最后一组电荷向量和去卷积谱计算的 m/z 谱之间差异的平方和,从而避免artifacts产生。
除此以外,“简约”电荷去卷积算法还支持同位素分辨,变性蛋白,非变性蛋白,寡核苷酸等质谱数据分析。
应用场景
1 同位素分辨质谱数据分析
1.1 参数设置
同位素分辨质谱数据分析需要一组去卷积参数,这将使软件能够保留去卷积图谱中的同位素分辨率,如图1所示:
图 1同位素分辨去卷积参数
对于极高分辨率的数据,用户可以进一步降低值以避免平滑。
为了引导软件来计算单同位素质量,可以使用以下高级参数:
[Intact]
MaxMonoisotope=30000
这个参数认为质量小于30000,质量峰是同位素分辨的;质量大于30000,质量峰是非同位素分辨的。
1.2案例分享
以40碱基寡核苷酸(单同位素分子量12286.11)为例,解读同位素分辨质谱数据可视化界面。
由图2a所示,Byos可自动标识寡核苷酸中的主峰(Oligo 40-mer,Reference)和已知杂质;图2b是主峰放大图,黄色和绿色钻石分别表示单同位素分子量和平均分子量。
图 2寡核苷酸去卷积图谱
由图3a所示,任意选择去卷积图谱中5个质量峰,软件自动生成右侧对应的Mass XIC洗脱图谱;由图3b所示,保留时间与分子量呈现正相关,这也与寡核苷酸色谱保留行为一致,因此通过洗脱图谱可进一步验证去卷积结果的正确性。
图 3洗脱图谱
由图4a所示,软件支持Top-Down分析,并自动标识MS2碎片离子,在CID模式下,主要产生a/w系列离子;图4b是母离子放大图,为了使标识更加清晰,软件自动对碎片离子同位素峰簇进行积分得到彩色棒。注意,彩色棒不存在于原始数据中。
图 4寡核苷酸MS2图谱
2 变性蛋白分析
2.1 参数设置
变性蛋白的去卷积分析一般使用默认参数,如图5所示:
图 5变性抗体去卷积参数
如果去卷积图谱上存在杂峰,我们不能确定其存在的真实性,可以通过以下三种方式加以验证:
①更改basic参数中m范围,
②上调Advanced参数中Iteration max,
③使用Advanced command中KnownMassDelta=162.1(如果去卷积图谱中存在这个差值)。
只要杂峰在上述任何一个条件下消失,表明其就是artifacts。
2.2 案例分享
我们以waters mab为例,介绍如何清除去卷积图谱上的杂峰。
如图6a所示,使用默认参数在A处产生了off-by-one artifacts,相邻的主峰之间分子量相差约为162 Da;引入KnownMassDelta,重新计算后,off-by-one artifacts随之消失,如图6b所示:
图 6 KnownMassDelta的去卷积图谱
将Iteration max由10调为30,重新计算后,off-by-one artifacts随之消失,如图7b所示:
图 7 调大Iteration max的去卷积图谱
注意,改变去卷积参数,不影响计算得到的平均分子量结果。
3 非变性蛋白分析
3.1 参数设置
非变性质谱是研究蛋白质复合物相互作用的有效方法。 该技术通常与SEC结合使用,以表征生物治疗药物的尺寸异质性,例如多聚体和剪切体。 然而,由于大质量范围、更少和更低的电荷态以及盐加合物的存在,非变性质谱的去卷积通常面临更大挑战。
Protein Metrics开发了一系列advanced command用以解决这些问题,比如ChargeEnvelopeFilterPower2=true可以给出去卷积图谱中单体和多聚体准确峰高;ChargeEnvelopeWeights=0.1, 0.8, 0.1可引导软件结合3个连续电荷态(默认参数认为目标峰至少含有5个连续电荷态);SteppingMethod=Linear可以更好地反映质谱仪器的分辨率,并且可以在低质量处生成同位素分辨率的去卷积图谱,在高质量处对中性质谱峰进行平滑。
3.2 案例分享
以MSP1D1_DMPC 磷脂纳米盘为例,介绍高度多分散蛋白去卷积分析方法。
由图8右上角插图所示,MSP1D1_DMPC非变性m/z谱呈宽范围多分散分布并且数据明显重叠,为了进行有效去卷积,在advanced command中添加了CombFilter=5。Byos 允许用户指定一个Comb filter对间隔均匀的delta mass取平均值,DMPC的delta mass为677.5。通过计算得到MSP1D1_DMPC平均分子量 为 141.542 kDa,其中大约有 143 ± 20–30 个 DMPC 分子和 2个MSP( 分子量为22.4 kDa)分子,与超速离心结果一致。
图 8 MSP1D1_DMPC去卷积图谱
注意,CombFilter 2适用于一系列峰间隔为 162 Da 的糖蛋白;CombFilter 3适用于高度多分散的分子,例如磷脂纳米盘,PEG等。
结论
“简约”电荷去卷积算法可以有效地对寡核苷酸,蛋白质及其复合物质谱数据进行去卷积,支持变性和非变性条件下正负离子电离模式 。
Byos支持Top-Down分析,自动准确标识碎片离子,与传统的Bottom-Up方法相比,在减少数据分析所需的时间方面具有显著优势。