蛋白质结构修正与结构评价指标
纽普生物
蛋白质的起始模型,常由于相角的解不够完美,使计算出来的电子密度图产生误差,误导模型的走向,因此需要做进一步的改善,称为修正 (refinement)。
结构模型的误差来源有
1)生物大分子结晶不完美,导致的衍射强度低,误差大;衍射数据分辨率有限。
2)相角推算过程引入的误差。
3)电子密度的解释和模型构建过程引入的认为的误差。所以为了改进结构模型和衍射数据之间的吻合程度同时保持结构模型的立体化学合理性,就必须要调整参数对结构模型进行修正。
通常对结构可靠性判断的依据有两个重要指标:一个是 R 因子(Rwork),另外一个是 Rfree。Rfree 比 R 更可靠和客观(Rfree>R,通常差值<0.05)。R 因子,它被定义为结构振幅的实测值 (Fobs) 与结构振幅的计算值 (Fcalc) 之间的残差。一般来说,用同晶置换 (MIR) 或其他电子密度图构建出来都大分子模型初始的 R 因子大约为 40%- 50%,而经过适当修饰后的 R 因子通常为 20% 左右。
R 因子的应用是计算自由 R 因子 (R-free)。在此法中,大约 10% 的衍射数据不用于结构精修,而 R-free 就是根据这些衍射数据计算的(是一道交叉验证的程序)。很显然,自由 R 因子比 R 因子会大一些,但应该比较接近。自由 R 因子与 R 因子的差值一般在 2%- 5% 的范围内,如果差别大于 10%,说明结构是可疑的。
根据经验,一个正确的结构,其自由 R 因子约为分辨率数值的 10%。例如,分辨率为 2.5 埃时,自由 R 因子应约为 25%。小的 R 因子 (≤ 20%) 是结构正确性的重要指标,但并不是绝对的,有些部分错误的结构也能得到小于 20% 的 R 因子。