HUN-REN-ELTE蛋白質模型研究小組(化學研究所)已經為一種數學方法奠定了基礎,允許計算機輔助比較蛋白質的三維結構。這種方法的獨特之處在于,目前可用的替代方法只考慮了原子的位置,而這種名為LoCoHD(局部組成海靈格距離)的新技術還包括了原子的化學信息。
蛋白質是分子機器,執行細胞功能所需的過程,充當分子開關,轉錄DNA信息,運輸小分子和大分子,調節代謝相關的化學反應。然而,要使這一切成功,所討論的蛋白質必須具有正確的空間構象,即其自身正確的3D排列。有幾種實驗方法(x射線晶體學、核磁共振波譜學、低溫電子顯微鏡)可用于確定蛋白質中原子的排列,在過去的幾十年里,蛋白質研究人員已經發現了近22萬種蛋白質的形狀。這些結果越來越需要能夠分析這些排列的計算方法的發展。
其中一種方法是名為LoCoHD的算法,它是由ELTE Hevesy Gy?rgy化學學院的博士候選人Zsolt Fazekas和András Perczel博士研究小組的研究員開發的。該算法根據蛋白質的化學性質(如元素組成、電荷、疏水性等)比較氨基酸周圍的局部環境。該方法以0到1的簡單比例決定所討論的結構彼此之間的差異。接近0的值表明原子排列和化學性質之間高度相似,而接近1的值表明所比較的蛋白質可能具有非常不同的性質。由此產生的數值(所謂的度量)可以用來獲得關于所研究系統的新信息。
該算法使用多步協議生成表示結構差異的數字。在第一步中,它將蛋白質中的真實原子轉化為所謂的原始原子。這些可以用標記的位置來表示,這些標記告訴了原始原子的化學性質。例如,一個原始原子可以是“帶正電的氮”、“帶負電的氧”、“帶中性電的氧”、“芳香碳”等等。標簽是根據所謂的原始類型模式生成的,該模式以表格的方式告訴我們如何將真實原子轉換為原始原子。用戶可自由指定此表,固定化學分辨率的方法。第二步是通過選擇基本原子的子集來確定比較的參考點。這些選定的特殊原始原子稱為錨原子。對于選擇的每個錨原子對,算法執行一個比較步驟,比較結果給出我們想要的不相似度度量。這些數字可以在局部水平上使用,或者它們可以被平均成一個描述整個蛋白質的描述符。
在這項發表在著名雜志《自然通訊》上的研究中,研究人員強調,這種方法也可以用于兩年一次的CASP(蛋白質結構預測的關鍵評估)競賽,這是蛋白質研究領域的一個知名競賽。在這次比賽中,參賽者使用不同的算法來模擬尚未公布結構的蛋白質的形狀。CASP的評委使用許多結構比較方法來評估競爭者,但這些方法都沒有考慮到當地氨基酸環境的化學性質。利用2020年CASP14競賽的數據,研究人員現在對幾種模型蛋白質進行了比較分析,包括基于人工智能的AlphaFold2方法預測的結構。其中,他們強調了對SARS-CoV-2病毒中一種名為ORF8的蛋白質的分析。在這種蛋白質的模型結構中,氨基酸環境在相互作用模式上與實驗結構中發現的環境有很大的不同。
除了研究靜態結構外,研究人員還測試了該方法是否適用于分析蛋白質的內部運動。他們使用了能夠再現分子運動的模擬和從結構集合中提取的數據。正在研究的系統之一是足蛋白,它在腎臟中起著至關重要的作用,其突變可能導致嚴重的,通常是致命的疾病。LoCoHD方法用于鑒定蛋白質中在podocin運動過程中發生重大化學環境變化的氨基酸,這些變化會影響其結構和功能。類似地,LoCoHD方法已成功應用于HIV-1衣殼蛋白的研究,其中已鑒定出一種對病毒包膜形成至關重要的氨基酸。
“這些結果不僅是研究的好奇心,而且通過更有效地研究蛋白質結構,我們可以更接近更好地了解導致嚴重疾病的病原體,并開發有效的藥物和治療方法。”
(文章來源:www.ebiotrade.com/newsf/2024-5/20240530122556614.htm) |