熱門關(guān)鍵詞: ELISA試劑盒 - 大鼠ELISA試劑盒- 小鼠ELISA試劑盒
全國統(tǒng)一客服熱線:
0755-28715175
子科生物報道:?真核細胞內(nèi)蛋白質(zhì)的降解依賴于自噬及泛素-蛋白酶體系統(tǒng)(2004年諾貝爾化學獎)。其中,泛素-蛋白酶體系統(tǒng)負責降解細胞內(nèi)超過80%的蛋白,該系統(tǒng)的關(guān)鍵酶為E3泛素連接酶,負責識別要被降解的底物蛋白并將其泛素化。人體內(nèi)表達600余種E3,這些E3以特定規(guī)則結(jié)合不同底物蛋白,從而實現(xiàn)降解過程的特異性。底物上的E3識別位點被稱為degron[1],degron是長度5-8個氨基酸的短肽,通過disorder-to-order轉(zhuǎn)換的方式與E3結(jié)合,使得底物被泛素化修飾進而被降解。因此,系統(tǒng)分析蛋白底物上的degron對于研究蛋白質(zhì)的降解過程以及蛋白降解異常在疾病中的作用非常重要。
近日,北京大學基礎(chǔ)醫(yī)學院李婷婷課題組在BMC Biology雜志上在線發(fā)表文章“Systematic Prediction of Degrons and E3 Ubiquitin Ligase Binding via Deep Learning”,開發(fā)了degron預測工具Degpred(http://degron.phasep.pro/)。
在該工作中,作者構(gòu)建了基于BERT預訓練模型的深度學習預測工具(圖1左),該預訓練模型為蛋白質(zhì)上每個氨基酸輸出一個768維的特征向量。隨后,根據(jù)特征向量,作者利用長短時記憶網(wǎng)絡(luò)及全連接層來對每個氨基酸的degron可能性打分。
首先,作者收集了ELM數(shù)據(jù)庫及其他文獻中報道的有實驗依據(jù)的303個degron。由于不同E3結(jié)合的degron有不同的一級序列偏好,作者將degron基于一級序列分為五組(圖1右),以四組為訓練集,一組為測試集的方式來探究不同序列模式的degron是否具有更高級別序列性質(zhì)的相似性。在測試過程中作者發(fā)現(xiàn),雖然訓練集和測試集的degron具有不同的一級序列特征,但模型在測試集上取得了較好的預測效果。這說明不同E3識別的degron具有相似的高級別序列性質(zhì)。作者整合了五次訓練的模型,構(gòu)建得到最終的degron預測模型—Degpred,并利用Degpred在人類蛋白質(zhì)組上預測了46,000余個degron。
圖1 左:模型框架;右:基于序列相似性將degron分為五組。
以往研究發(fā)現(xiàn)degron趨向于定位在蛋白質(zhì)無序區(qū)域(disorder region),并且是一類molecular recognition feature[2]。通過分析Degpred模型在人類蛋白質(zhì)組上預測得到degron的相關(guān)屬性,作者發(fā)現(xiàn)預測得到的degron具有較高的無序序列特征、molecular recognition feature打分以及表面可及性等特征打分(圖2上)。此外,作者發(fā)現(xiàn)預測得到的degron相鄰蛋白序列富集賴氨酸以及泛素化修飾(圖2下),這說明預測得到的degron能夠促進相鄰賴氨酸的泛素化,這一發(fā)現(xiàn)與degron功能相符合。
圖2 在人類蛋白組上比較利用Degpred以及其他工具預測的degron相關(guān)特征差異
實現(xiàn)degron預測之后,作者基于Degpred以及從文獻中收集的E3底物相互作用網(wǎng)絡(luò)計算得到一系列E3 motif,并基于此構(gòu)建了人類蛋白降解調(diào)控網(wǎng)絡(luò)(motif計算方法及網(wǎng)絡(luò)構(gòu)建過程可參考原文)。為檢驗預測結(jié)果的可靠性,作者在CBX6上進行了實驗驗證。CBX6的第269-273位氨基酸(DARSS)被預測為E3酶SPOP識別的degron,但此degron并不屬于已知的SPOP motif。實驗發(fā)現(xiàn),突變該degron顯著增加了CBX6的表達量,延長了CBX6的半衰期,并且減弱了CBX6與SPOP的結(jié)合(圖3)。這一實驗證明了Degpred模型預測結(jié)果的可靠性。
圖3 CBX6上預測的SPOP結(jié)合degron驗證實驗
最后,作者分析了degron在TCGA腫瘤患者中的突變情況。分析發(fā)現(xiàn),腫瘤中的突變趨向于發(fā)生在degron及附近位置(圖4a),且degron相關(guān)突變往往有更高的發(fā)生頻率(圖4b)。作者進一步分析了不同腫瘤中degron突變比例,發(fā)現(xiàn)CTNNB1、NFE2L2、RXRA、EPAS1等上百個蛋白的突變趨向于發(fā)生在degron上(圖4d),degron突變可能導致這些蛋白高表達,進而導致相關(guān)通路激活而導致腫瘤。
此外,基于多種預測腫瘤驅(qū)動(cancer driver)突變的方法,作者發(fā)現(xiàn)degron相關(guān)突變的腫瘤驅(qū)動突變比例更高(圖4e)。由于degron調(diào)控蛋白質(zhì)降解,作者推測degron突變對短半衰期(short-lived)蛋白影響更大。為此,作者分析了來源于不同數(shù)據(jù)的短半衰期蛋白,發(fā)現(xiàn)這些蛋白上的degron突變更趨向于導致腫瘤(圖4f)。
圖4 degron突變分析
綜上,作者利用遷移學習預測蛋白底物上的degron,并基于計算得到的E3 motif分析 每個degron所結(jié)合的E3。進一步,作者從性質(zhì)分析以及實驗等方面證明了預測結(jié)果的可靠性,并在腫瘤數(shù)據(jù)中發(fā)現(xiàn)短半衰期蛋白的degron突變更趨向于導致腫瘤。本工作中收集的數(shù)據(jù)以及預測得到的數(shù)據(jù)(degron,E3底物關(guān)系)可從http://degron.phasep.pro/查詢(圖5)。
圖5 網(wǎng)站蛋白預測界面示意圖
北京大學基礎(chǔ)醫(yī)學院李婷婷副教授為本文通訊作者,基礎(chǔ)醫(yī)學院八年制博士生侯超為本文第一作者。基礎(chǔ)醫(yī)學院博士生李雨軒和北京大學生命科學院博士王夢瑤負責了本文章中的實驗驗證部分,北京大學生命科學院吳虹教授為本課題提供了重要指導。李婷婷課題組致力于通過生物信息學手段研究相分離及蛋白質(zhì)修飾過程,相關(guān)工作可以通過http://BioinfoLilab.phasep.pro/訪問。
原文鏈接:https://bmcbiol.biomedcentral.com/articles/10.1186/s12915-022-01364-6
1. Meszaros B, Kumar M, Gibson TJ, Uyar B, Dosztanyi Z: Degrons in cancer. Sci Signal 2017, 10(470).
2. Guharoy M, Bhowmick P, Sallam M, Tompa P: Tripartite degrons confer diversity and specificity on regulated protein degradation in the ubiquitin-proteasome system. Nat Commun 2016, 7:10239.
?0755-28715175/33164177
粵公網(wǎng)安備 44030902000304號