9 月 25 日消息,科技媒體 9to5Mac 昨日(9 月 24 日)發(fā)布博文,報道稱蘋果研究團隊發(fā)布了輕量級蛋白質(zhì)折疊預(yù)測 AI 模型 SimpleFold,采用流匹配(Flow Matching)方法替代多序列比對(MSA)等復(fù)雜模塊,大幅降低計算成本。

該媒體指出 AlphaFold2(Google DeepMind 的突破性 AI 模型)、RoseTTAFold 等傳統(tǒng)模型雖然具備更高的精度,但由于依賴多序列比對、三角更新等計算密集的特定架構(gòu),訓(xùn)練與推理成本高昂。蘋果團隊希望通過簡化結(jié)構(gòu),降低硬件門檻,讓更多科研團隊受益。
SimpleFold 核心采用 2023 年提出的流匹配(Flow Matching)方法,這種技術(shù)源自擴散模型,但在生成過程中不逐步去噪,而是直接從隨機噪聲一次生成目標(biāo)結(jié)構(gòu)。相比逐步迭代的擴散模型,這種方式跳過多個去噪環(huán)節(jié),計算量更低、生成速度更快,已在文本生成圖像和 3D 建模領(lǐng)域獲得成功。
在實驗中,研究人員分別訓(xùn)練了從 100M 到 3B 參數(shù)的多個版本,并在 CAMEO22 和 CASP14 兩大權(quán)威基準(zhǔn)上進行評估。
這些測試覆蓋了模型在泛化性、魯棒性(Robustness,一個系統(tǒng)或過程在面臨干擾、不確定性或異常輸入時,仍能維持其功能或穩(wěn)定運行的能力)和原子級精度上的表現(xiàn),結(jié)果顯示,SimpleFold 在性能上穩(wěn)定優(yōu)于同類流匹配模型 ESMFlow,并媲美頂尖模型表現(xiàn)。
具體來看,SimpleFold 無需使用昂貴的多序列比對和三角注意機制,在 CAMEO22 上達到 AlphaFold2、RoseTTAFold2 約 95% 的性能。更小的 SimpleFold-100M 版本在保持高效的同時,性能超過 ESMFold 的 90%,驗證了通用架構(gòu)模塊在蛋白質(zhì)預(yù)測領(lǐng)域的可行性和競爭力。

研究還發(fā)現(xiàn),隨著模型規(guī)模和訓(xùn)練數(shù)據(jù)增加,性能穩(wěn)定提升,尤其在高難度測試中優(yōu)勢明顯。蘋果團隊強調(diào),SimpleFold 只是起點,希望它能推動社區(qū)構(gòu)建更多高效、強大的蛋白質(zhì)生成模型,進一步加速藥物研發(fā)和新材料探索。