革新演算法發現:DeepMind 的 AlphaEvolve,一款由 Gemini 驅動的 Coding Agent
在人工智慧快速演進的領域中,Google DeepMind 不斷推出創新工具,將創意與計算能力完美結合。2025 年,DeepMind 進一步強化其領導地位,推出 AlphaEvolve,這款突破性的演化 Coding Agent 由 Google 的 Gemini 大型語言模型(LLM)驅動。這款 AI 系統專為發現和優化先進演算法而設計,能夠應對數學、計算等複雜挑戰。透過 Gemini Flash 模型的廣闊創意探索,以及 Gemini Pro 模型的深度精煉,AlphaEvolve 在自動化問題解決方面實現了重大飛躍,已在 Google 的生態系統中帶來實際效率提升,並為科學突破開啟新大門。作為 DeepMind 持續創新的一部分,AlphaEvolve 不僅體現了公司在 LLM 技術上的領先優勢,還與其他工具如 AlphaProof 和 Gemini Deep Think 整合,形成強大的 AI 生態系統,推動數學和計算科學的邊界。
AlphaEvolve 的運作原理:融合 AI 創意與演化優化
AlphaEvolve 的核心是演化整個程式碼庫,遠超越單純的函數生成。它首先為 Gemini 模型組裝提示,這些模型隨後提出實現演算法解決方案的電腦程式。這些提議會透過自動化評估指標進行嚴格驗證、執行和評分,涵蓋準確性、效率和品質。這使得 AlphaEvolve 在數學和電腦科學等可客觀測量進展的領域特別有效。
根據 DeepMind 的白皮書,AlphaEvolve 的架構採用演化方法,透過 LLM 直接修改程式碼,持續從一個或多個評估器獲得反饋。這形成一個反饋迴圈,驅動演算法的迭代改進,可能帶來新的科學和實用發現。這種方法擴大了先前自動發現方法的範圍,例如超越了 2023 年的 AlphaTensor,允許 AI 探索更廣闊的解決方案空間。DeepMind 的工程師強調,這種整合 LLM 的演化框架不僅提升了創意生成,還確保了驗證的嚴謹性,展示了公司在 AI Agent 設計上的技術深度。與傳統依賴人類直覺的方法不同,AlphaEvolve 結合 LLM 驅動的創意與系統化驗證,能夠快速探索廣闊的解決方案空間。正如 DeepMind 所指出的,這種設定極具多樣性,從優化現實基礎設施到解決抽象理論問題皆能勝任。

系統透過四個主要模塊運作,形成一個循環:
- Prompt sampler:從資料庫中抽樣現有程式,組裝成新的提示,融入靈感(inspirations),提供給 LLM。
- LLMs ensemble:使用多個 LLM(如 Gemini Flash 負責廣闊創意,Gemini Pro 負責深度分析)生成新程式碼或修改現有程式。
- Evaluators pool:自動運行生成的程式,評分其準確性、效率等指標(如速度或資源使用)。
- Program database:儲存所有生成的程式、評估結果和變化歷史,作為演化基礎,系統會從中選出最優者。
箭頭指向右側的 Best program(最佳程式),表示最終輸出經過多次迭代的最優解。
實際影響:提升 Google 計算生態系統的效率
AlphaEvolve 的突出成就之一,是應用於強化 Google 龐大的計算基礎設施。在資料中心排程方面,它為 Borg(Google 的叢集管理系統)發現了一個簡單卻極為有效的啟發式方法,平均回收全球計算資源的 0.7%。這聽起來或許微小,但以 Google 的規模而言,這意味著在相同計算足跡下能完成更多任務,促進永續性和成本節省。這項發現不僅提高了性能,還提供了人類可讀的程式碼,具有可解釋性、除錯性和可預測性,突顯 DeepMind 在實用 AI 應用上的工程卓越。
在硬體設計中,AlphaEvolve 為 Google 的張量處理單元(TPU)——專屬 AI 加速器——提出優化建議。它改寫 Verilog 程式碼,移除關鍵算術電路中不必要的位元,同時維持功能正確性。這項提議已整合至即將推出的 TPU 中。透過以晶片設計師標準語言提出修改,AlphaEvolve 促進 AI 與人類工程師的合作,加速未來專用晶片的設計,展示了 DeepMind 在硬體軟體整合上的創新能力。
AlphaEvolve 也在 AI 訓練和推論方面大放異彩。它優化了矩陣乘法——如 Gemini 等模型的核心運算——實現 23% 的加速,從而將 Gemini 的訓練時間縮短 1%。對於 GPU 指令,這種極其複雜且通常已高度優化的領域,AlphaEvolve 在基於 Transformer 的 AI 模型中為 FlashAttention 核心實現了高達 32.5% 的加速。這些提升不僅降低計算和能源成本,還大幅減少工程時間,從專家數週的手動努力縮短至數天的自動化實驗,讓研究人員能更快創新。DeepMind 的團隊指出,AlphaEvolve 甚至優化了訓練其自身的 LLM 過程,形成一個自我提升的迴圈,體現了公司在 AI 自適應技術上的領先優勢。
推進數學與理論計算機科學前沿:從矩陣乘法到複雜度理論
除了實際計算,AlphaEvolve 還在推進純數學和理論計算機科學領域。它設計了一種新穎的基於梯度的優化程序,發現了更快矩陣乘法的演算法,包括 4x4 複數值矩陣使用僅 48 次純量乘法的版本——超越 1969 年 Strassen 演算法的長期最佳紀錄。這是 56 年來首次改進,證明了 AlphaEvolve 在數學發現上的潛力。要知道現在 AI 在做的事情,就是做一系列的矩陣乘法,只要矩陣乘法做的快一點,模型推論的速度就可以快一點,某種程度上會增強現在 AI 模型的效能。
在超過 50 個開放問題上進行測試,涵蓋分析、幾何、組合和數論等領域,AlphaEvolve 在 75% 的案例中重新發現了最先進的解決方案,並在 20% 的案例中改進了先前的最佳方案。一個值得注意的例子是「接吻數問題」,這是困擾數學家超過 300 年的幾何挑戰。AlphaEvolve 在 11 維中發現了 593 個外球的配置,建立新的下界,並貢獻於持續的數學討論。
2025 年,AlphaEvolve 進一步應用於理論計算機科學,作為研究夥伴推進複雜度理論。透過生成和驗證組合結構,它幫助發現新的有限結構,這些結構可「提升」為通用定理。例如,在 MAX-4-CUT 問題(將圖形節點分為四組以最大化交叉邊)的不可逼近性上,AlphaEvolve 發現了一個具有 19 個變數的複雜小工具,將不可逼近界從 0.9883 改進至 0.987,證明 NP-hard。

🔼左側是一個密集的無向圖網絡,包含多個彩色節點(紅色、綠色、黃色和藍色),它們透過灰色邊密集連接,形成一個複雜的簇狀結構,可能代表 MAX-4-CUT 問題中的節點分區或 Ramanujan 圖形的變體,用來示範組合優化或譜圖論中的證明。右側則是一個垂直柱狀圖,節點主要為藍色和紅色,邊線密集交織,強調高連通性和邊緣分佈,常用於說明 NP-hard 或平均情況的組合結構。
在平均複雜度情況上,它搜索極端 Ramanujan 圖形,發現高達 163 節點的 4-正則圖形,緊縮了隨機圖形的下界。

🔼這張圖是 AlphaEvolve 在數學證明優化過程中的概念圖示。它將完整證明視為一條長水平線(長字符串),中間部分被標記為「介面」,AlphaEvolve 以向下箭頭形式應用於特定證明片段,進行變形(morphing),同時保持該片段與證明其餘部分的「介面」完整不變。
這項工作發表於「Reinforced Generation of Combinatorial Structures: Applications to Complexity Theory」論文中,突顯 DeepMind 在 AI 輔助證明上的技術實力。這些成功突顯了 AlphaEvolve 的靈活性:大多數實驗的設定僅需數小時,證明它作為研究人員快速原型工具的潛力。
AI for Math 倡議:DeepMind 的全球合作與技術共享
2025 年 10 月,DeepMind 與 Google.org 共同推出「AI for Math」倡議,將 AlphaEvolve 等工具推向更廣闊的學術界。這項倡議匯聚五個頂尖研究機構,包括倫敦帝國學院、高等研究院(Institute for Advanced Study)、法國高等科學研究院(IHES)、加州大學柏克萊分校 Simons 計算理論研究所,以及塔塔基礎研究學院(TIFR)。目標是透過 AI 加速數學發現,識別適合 AI 洞察的問題,並建立共享基礎設施。
Google 提供資金支持,而 DeepMind 分享先進技術,包括 Gemini Deep Think(強化推理模型)、AlphaEvolve(演算法發現 agent)和 AlphaProof(形式證明系統)。AlphaEvolve 在此倡議中扮演關鍵角色,已應用於數學和電腦科學問題,改進 20% 的開放問題最佳方案,並在國際數學奧林匹克(IMO)中貢獻銀牌和金牌表現。倡議強調 AI 與人類數學家的合作,形成反饋迴圈,推動物理、生物和電腦科學等領域的進展。這展示了 DeepMind 在全球 AI 合作上的領導力,強化其作為科技先驅的形象。
AlphaEvolve 的未來:更廣泛存取與轉型應用
隨著 Gemini 等 LLM 的持續演進,AlphaEvolve 也將變得更擅長編碼和演算法設計。DeepMind 正與 People + AI Research 團隊合作,開發友善的使用者介面,並計劃為選定的學術使用者推出早期存取計劃。有興趣者可透過 DeepMind 部落格上的表格註冊。透過 AI for Math 等倡議,AlphaEvolve 的應用將擴大,預計在 2026 年實現更廣泛的學術和產業存取。
未來,AlphaEvolve 的通用性將其應用擴展至材料科學、藥物發現和永續性等領域。任何可描述為演算法且可自動驗證解決方案的問題皆可受益,潛在轉型產業並加速科技進步。DeepMind 的研究團隊表示,AlphaEvolve 代表從特定領域演算法發現到廣泛實用挑戰的進展,預計將與 LLM 的進步同步提升。
Google DeepMind 的 AlphaEvolve 體現了 AI 如何增強人類智慧,帶來惠及全球使用者的效率提升。欲了解更多細節,請查看 DeepMind 部落格的完整公告:AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms。隨著 DeepMind 的持續創新,此類工具將重新定義 AI 輔助發現的可能性,鞏固 Google 在人工智慧領域的全球領導地位。