《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應(yīng)用 > 基于深度強化學(xué)習(xí)的以太坊 MEV 交易防護與交易排序優(yōu)化
基于深度強化學(xué)習(xí)的以太坊 MEV 交易防護與交易排序優(yōu)化
網(wǎng)絡(luò)安全與數(shù)據(jù)治理
嚴彥勝,李京
中國科學(xué)技術(shù)大學(xué)計算機科學(xué)與技術(shù)學(xué)院
摘要: 以太坊交易排序中的最大可提取價值(MEV)問題,使惡意交易者通過操控交易順序獲利,破壞了網(wǎng)絡(luò)公平性并推高Gas費用。為抑制MEV行為和優(yōu)化公平性,同時提升系統(tǒng)效率,提出了一種基于深度 Q 網(wǎng)絡(luò)(DQN)的交易排序優(yōu)化方法。通過設(shè)計合理的狀態(tài)空間、動作空間與獎勵函數(shù),智能體能夠自主學(xué)習(xí)最優(yōu)排序策略。結(jié)合Geth私有鏈、Flashbots MEV-Explore與Ethereum Mempool數(shù)據(jù),系統(tǒng)性驗證了該方法的有效性。實驗結(jié)果表明,DQN排序策略可將MEV提取率降至13%以下,平均Gas費用較傳統(tǒng)策略降低約33.1%,公平性指數(shù)提升至0.78,顯著優(yōu)于現(xiàn)有方法。同時搭建的閉環(huán)實驗系統(tǒng)為區(qū)塊鏈交易公平性和效率優(yōu)化提供了可行方案。
中圖分類號:TP393.0;TP309文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2025.07.004
引用格式:嚴彥勝,李京. 基于深度強化學(xué)習(xí)的以太坊 MEV 交易防護與交易排序優(yōu)化[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2025,44(7):20-26.
Ethereum MEV transaction protection and transaction ordering optimization based on deep reinforcement learning
Yan Yansheng, Li Jing
School of Computer Science and Technology,University of Science and Technology of China
Abstract: The problem of Maximal Extractable Value (MEV) in Ethereum transaction ordering allows malicious actors to profit by manipulating transaction sequences, undermining network fairness and increasing Gas fees. To suppress MEV behavior and optimize fairness while enhancing system efficiency, this paper proposes a transaction ordering optimization method based on Deep Q-Network (DQN). By designing appropriate state space, action space, and reward function, the agent can autonomously learn optimal ordering strategies. The effectiveness of the proposed method is systematically validated using a Geth private chain, along with Flashbots MEV-Explore and Ethereum Mempool data. Experimental results show that the DQN-based ordering strategy reduces the MEV extraction rate to below 13%, decreases average Gas fees by about 33.1% compared to traditional strategies, and raises the fairness index to 0.78, significantly outperforming existing methods. The closed-loop experimental system built in this paper provides a feasible solution for optimizing fairness and efficiency in blockchain transaction ordering.
Key words : Ethereum; Maximal Extractable Value (MEV); transaction ordering optimization; Deep Q-Network (DQN)

引言

隨著區(qū)塊鏈技術(shù)的廣泛應(yīng)用,尤其是以太坊在去中心化金融(DeFi)領(lǐng)域的快速發(fā)展,最大可提取價值(Maximal Extractable Value,MEV)交易問題逐漸成為影響網(wǎng)絡(luò)公平性、安全性和效率的重要挑戰(zhàn)[1]。MEV 由礦工或排序者通過操控交易順序獲得額外利潤,表現(xiàn)形式包括前置攻擊(FrontRunning)、三明治攻擊(Sandwich Attack)等[2]。這些交易模式不僅對普通用戶造成經(jīng)濟損失,還推高整體交易成本,加劇網(wǎng)絡(luò)擁堵,破壞區(qū)塊鏈生態(tài)的穩(wěn)定性與公正性[3]。

MEV的產(chǎn)生主要源于區(qū)塊鏈交易順序的可操控性、交易信息的公開性、Gas競價機制以及DeFi交易的復(fù)雜性?,F(xiàn)有的交易排序方法主要包括先來先服務(wù)(FIFO)排序和Gas競價排序。FIFO排序雖然具有較高的公平性,但缺乏Gas費用優(yōu)化,無法有效防范MEV交易[4]。Gas競價排序根據(jù)交易支付的Gas費用決定執(zhí)行順序,導(dǎo)致Gas競價競爭加劇,使得MEV交易通過支付高額Gas費用獲得優(yōu)先執(zhí)行權(quán),從而進一步破壞交易公平性[5]。

與現(xiàn)有采用啟發(fā)式排序策略或基于靜態(tài)規(guī)則的排序機制相比,本文方法引入強化學(xué)習(xí)框架,具有更強的自適應(yīng)能力,能夠在不同交易負載和攻擊場景下動態(tài)調(diào)整排序策略。同時,相較于現(xiàn)有基于強化學(xué)習(xí)的研究[6-8]主要聚焦于合約交互或交易分類問題,本文首次將深度Q網(wǎng)絡(luò)(Deep QNetwork,DQN)應(yīng)用于交易排序優(yōu)化,并構(gòu)建專門的狀態(tài)-動作空間及獎勵函數(shù),直接面向 MEV 抑制目標進行學(xué)習(xí)。

本文的主要貢獻如下:

(1)提出基于 DQN 的交易排序優(yōu)化方法,動態(tài)調(diào)整交易執(zhí)行順序,以降低 MEV 交易的影響,提高交易公平性。

(2)優(yōu)化 Gas 費用,通過強化學(xué)習(xí)減少 Gas 競價排序帶來的交易成本膨脹問題。

(3)構(gòu)建完整的實驗框架,在Geth (Go-Ethereum)本地私有鏈環(huán)境下復(fù)現(xiàn)真實交易處理流程,并結(jié)合 Flashbots MEV-Explore 數(shù)據(jù)集進行實驗驗證。

實驗結(jié)果表明,所提出的 DQN 排序策略相比傳統(tǒng)方法將 MEV 提取率降低至 13% 以下,平均 Gas 費用較基準策略降低約 33.1%,并顯著提升低 Gas 交易的執(zhí)行公平性,公平性指數(shù)達到 0.78,遠高于傳統(tǒng)策略。


本文詳細內(nèi)容請下載:

http://m.theprogrammingfactory.com/resource/share/2000006610


作者信息:

嚴彥勝,李京

(中國科學(xué)技術(shù)大學(xué)計算機科學(xué)與技術(shù)學(xué)院,安徽合肥230026)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。