在区块链技术中,通过控制哪些交易被纳入区块、哪些被排除,或调整交易执行顺序来获取收益的能力,被称为「最大可提取价值」(MEV)。这一现象在几乎所有主流区块链网络中都普遍存在,长期困扰着行业专家和研究者。面对这一难题,众多学者提出了一个关键问题:加密技术能否为MEV提供有效的解决方案?其中一种备受关注的方案是采用「加密内存池」机制——用户将交易加密后广播,仅在最终排序完成后才解密披露。理论上,这种机制能让共识协议实现「盲选」交易顺序,从而阻止在排序阶段利用MEV机会获利。然而现实情况是,无论是从理论模型还是实际应用角度,加密内存池都无法为MEV问题提供普适性解决方案。本文将深入剖析其中的技术难点,并探讨加密内存池的可行性设计路径。
加密内存池的核心运作机制
关于加密内存池已存在多种技术提案,但其通用框架可概括为以下四个关键步骤:
1. 用户将交易内容进行加密处理并广播至网络
2. 加密交易被提交至区块链网络(部分方案中需先经过可验证的随机化处理)
3. 当包含这些交易的区块最终确认后,执行交易解密操作
4. 解密后的交易被正式执行
需要特别关注的是第三步中的解密环节——由谁执行解密操作成为核心难题。若让用户自行解密,则存在明显的安全漏洞:攻击者可能通过猜测加密交易中的MEV机会,加密自身交易并试图插入有利位置。若交易顺序符合预期,攻击者将获利;若未达预期,则拒绝解密,其交易也不会被纳入最终区块链。理论上可通过惩罚机制解决此问题,但实际操作难度极大:所有加密交易的惩罚力度必须完全统一(毕竟加密后无法区分),且惩罚力度需足够严厉才能有效遏制投机行为。这会导致大量资金被锁定且保持匿名状态,更严重的是,若因程序漏洞或网络故障导致真实用户无法解密,他们也将遭受损失。
为解决这一问题,大多数方案建议在加密交易时确保其未来必然可解密,即使交易发起者离线或拒绝配合。具体实现方式主要有以下几种:
可信执行环境(TEE)方案
用户可将交易加密至由TEE安全区域持有的密钥。基础方案中,TEE仅用于在特定时间点后解密交易(这要求TEE具备内部时间感知能力)。更复杂的方案则让TEE负责解密交易并构建区块,根据交易到达时间、费用等标准进行排序。相比其他方案,TEE可直接处理明文交易,通过过滤回滚交易减少链上冗余信息。但该方法的主要缺陷是高度依赖硬件可信度。
秘密共享与门限加密方案
该方案中,用户将交易加密至由特定委员会(通常是验证者子集)共同持有的密钥。解密需满足门限条件(如委员会三分之二成员同意)。支持者认为,既然多数协议已默认验证者具备「诚实多数」特性,那么也可假设多数验证者会保持诚实。但需注意关键区别:区块链分叉等共识失败属于「弱信任假设」,而恶意委员会私下提前解密交易属于「强信任假设」,后者更难被检测和惩罚。
时间锁定与延迟加密方案
作为门限加密的替代方案,延迟加密通过将交易加密至某个公钥,而该公钥对应的私钥被隐藏在时间锁定谜题中实现。解密过程需要反复执行无法并行化的计算,确保交易在最终确认前无法被解密。这种机制面临实际挑战:难以确保解密时间的精确性、需要特定实体运行高性能硬件解算谜题(但激励机制不明确)、所有广播的交易都会被解密(包括未写入区块的)。
见证加密方案
这是最先进的密码学方案,通过将信息加密为只有能通过SNARK证明满足特定条件的主体才能解密的形式。理论上,见证加密可完美实现「交易仅在区块最终确认后才能解密」的条件。该方案具有通用性,其他方案可视为其具体应用形式。但当前尚无可落地的基于见证的加密方案,且即便存在,在权益证明链中未必比基于委员会的方法更具优势。在工作量证明共识协议中,见证加密的优势更为显著,因为恶意委员会无法私下伪造最终确认状态。
加密内存池面临的技术挑战
加密内存池在防范MEV方面面临多重技术障碍,核心在于信息保密本身的技术难度。尽管我们在TLS/HTTPS等网络领域和PGP至Signal等私密通信中广泛应用加密技术数十年,但实践证明加密技术并非绝对可靠。
首先,某些主体可能直接获取用户交易的明文信息。用户通常不会自行加密交易,而是委托钱包服务商处理,这导致钱包服务商掌握交易明文,可能利用或出售这些信息提取MEV。加密安全性完全取决于密钥掌控范围——密钥越分散,安全边界越大。
更严重的是元数据泄露问题。搜索者可利用未加密的元数据推测交易意图,无需完全理解交易内容。例如,只要能合理判断某笔交易来自特定DEX的买单,就足以发起攻击。元数据可分为两类:加密技术固有的经典难题(如交易大小、广播时间、源IP地址)和加密内存池特有的问题(如交易费用/gas信息)。
交易大小:加密无法隐藏明文大小。例如,即使经过加密,仍可通过视频流中每个数据包大小判断Netflix播放内容。在加密内存池中,特定类型交易可能具有独特大小,从而泄露信息。
广播时间:加密同样无法隐藏时间信息。在Web3场景中,某些发送方可能按固定间隔发起交易。交易时间还可能与其他信息相关联,如交易所活动或新闻事件。更隐蔽的利用方式是CEX与DEX套利:排序者可通过插入尽可能晚创建的交易利用最新CEX价格,同时排除某一时间点后广播的所有加密交易,确保独享最新价格优势。
源IP地址:搜索者可通过监控点对点网络追踪源IP地址推断交易发送者身份。若特定发送方有固定行为模式,这对搜索者极具价值。例如,知晓发送者身份后,可将加密交易与已解密历史交易关联。
交易发送者与费用/gas信息:交易费用是加密内存池特有的元数据类型。在以太坊中,传统交易包含链上发送者地址(用于支付费用)、最大gas预算及单位gas费用。发送者地址可用于关联多笔交易及现实实体;gas预算则能暗示交易意图。例如,与特定DEX交互可能需要可识别的固定gas量。
复杂的搜索者可能结合多种元数据类型预测交易内容。理论上这些信息都可隐藏,但需付出性能与复杂度代价:填充交易至标准长度可隐藏大小,但浪费带宽和链上空间;发送前增加延迟可隐藏时间,但增加延迟;通过Tor等匿名网络提交交易可隐藏IP地址,但带来新的挑战。
最难隐藏的元数据是交易费用信息。加密费用数据会给区块构建者带来三方面问题:首先是垃圾信息问题,若交易费用数据被加密,任何人可广播格式错误的加密交易,这些交易虽会被排序但无法支付费用,解密后无法执行却无人能被追责;其次是区块构建与费用拍卖效率问题,加密费用数据会破坏这一过程;最后是安全加密内存池会从多方面增加系统开销:加密增加链延迟、计算量和带宽消耗;难以与分片或并行执行等未来目标结合;可能为活性引入新的故障点;设计与实现复杂度显著上升。
加密内存池的经济挑战
与技术挑战不同,经济挑战属于根本性限制,解决难度极大。MEV的核心问题源于交易创建者与MEV机会挖掘者之间的信息不对称。用户通常不清楚自身交易中蕴含多少可提取价值,即便存在完美的加密内存池,仍可能被诱导泄露解密密钥换取低于实际MEV价值的报酬,这种现象称为「激励性解密」。
类似场景在现实已存在,例如MEV Share机制。该机制允许用户选择性地向池中提交交易信息,搜索者通过竞争获取利用MEV机会的权利。中标者在提取MEV后,将部分收益返还给用户。这种模式可直接适配加密内存池:用户需披露解密密钥才能参与。但多数用户意识不到参与的机会成本,只看到眼前回报便乐于泄露信息。传统金融中也有类似案例,如零佣金交易平台Robinhood,其盈利模式正是通过「订单流支付」向第三方出售用户订单流。
另一种可能的场景是大型构建者以审查为由强制用户披露交易内容。抗审查性是Web3领域重要且具争议的话题,但如果大型验证者或构建者受法律约束(如OFAC规定)需执行审查清单,可能会拒绝处理任何加密交易。技术上有可能通过零知识证明证实加密交易符合审查要求,但这会增加额外成本与复杂度。即便区块链具备强抗审查性,构建者仍可能优先将已知明文的交易置于区块前端,而将加密交易排在末尾。因此,需要确保执行优先级的交易,最终可能还是被迫向构建者披露内容。
其他效率挑战
加密内存池会通过多种明显方式增加系统开销:用户需加密交易,系统需解密,增加计算成本和交易体积;处理元数据进一步加剧开销。还有一些效率成本并不那么显而易见。
金融领域若价格能反映所有可用信息,市场便被视为有效;而延迟与信息不对称会导致市场低效。加密内存池带来的必然结果是价格不确定性增加,导致交易失败并浪费链上空间。这种价格不确定性还可能催生投机性MEV交易,这类交易试图从链上套利中获利。加密内存池可能会让这类机会更为普遍:由于执行延迟,DEX的当前状态变得更加模糊,可能导致市场效率下降,不同交易平台间出现价格差异。此类投机性MEV交易也会浪费区块空间,因为一旦未发现套利机会,它们往往会终止执行。
总结
本文旨在梳理加密内存池面临的挑战,为社区转向其他解决方案的研发提供参考,但加密内存池仍可能成为MEV治理方案的一部分。可行的思路是混合设计:部分交易通过加密内存池实现「盲排序」,另一部分采用其他排序方案。对于特定类型交易(如大型市场参与者的买卖订单),混合设计可能是合适选择;对于高度敏感交易(如针对存在漏洞的安全合约的修复交易),这种设计也具有实际意义。
然而,由于技术局限、高昂的工程复杂度和性能开销,加密内存池不太可能成为人们期待的「MEV万能解决方案」。社区需要开发其他方案,包括MEV拍卖、应用层防御机制和缩短最终确认时间等。MEV在未来一段时间内仍将是一项挑战,需要通过深入研究找到各类解决方案的平衡点,以应对其负面影响。