一个正在进行的 Isabelle 研究项目：Submodular Greedy 的形式化

HazezZ · 2025年12月29日 · 约 4 分钟

在上一篇文章《我的第一个 Isabelle 形式化证明》中，我更多写的是我为什么选择 Isabelle，以及形式化证明对我而言意味着什么。这篇文章我想更具体地记录一个正在进行中的研究项目，单调子模函数下贪心算法的 (1−1/e) 近似保证的 Isabelle 形式化。

这不是一个已经完成的成果展示而是一份阶段性的研究记录。

在组合优化中，单调子模函数的最大化问题有一个非常经典的结论：在基数约束下，简单的贪心算法可以达到 1 − 1/e 的近似比。

这个结果通常被称为 Nemhauser–Wolsey 定理，在机器学习、信息论、覆盖问题等领域被反复使用。

在纸笔证明中，这个结论往往以一种高度抽象和依赖直觉的方式出现，比如平均化论证、边际增益、递推不等式……但这些看似自然的步骤其实隐含了大量未被显式陈述的结构性假设。

这个项目的目标并不是重新发明这个定理，而是尝试回答一个更基础的问题：如果把这个证明完整地交给 Isabelle，它究竟需要我们说清楚哪些事情？

我将目前的 Isabelle 形式化拆分为两个主要部分，对应两个核心文件：

Greedy_Submodular_Construct.thy这一部分负责算法与结构本身：
- 贪心序列的形式化定义
- 边际增益的抽象
- 贪心过程中保持的不变量
在这一层，避免了引入任何近似结论，只关注这个算法在 Isabelle 中到底是什么。
Greedy_Submodular_Approx.thy这一部分负责近似分析：
- 平均化论证的形式化版本
- gap recurrence 的建立
- Nemhauser–Wolsey (1−1/e) 界的推导

这样的拆分并不是为了代码整洁而是为了让证明结构在形式化中保持可复用性，因为构造与分析是两个不同层次的问题。

在数学直觉中，很多推理可以一句话完成，而在 Isabelle 中，每一步都必须被拆解为可验证的逻辑关系。

在这个过程中，我逐渐意识到几件事：

形式化并不是在“刁难”证明者，而是在迫使我们诚实地面对：哪些结论是由结构推出的，哪些只是我们习惯性地相信它成立。

这是一个进行中的研究项目。

目前已经完成的部分包括：

仍在推进和调整的部分包括：

在接下来的阶段，我计划：

这个项目更像是一条正在延展的研究路径，而不是一次性的证明任务。

该项目的 GitHub 仓库在这里（持续更新中）：

继续浏览

总览研究项目笔记