测度论的灵魂：可加分解与 Littlewood 三原则

引子：长度，为什么需要重做一遍？

从中学的"长度、面积、体积"到大学的"积分"，我们一直在做同一件事——给一个集合赋一个数。一旦集合不再是漂亮的区间或矩形，黎曼积分就开始捉襟见肘：振荡剧烈的函数无法被它驯服，序列极限与积分次序无法自由交换，"逐点收敛"和"积分收敛"几乎从不站在同一边。

但更深的问题不在"算不算得出"，而在"我们对长度的直觉，能否一致地推广到所有集合"。结论令人不安：

不能。在选择公理下可以构造一个集合，它无法被赋予任何"平移不变、可数可加"的长度。

这件事一旦看清，整个问题就被翻面了——不是"如何把长度推广到所有集合"，而是"哪些集合允许进入长度的游戏，并且要付出什么代价"。测度论的诞生不是为了"算更复杂的积分"，而是为了把"长度"这件事重做一遍——做得足够强壮，强壮到能扛住极限。

这件事一旦做对，回报巨大：

极限与积分号几乎可以自由交换（MCT / Fatou / DCT）；
函数空间
是 Banach 空间，傅里叶分析、PDE、调和分析才有立足之地；
概率论被 Kolmogorov 安放在测度论上：事件 = 可测集，期望 = 积分，条件期望 = Radon–Nikodym 导数；
同一套"分解—合并"哲学，向上覆盖 Hausdorff 测度、Radon 测度、几何测度论、随机过程。

但通往这一切回报的入口却异常朴素。整套理论的灵魂只有一句口诀：

分了再合，量不变；杂质可小，故可忽略。

一、最本质的见解：可加性是测度的灵魂

抛开 σ-代数、外测度、Carathéodory 切割这些技术外壳，测度论的核心其实只有一句话：

在一族"可以分、可以合"的集合上，赋予一个数，使得「分了再合，量不变」。

形式上：测度 $\mu$ 在 σ-代数 $\mathcal{M}$ 上满足三条公理：非负、空集为零、可数可加：

\mu(E)\ge 0,\quad \mu(\varnothing)=0,\quad \mu\!\Big(\bigcup_{n\ge 1} E_n\Big)=\sum_{n\ge 1}\mu(E_n)\ \ (\{E_n\}\text{ 两两不交}).

图 1：可数可加性。把 E 切成两两不交的可数块，每块各取测度，再相加——结果与切法无关，永远等于 μ(E)。

三条公理里，真正承担全部重量的是"可数可加"。"有限可加"是初等几何就有的常识；"可数可加"才是分析学的飞跃：它让我们可以把一个复杂集合拆成可数个简单块，分别度量，再加回来——这是后续一切收敛定理、Fubini、Radon–Nikodym 的支点。

由可数可加性立刻可推出"测度的连续性"，它和 σ-加性是同一件事的另一面：

E_n\uparrow E\ \Rightarrow\ \mu(E_n)\to\mu(E),\qquad E_n\downarrow E,\ \mu(E_1)<\infty\ \Rightarrow\ \mu(E_n)\to\mu(E).

"测度对集合极限连续"——后面所有"换序定理"，本质都是这条连续性在不同对象（集合、函数、积分）上的复读。

二、为什么必须是"可数"可加？三档可加性的本质权衡

很多人初学时会问：可加性可以是有限可加，可以是可数可加，理论上还可以是任意（不可数）可加——为什么数学家偏偏选了中间那档？这不是品味问题，三档各自对应着完全不同的结构能力：

2.1 任意可加性：太奢侈，立刻矛盾

设想我们要求"任何不交集族 $\{E_\alpha\}_{\alpha\in I}$ ， $I$ 任意势"都满足

\mu\Big(\bigsqcup_{\alpha\in I} E_\alpha\Big)=\sum_{\alpha\in I}\mu(E_\alpha).

把 $[0,1]$ 写成可数个单点 $\{x\}$ 的并是不行的——因为 $[0,1]$ 不可数。但 $[0,1]=\bigsqcup_{x\in[0,1]}\{x\}$ ，按"任意可加"必须有

1=\mu([0,1])=\sum_{x\in[0,1]}\mu(\{x\})=\sum_{x\in[0,1]} 0 = 0,

立即矛盾。「任意可加性」一旦遇到不可数指标集就崩溃——所以这条路走不通。

2.2 有限可加性：太朴素，抓不住极限

反过来如果只要求"有限不交族可加"，长度是可以给所有集合定义的（用 Banach–Tarski 那条线索就能造出）。但这套理论无法刻画"逼近"：把圆切成有限多个直线段，长度永远是有限多段长度的和，但圆周是极限意义下的一个集合，有限可加抓不到这件事。

更尖锐的反例：考虑 $[0,1]$ 上有理数集 $\mathbb{Q}\cap[0,1]$ 。它是可数个单点的并，每个单点测度 $0$ ，按可数可加性它的测度必须是 $0$ 。如果只许有限可加， $\mathbb{Q}\cap[0,1]$ 完全可以被赋予一个非零的"奇怪长度"——这种自由度反而让积分和极限失去关系。

2.3 可数可加性：恰好是"分析学的甜蜜点"

可数可加性既不像"任意可加"那样自我崩塌，又恰好覆盖了实分析中所有"逼近"动作：因为分析学里所有的极限、所有的级数、所有的展开，都是可数过程。

更深一层的理由：欧拉以来的分析学一直建立在级数 $\sum_{n\ge 1} a_n$ 之上。可数可加性正是"测度自身也能被级数表达"——它让"集合的测度"和"实数的级数"成为同一件事的两面。测度论之所以叫"测度论"，本质是它把分析学最钟爱的对象（级数）搬到了集合代数上。

一旦确立可数可加，所有"分解—合并"的实战手法都来自这一颗心：

外测度：
用可数个开区间覆盖目标，再取下确界——把"覆盖" σ-加起来。
Carathéodory 切割：
用任意探针把集合切成内、外两半，要求
始终成立。
简单函数积分：
把
在值域分层，
。
MCT / Fatou / DCT：
把"函数序列控制"翻译成"集合可数可加性"。
Fubini：
把矩形
拆成
-切片，再用
的可加性合回去。
Radon–Nikodym：
把
在
上做"密度分层"，再积出密度
。

所有"魔法"都在这一句口诀里：可分可合，量不变。一旦丢掉可数可加（比如允许 Banach–Tarski 那样把球切成可数块再拼出两个球），整个大厦就会塌掉——这也是为什么 σ-代数必须存在：它就是"允许做可数次分合的那族集合"。

三、为什么不能给所有集合定义长度？——Vitali 不可测集

让我们直接面对这件事：在 $[0,1]$ 上，没有任何定义在 $2^{[0,1]}$ 上的函数 $\mu$ 能同时满足：

非负、可数可加；
对
内的有理平移
不变；
。

Vitali 的构造：在 $[0,1]$ 上引入等价关系 $x\sim y \iff x-y\in\mathbb{Q}$ 。每个等价类都是可数集；类与类之间不交；它们的并是 $[0,1]$ 。用选择公理从每个等价类挑一个代表，得到代表集 $V\subset[0,1]$ 。然后

[0,1]\subset \bigsqcup_{q\in\mathbb{Q}\cap[-1,1]} (V+q)\subset [-1,2],

右侧是可数个 $V$ 的有理平移之并，两两不交。若 $V$ 可测，按平移不变与可数可加：

1\le \sum_{q\in\mathbb{Q}\cap[-1,1]}\mu(V+q)=\sum_q \mu(V)\le 3.

而 $\sum_q \mu(V)$ 只能是 $0$ （若 $\mu(V)=0$ ）或 $\infty$ （若 $\mu(V)>0$ ），怎样都装不进 $[1,3]$ 。矛盾。

这条反证背后的"三选二"框架： 「定义在所有集合上」+「平移不变」+「可数可加」三者不可兼得。
测度论的选择是：放弃"定义在所有集合上"——保留平移不变与可数可加，把"参与游戏"的集合限制到一个 σ-代数内。

这条选择决定了测度论的整个面貌：σ-代数不是技术细节，而是"愿意参加可数次分合游戏的入场资格"。

四、σ-代数：可加运算的舞台，以及"为什么必须是 σ"

"可数可加"要有意义，被加的集合必须先本身就在我们的族里。这就要求承载测度的集合族 $\mathcal{M}\subset 2^X$ 自身满足：

；
对补封闭：
；
对可数并封闭：
。

由 De Morgan 立刻得到对可数交也封闭。这就是 σ-代数。

为什么必须是"σ"而不是"代数"？因为分析学的所有动作——级数、单调极限、上下极限、几乎处处——都是可数过程。如果只要求有限并封闭，那么

\bigcup_{n\ge 1}\Big[a-\tfrac{1}{n},\,a+\tfrac{1}{n}\Big]=\{a\}

这种"用区间列逼近一个单点"的动作就跑出了集合族。可数并封闭 ↔ 极限封闭，σ 这个字头不是装饰，它是"让分析学能在测度上落地"的最小条件。

在 $\mathbb{R}^n$ 上，由所有开集生成的最小 σ-代数叫 Borel σ-代数 $\mathcal{B}(\mathbb{R}^n)$ 。它已足够刻画一切"日常分析"中能遇到的集合。把它对 Lebesgue 零测集补全（completion），就得到 Lebesgue 可测集——这步补全保证了"零测集的子集也零测"，让"几乎处处"成为干净的概念。

五、外测度 + Carathéodory：为什么走这条诡异的路？

面对"哪些集合可测"这个问题，最自然的想法是：先给每个集合一个"近似长度"（外测度），再筛出哪些近似是真的可加。Lebesgue 外测度的定义只用了一行——用开区间覆盖再取下确界：

\mu^*(E)=\inf\!\left\{\sum_{n\ge 1}\ell(I_n)\ :\ E\subset\bigcup_n I_n,\ I_n\text{ 是开区间}\right\}.

这定义有两个性质让它对，但不够好：

在
上对所有集合都有定义；
但它只是
可数次可加
的：
；不一定相等。

Carathéodory 的天才一笔，是用一个看似"过强"的条件把"等号"恢复回来：

称 $E$ 是 Carathéodory 可测，若对任意 $A\subset\mathbb{R}$ ：

\mu^*(A)=\mu^*(A\cap E)+\mu^*(A\setminus E).

图 2：Carathéodory 切割。任取一把"探针" A 把 E 切成内 (A∩E) 与外 (A∖E)，两边外测度的和必须严格等于 A 的外测度。可测 = 可被任意探针切而无信息损失。

为什么这条切割条件正好是"可测"的本质？本质是一个朴素而深刻的函数性原则：

分解的结果不能依赖切法。无论你用什么探针 A 去检验，"E 把 A 切开"的两块外测度之和必须正好等于 A 自身的外测度——否则就说明在 E 的边界上"信息泄漏"了，无法把 σ-加性建立起来。

这一条件天然满足两件事：（1）它把"对哪些 A 都对"作为一致性，强迫 E 在每个测试场景下都自洽；（2）它给出的可测集族自动构成 σ-代数，无需手工验证可数并封闭。

Carathéodory 主定理：所有 Carathéodory 可测集构成 σ-代数 $\mathcal{M}$ ，且 $\mu^*\big|_{\mathcal{M}}$ 是完备测度。这是一个"用一行条件换出整套结构"的范式，后来被搬到 Hausdorff 测度、Radon 测度、概率测度的拓扑构造里反复复用。

六、可测函数：为什么用"原像"定义？

$f:X\to\mathbb{R}$ 称为可测，若对任意 $\alpha\in\mathbb{R}$ ：

\{x\in X\ :\ f(x)>\alpha\}\in\mathcal{M}.

表面看这只是一个技术定义，深层却揭示了测度论看待函数的根本视角——

测度论不在乎函数本身的样子，只在乎它的"等高线集"是否可测。一旦每条等高线 $\{f>\alpha\}$ 都属于游戏内的集合族，就能把"积分"还原为"集合的测度的线性组合"——而后者正是测度自己最擅长的运算。

这等价于" $f$ 把 Borel 集拉回到 $\mathcal{M}$ "——即可测函数 = 结构保持映射。可测函数对 $+,\cdot,\sup,\inf,\liminf,\limsup$ 都封闭，这正是它能与极限和谐共处的根源。

结构定理（极重要）：每个非负可测函数都是简单函数的递增极限——

\exists\ s_n=\sum_{k=1}^{N_n}a_{n,k}\,\mathbf{1}_{E_{n,k}},\quad s_n\nearrow f.

简单函数 = 取有限个值的可测函数。这条定理把所有可测函数规约到"对集合做加权计数"——这正是 Lebesgue 积分能优雅定义的支点。"先简单 → 后非负 → 再一般"这套台阶化的建构，让每一步都只动用最基础的可加运算。

七、Lebesgue 积分：为什么"值域切片"胜过"定义域切片"？

黎曼积分把定义域切片；Lebesgue 积分把值域切片。这一点点交换，使得它对极限稳健得多。

图 3：黎曼把"宽度 × 高度"中的宽度当作基本量；Lebesgue 把"高度 × 测度"中的测度当作基本量。换序后函数振荡再剧烈，每一层 {f > a} 仍是一个可测集，可加性立刻把估计粘起来。

三步建构：

简单函数：
，其中
。
非负可测函数：
。
一般可测函数：
拆
，分别积分；称
可积
当且仅当
。

为什么换序这一下值千金？因为黎曼的"竖条估计"对函数的振荡极敏感——上和下和差距随振荡爆炸；而 Lebesgue 的"水平层估计"只关心 $\{f>a\}$ 的测度，振荡再剧烈也不影响每层的测度。这正是把"函数的复杂度"转嫁给"集合的测度"，而集合的可加性是我们已经驯服了的。

八、三大收敛定理：把"逐点收敛"翻译成"积分收敛"

测度论真正的"杀手锏"是这三条互相兜底的换序定理。它们的共同骨架是：把对函数序列的控制翻译成对集合可数可加性的控制。

8.1 单调收敛定理（Beppo Levi, MCT）

若 $0\le f_n\nearrow f$ 几乎处处，则

\int f_n\,d\mu\ \nearrow\ \int f\,d\mu.

为什么成立："非负 + 单调"意味着质量只会从下往上累积，每一片新增的"夹层"是非负可测集，σ-加性把"夹层们"合起来正好等于 $\int f-\int f_n$ 。

8.2 Fatou 引理

对任意非负可测 $\{f_n\}$ ：

\int \liminf_{n\to\infty} f_n\,d\mu\ \le\ \liminf_{n\to\infty}\int f_n\,d\mu.

它说的是"质量只会跑掉，不会凭空冒出"——典型例子是"行进的方块" $\mathbf{1}_{[n,n+1]}$ ：每个的积分都是 1，但 $\liminf$ 处处为 0，于是 $0\le 1$ ，质量"跑到了无穷远"。Fatou 是控制收敛的脚手架。

8.3 控制收敛定理（Lebesgue, DCT）

若 $f_n\to f$ 几乎处处，且存在可积 $g\ge 0$ 使 $|f_n|\le g$ 对所有 $n$ 成立，则 $f$ 可积且

\lim_{n\to\infty}\int f_n\,d\mu=\int f\,d\mu,\qquad \int |f_n-f|\,d\mu\to 0.

为什么"被一个伞罩住"就能保证换序？ $g$ 把所有 $f_n$ 的"逃逸路径"全部封死——质量再想跑也跑不过 $g$ 这把伞。这是"一致可积性"的初等版本，它把"逐点收敛"在积分意义下提升到了"一致控制"的水平。

三者关系一句话：

MCT（单调）⊕ Fatou（非负）⊕ DCT（可积控制）—— 把"逐点收敛"在三类典型场景下都翻译成"积分收敛"。

九、几乎处处 / 依测度 / Lᵖ 收敛：三种"变近"

有了积分，函数序列"靠近"的方式就不止一种。先把定义放在一处对照：

几乎处处收敛 (a.e.)：
。
依测度收敛 (in measure)：
对任意
，
。
$L^p$ 收敛：
。

图 4：三种收敛的关系网。"依测度收敛"是最弱的容器，a.e. 与 Lᵖ 是它的两条"加强支线"，Egorov / Vitali 把它们粘起来。

典型反例："行进的方块" $\mathbf{1}_{[k/2^n,\,(k+1)/2^n]}$ 依测度收敛到 $0$ ，但在每点都不收敛。Egorov 定理把"a.e. 收敛"修补成"在 ε-坏集外的一致收敛"，把这张关系网粘起来。

十、Littlewood 三原则：把抽象拉回直觉

J. E. Littlewood 在《Lectures on the Theory of Functions》里给出过一段被反复引用的"教学心法"：

「实变函数论的整个理论可以被三条朴素的原则总结：
每个可测集差不多就是有限个区间的并；
每个可测函数差不多就是连续函数；
每个逐点收敛的可测函数列差不多就是一致收敛。
这里的"差不多"，意思是"在一个测度任意小的例外集之外"。」

图 5：三原则的统一构图——"分出一个测度任意小的杂质，剩下部分回归友好对象"。这就是测度论"分了再合"在三个不同对象（集合、函数、函数列）上的复读。

10.1 第一原则：可测集 ≈ 有限区间的并（外正则性）

设 $E\subset\mathbb{R}$ 可测且 $\mu(E)<\infty$ ，则对任意 $\varepsilon>0$ 存在有限个开区间 $I_1,\dots,I_n$ 使得

\mu\!\left(E\,\triangle\,(I_1\cup\cdots\cup I_n)\right)<\varepsilon.

$\triangle$ 是对称差。意义："可测"并不是某种外星属性，它只是允许你在一个 $\varepsilon$ -小的"杂质集"之外，把集合写成区间的并。而区间又恰好是"可加性最容易验证"的对象。

10.2 第二原则：可测函数 ≈ 连续函数（Lusin 定理）

设 $f:E\to\mathbb{R}$ 可测且 $\mu(E)<\infty$ ，则对任意 $\varepsilon>0$ ，存在闭子集 $F\subset E$ 使得

\mu(E\setminus F)<\varepsilon,\qquad f\big|_F\ \text{连续}.

换句话说，可测函数只是"在测度任意小的坏集之外是连续函数"。

10.3 第三原则：逐点收敛 ≈ 一致收敛（Egorov 定理）

设 $\mu(E)<\infty$ ， $f_n\to f$ 几乎处处收敛，则对任意 $\varepsilon>0$ 存在 $F\subset E$ 使

\mu(E\setminus F)<\varepsilon,\qquad f_n\rightrightarrows f\ \text{在 }F\text{ 上}.

三原则的"形而上"统一："差不多就是 X"等价于"在 ε-小杂质外就是 X"——而 ε 可以任意小，所以差异部分对所有积分类不等式都不构成实质障碍。这正是 σ-加性 + "几乎处处"两个原子结合后的标准工作模式。

十一、Lᵖ 空间：为什么是 Banach 而不是只 Cauchy？

定义：

\|f\|_p=\Big(\int|f|^p\,d\mu\Big)^{1/p},\quad 1\le p<\infty;\qquad \|f\|_\infty=\operatorname*{ess\,sup}|f|.

$L^p(\mu)$ 是把所有 $\|\cdot\|_p$ 有限的可测函数模掉"几乎处处相等"得到的赋范空间。三条骨干不等式：

Hölder：
。
Minkowski：
。
Jensen：
对凸
与概率测度
，
。

Riesz–Fischer 完备性。 $L^p$ 在 $\|\cdot\|_p$ 下是 Banach 空间； $L^2$ 还是 Hilbert 空间。

为什么"完备"是 Lᵖ 的灵魂？分析学的所有"存在性证明"都依赖一招：构造一个 Cauchy 列，然后说"它必收敛于一个对象"。如果空间不完备（Cauchy 列不一定收敛），所有这类构造立刻报废。黎曼可积函数族在 L¹ 范数下不完备——可以构造一列黎曼可积函数 Cauchy 收敛到一个非黎曼可积函数。这正是黎曼积分必须被 Lebesgue 取代的根本原因：不是为了算更多积分，而是为了让函数空间能做极限。

十二、Fubini–Tonelli：为什么需要 σ-有限？

设 $(X,\mu)$ 与 $(Y,\nu)$ 都是 $\sigma$ -有限测度空间， $\mu\otimes\nu$ 为乘积测度。

Tonelli
（非负）：对任意非负可测
，
。
Fubini
（可积）：若
，上式照样成立。

为什么必须 σ-有限？因为构造乘积测度 $\mu\otimes\nu$ 时，要用到"把 X 写成可数个有限测度块的并"——这正是 σ-有限的定义。没有 σ-有限就有反例：X = [0,1] 配 Lebesgue 测度，Y = [0,1] 配计数测度，f = 𝟙{对角线}。两边的累次积分一个等于 0、一个等于 1，结果不相等。σ-有限是"测度可拆"的最低要求，也是"积分次序可换"的代价。

十三、Radon–Nikodym：为什么这是测度的"导数"？

设 $\mu,\nu$ 是 $(X,\mathcal{M})$ 上 $\sigma$ -有限测度。绝对连续性：

\nu\ll\mu\ \iff\ \mu(E)=0\Rightarrow \nu(E)=0.

Radon–Nikodym 定理。若 $\nu\ll\mu$ ，则存在唯一（差几乎处处）的非负可测函数 $f=\dfrac{d\nu}{d\mu}$ 使得

\nu(E)=\int_E f\,d\mu,\qquad \forall E\in\mathcal{M}.

这为什么是"导数"？把 $\nu$ 看作"加权测量"，把 $\mu$ 看作"基准测量"，那 $\frac{d\nu}{d\mu}(x)$ 就是"在点 $x$ 附近， $\nu$ 比 $\mu$ 多重多少"的瞬时密度。它是分布函数 $F'(x)$ 的抽象镜像——只是把"求导"从"差商极限"升级成"在每个可测块上做积分一致"。
为什么必须 ν ≪ μ？反过来如果 $\nu$ 在某个 $\mu$ -零测集 $N$ 上有质量，那密度 $f$ 必须在 $N$ 上"无穷大"——可这种"无穷大密度但有限积分"的对象不在函数范畴内，它只能用奇异测度表达。这正是下面要拆出的"奇异部分"。

Lebesgue 分解定理。任意 $\sigma$ -有限的 $\nu$ 都能唯一写成

\nu=\nu_{ac}+\nu_{s},\qquad \nu_{ac}\ll\mu,\ \ \nu_s\perp\mu.

"绝对连续部分 + 奇异部分"——这正是分布函数有可微部分 + 阶跃 + Cantor 型奇异的抽象镜像。Radon–Nikodym 处理 ac 部分；奇异部分留给 $\delta$ -质量、Cantor 测度这种"非密度"的对象。

十四、把一切收回到一句话

三大收敛定理、Lᵖ、Fubini、Radon–Nikodym 看似各自独立，骨子里都是同一种"几乎"哲学：

抽象对象 = 简单对象 + 一个测度任意小的"杂质"。

而"任意小"恰好可以套上 σ-加性这把锤子：把无穷多个 $\varepsilon/2^n$ 的杂质加起来，仍然是一个 $\varepsilon$ 。Littlewood 的"差不多"，本质上就是可数可加性在工作中的另一副面孔。

于是测度论的核心原理可以被压缩到一行：

在一个允许"可数次分合而量不变"的集类上，把复杂对象分解成简单对象与一个 $\varepsilon$ -小杂质，再把估计 σ-相加合回来——这就是测度论的一切。

十五、为什么这件事重要

积分被驯服：
极限与积分号几乎可以自由交换（DCT/MCT/Fatou）。
函数空间变得完备：
是 Banach 空间，傅里叶分析、PDE、调和分析才有了立足之地。
概率有了严格地基：
Kolmogorov 把概率论建立在测度论上。事件 = 可测集，期望 = 积分，条件期望 = Radon–Nikodym 导数，独立性 = 乘积测度。
信息论的支柱：
Shannon 熵 =
；KL 散度 =
——后者本质就是 Radon–Nikodym 导数的对数积分。
抽象延展：
从 Lebesgue 测度推广到任意 σ-有限测度、Hausdorff 测度、Radon 测度——同一套"分解—合并"哲学，覆盖几何测度论、动力系统、随机过程。

结语

测度论很容易被讲得像一份冷冰冰的公理表：σ-代数、外测度、Carathéodory、可测函数、积分、收敛、Lᵖ、Fubini、Radon–Nikodym……一层套一层，让人看不见骨架。

但真正的骨架其实很简单——

承认"可数次分解再合并量不变"，再用 Littlewood 的三条"差不多"把可测集、可测函数、可测函数列各拉回到区间、连续函数、一致收敛——其余的全部定理，几乎都是这个骨架上的肌肉。

更深一层：测度论之所以非要走"σ-代数 + 外测度 + Carathéodory + 几乎处处"这样一条迂回路，并非数学家的怪癖，而是因为 Vitali 早就证明了"长度不可能定义在所有集合上"。所以整个理论的姿态从一开始就是谦卑的——不奢望覆盖所有集合，只把愿意参与可数次分合游戏的集合圈出来，在这片可控领域里建造一座足以承担分析、概率、信息、几何的大教堂。

当你下次再看到 DCT、Fubini 或 Radon–Nikodym 时，不妨在脑中默念那句话：

「分了再合，量不变；杂质可小，故可忽略。」

——这就是测度论。