第一章: 极限

提示

微积分是大学数学的核心内容, 是人工智能的基础之一, 学好它对我们以后的学习和成长有非常大的好处.

微积分的研究对象是函数. 我们中学已经学过函数的概念, 下面我们来复习和巩固一下.

1.1 集合与映射

1.1.1 集合

提示

集合是数学研究从具体到抽象的第一步. 当我们用数学语言来描述世界时, 首先要把我们感兴趣的对象给拿出来, 进行适当的抽象, 然后再研究它们的规律. 集合就是数学中用来界定对象的一个概念.

集合举例

自然数集 — \mathbb{N} = \left\{0, 1, 2, 3, \cdots \right\}
实数集 — \mathbb{R} = \left\{x: -\infty < x < \infty \right\}
满足不等式 x-3<10 的所有实数 x — A=\left \{x < 7\right \}

集合的概念

我们把所要研究的对象统称为元素 (element), 这些元素所组成的总体叫做集合 (set). 一般用大写字母如 A, B, C 表示集合, 用小写字母如 x 或 a, b, c 来表示集合中的元素.

如果 x 是集合 A 的元素, 就说 x 属于集合 A , 记作 x\in A ;
如果 x 不是集合 A 中的元素, 就说 x 不属于 集合 A, 记作 x \notin A.
不包含任何元素的集合叫做空集 (emptyset), 记为 \varnothing.

上机实验

计算机图像处理中经常会用到掩码 (mask) 的概念. 掩码本质上就是一个集合.

set_mask.ipynb: 图像掩码操作.

两个集合间的包含关系

如果集合 A 中任意一个元素都是集合 B 中的元素, 则称 A 包含于 B (或 B 包含A), 记作 A\subseteq B 或 B\supseteq A, 此时称 A 为 B 的子集 (subset). 空集是任何集合的子集

集合相等: 如果 A\subseteq B, 同时 B\subseteq A, 则集合 A, B 中的元素是完全一样的, 此时我们说集合 A 等于集合 B, 记作A=B.

集合之间的运算

交集

所有既属于 A 又属于 B 的元素组成的集合称为 A 与 B 的交集 (intersection set), 记作 A\cap B (读作“A 交 B”), 即

A\cap B=\left \{ x: x\in A \ \mathrm{and} \ x\in B \right \}

下图展示了交集运算:

并集

所有属于集合 A 或属于集合 B 的元素组成的集合, 称为集合 A 与 B 的并集 (union set), 记作 A\cup B (读作“ A 并 B ”), 即

A\cup B=\left \{ x: x\in A \ \mathrm{or} \ x\in B \right \}

下图展示了并集运算:

补集

如果集合 A 是集合 B 的子集, 则 B 中不属于 A 的所有元素构成的集合称为 A 相对于 B 的补集 (complementary set), 记作 C_BA 或 A^C, 即

\bar{A} = C_B A = \{x \in B: \ x\notin A\}

下图展示了补集运算:

上机实验

set_iou.ipynb: 交并比介绍.

1.1.2 映射

提示

集合的概念是为了给映射做铺垫, 映射建立了集合与集合之间的关联.

映射的定义

映射 (map) 描述了从一个集合到另一个集合的某种对映关系. 设 A, B 是两个集合, 如果存在一个对映关系 f, 使得集合 A 中的每个元素都唯一的对映到 B 中的一个元素, 则称 f 为从 A 到 B 的映射, 记作 f: A \rightarrow B

映射 f 把集合 A 中的元素 a 对映到 B 中的元素 b, 可记作 f(a) = b 此时 b 称为 a 的象, a 称为 b 的原象.

映射可以通过下面的图像来理解:

图中箭头表示了集合 A 中元素与集合 B 中元素的对映关系.

根据定义, 映射需要满足两个要求: 随处取值, 唯一对映.

随处取值是指 A 中的任何一个元素在 B 中都有对映.
唯一对映是指 f 可以把 A 中的不同元素映射到 B 中的同一个元素, 但不能把 A 中的一个元素映射到 B 中的多个元素.

映射的性质

单射：如果 A 中的每个元素都对映 B 中的不同元素, 则称 f 为单射.
满射：如果 B 中的每个元素都有原象, 则称 f 为满射.
一一映射：顾名思义, 一一映射就是集合 A 中元素与集合 B 中的元素一个对映一个. 可以证明, f 是一一映射等价于 f 既是单射又是满射.

逆映射

对于一一映射 f: A \rightarrow B, 把映射的象和原象反过来, 得到一个把集合 B 映射到集合 A 的新的映射, 称为逆映射, 记作 f^{-1}: B\rightarrow A.

映射的例子

映射的例子在我们的生活中随处可见, 例如：

名字：集合 A 是所有的人, 集合 B 是所有的名字. 每个人都有一个名字, 我们允许重名, 但不允许一个人有2个名字.
地图：没错, map 本身就是一个 map! (我们希望)这是一个从地图到真实世界的一一映射.
颜色：为什么我们能看到不同的颜色？颜色是一个从光波长到我们主观感受的映射.

从上面的例子可以感受到, 映射的作用在于把集合 A 中的元素作为输入信号, 例如不同的人、GPS坐标、光的波长等, 经过某种操作, 转换成我们关心的输出, 如名字、位置和颜色. 从这个意义上理解, 映射就是把输入 x 转化成 f(x) 的一个机器.

1.1.3 函数

映射与函数

函数是一种特殊的映射: 从数集 A 到数集 B 的映射 f:A \rightarrow B 称为函数 (function). 函数可写成 y = f(x) 的形式, 其中 x 称为自变量, y 称为 x 对映的函数值.

数列

数列是一类特殊的函数, 它把自然数集 \mathbb{N} 映射到实数集 \mathbb{R} 中, 这个函数可以记作 a(n), 不过更多的时候我们会把 n 作为下标, 以 a_n 表示数列的第 n 项, 并以 \{ a_n \} 表示整个数列.

等差数列

首项为 a_{1}, 公差为 d 的等差数列的通项公式为

a_{n} =a_{1} +(n-1)d

等差数列的前 n 项和为 \quad S_{n}=na_1+\frac{n(n-1)}{2}d

等比数列

首项为 a_{1} , 公比为 q 的等比数列的通项公式为 a_{n}=a_{1} q^{n-1}
等比数列的前 n 项和为 S_{n}=a_{1}\frac{1-q^n }{1-q} \quad (q\ne 1)

初等函数

幂函数: y=x^{\alpha}
指数函数: y=a^x, 特别的有 y=\mathrm{e}^x, 后者在 python 中有专门的函数 numpy.exp(x)
对数函数: y=\log_a x, 特别的有 y=\ln x, 后者在 python 中有专门的函数 numpy.log(x)
三角函数: y=\sin(x), y=\cos(x), y=\tan(x)
反三角函数: y = \mathrm{arcsin}(x)

其它常用函数

绝对值函数: y=|x|
符号函数 y=\mathrm{sgn}(x)=\left\{\begin{matrix} 1, & x>0& \\ 0, & x=0& \\ -1, & x<0& \end{matrix}\right.
Sigmoid函数 \sigma (x)=\frac{1}{1+e^{-x}}

反函数

反函数是逆映射的一个特例, 对于函数 f: x \rightarrow y (也要求 f 是一一映射), 其反函数为 f^{-1}: y \rightarrow x. 例如

y = 3x + 1 的反函数为 \displaystyle y = \frac{x - 1}{3}
y = \mathrm{e}^x 的反函数为 y = \mathrm{ln}x.

反函数本质上是把 x 和 y 的顺序对调了一下, 因此不难发现原函数与反函数的图像是关于直线 y = x 对称的.

复合函数

对于函数 f 和 g, 我们可以构造一个新的函数 y = f[g(x)], 它把自变量 x 通过函数 g 映射到 u = g(x), 再把 u 视作自变量 (也称为中间变量) 通过函数 f 映射到 y = f[g(x)]. 这个过程可以表示为:

x \stackrel{g}{\longrightarrow} u \stackrel{f}{\longrightarrow} y.

我们把这个新函数 y = f[g(x)] 称为函数 f 和 g 的复合函数, 记作 f \circ g. 注意函数复合是讲顺序的, 一般来说 f\circ g \ne g\circ f.

假设 f(x) = x + 2，g(x) = x^2，计算复合函数 f\circ g 和 g\circ f。

注意

计算机编程中的函数(function) 概念比数学中的函数要广, 它表示从输入 (可以是数、数组、函数等）到输出 (也可以是数、数组、函数等）的一系列操作.

深度学习与复合函数

人工智能中的核心技术为深度学习, 深度学习的背后其实就是有很多层 (从几十到几千层都有) 的神经网络 (Neuron Network). 神经网络的本质正是复合函数. 对于图中所示的神经网络, 从最左端的输入信号开始, 之后每一层都是上一层信号的复合, 因此神经网络就是一个复合了很多次的函数, 这个函数把输入 (比如一张图片) 映射到我们关心的结果 (比如图像是猫还是狗的概率).

上机实验

set_mnist.ipynb: 手写数字识别演示.

1.2 极限

提示

极限是微积分中的核心概念. 极限的出现代表了数学思想的一次转变, 而促成这一转变的动机来自于现实问题中对曲线相关问题的需求. 在初等数学中我们会计算矩形的周长和面积, 会计算三角形的周长和面积, 甚至是任意多边形的周长和面积, 但是, 这些都是由直线构成的结构, 而到了曲线大家就不会了. 曲线的长度怎么算? 由曲线构成区域的面积怎么算? 尽管我们初中就知道圆的周长是 2\pi r, 面积是 \pi r^2, 但是为什么是这样, 只有运用微积分才能给出严格的证明.

极限的概念很直观, 但经过数学的严格化后会变得非常抽象. 可以说极限的公理化是一道门槛, 是我们从中学的初等数学迈向大学的高等数学的必经之路. 要学好极限并不容易, 这里面涉及从有限到无穷的观念转变. 我们会发现这条路一开始会辗转反复, 让人晕头转向, 但是当你学完这门课程再回头来看, 会发现这么做是值得的, 数学概念的严格化其实不是在追求外表的精美, 而是让我们的内心变得更加的强大, 使我们有力量走得更远. 那么, 我们深呼吸一下, 一起敲开通向高等数学的大门吧.

1.2.1 数列极限

极限与圆的面积

圆的面积怎么算? 为了计算圆的面积, 我们构造了一系列圆的内接正多边形, 这些正多边形的面积是可以通过初等数学计算的, 我们把它们的面积记作 A_n, n = 1, 2, \cdots. 通过直觉我们能感受到, 当 n 趋于无穷大时, A_n 的面积会无限接近圆的面积. 接下来我们要做的就是把这个直觉通过数学语言给严格化.

上机实验

limit_array_circle.ipynb: 圆面积的极限.

重要

极限是一个动中取静的过程.

什么在动? 数列 \{ A_n \} 中的指标 n 在动.
什么是静? 圆面积是静, A_n 的取值会慢慢趋于稳定, 到最后几乎不变了, 数学上我们称这种行为叫收敛.

极限存在的例子

一尺之捶, 日取其半 (版本1)

站在棒子的角度, 这个过程可以用一个数列描述. n 代表天数, a_n 代表棒剩下的长度.

\begin{align*} a_0 &= 1, \\ a_1 &= \frac{1}{2}, \\ a_2 &= \frac{1}{4}, \\ & \cdots \\ a_n & = \frac{1}{2^n}, \\ & \cdots \end{align*}

随着 n 的增加 (动), a_n 的值不断靠近0 (静), 直觉告诉我们当 n 趋于无穷大时 a_n 的极限是0.

一尺之捶, 日取其半 (版本2)

站在砍棒人的角度, 这个过程也可以用一个数列描述. n 代表天数, b_n 代表到第 n 天为止所取的棒子的总数.

\begin{align*} b_0 &= 0, \\ b_1 &= \frac{1}{2}, \\ b_2 &= \frac{1}{2} + \frac{1}{4} = \frac{3}{4}, \\ & \cdots \\ b_n & = \frac{1}{2} + \frac{1}{4} + \cdots + \frac{1}{2^n} = 1 - \frac{1}{2^n}, \\ & \cdots \end{align*}

随着 n 的增加 (动), b_n 的值不断靠近1 (静), 直觉告诉我们当 n 趋于无穷大时 b_n 的极限是1.

P21 例1

a_n = \frac{n + (-1)^{n-1}}{n}

随着 n 的增加 (动), a_n 的值不断靠近1 (静), 直觉告诉我们当 n 趋于无穷大时 a_n 的极限是1.

P22 例2

a_n = \frac{(-1)^{n}}{(n+1)^2}, \\

随着 n 的增加 (动), a_n 的值不断靠近0 (静), 直觉告诉我们当 n 趋于无穷大时 a_n 的极限是0.

判断数列 a_n = (-1)^{n+1} = \{1, -1, 1, -1, \cdots\} 是否收敛，并说明理由。

a_n = (-1)^{n+1} 在 \pm 1 之间永久跳跃 — 不存在唯一的极限

判断数列 a_n = n = \{1, 2, 3, 4, \cdots\} 是否收敛，并说明理由。

重要

==数列极限的定义== (非常重要!!!)

设 \{a_n\} 为一数列, A 为一常数, 如果对于任意给定的正数 \varepsilon, 总存在正整数 N, 使得当 n>N 时有

|a_n - A| < \varepsilon,

则称 A 为数列 \{a_n\} 的极限, 记作 \lim_{n\rightarrow \infty} a_n = A.

定义背后的数学直觉: 所以数列 \{a_n\} 有极限就是, 当 n 足够大时, a_n 的值无限接近某个数 A. 上述定义把数列极限的直觉具象化了, 从而使得直觉变得可操作了. 根据定义, 我们现在可以严格的判断前面例子中数列的极限.

一尺之捶, 日取其半 (版本1)

直觉: \displaystyle a_n = \frac{1}{2^n} 的极限为0.

证明: 对于任意给定的 \varepsilon > 0, 要找到 N 使得 | \frac{1}{2^N} - 0 | = \frac{1}{2^N} < \varepsilon

取 \displaystyle N = \left[ \frac{-\mathrm{ln} \varepsilon}{\mathrm{ln} 2} \right] + 1, 可知当 n > N 时, 总有 |a_n - 0| < \varepsilon. 因此 \displaystyle \lim_{n \rightarrow \infty} a_n = 0.

一尺之捶, 日取其半 (版本2)

直觉: \displaystyle b_n = 1 - \frac{1}{2^n} 的极限为1.

证明: 对于任意给定的 \varepsilon > 0, 要找到 N 使得 |1 - \frac{1}{2^N} - 1| = \frac{1}{2^N} < \varepsilon

取 \displaystyle N = \left[ \frac{-\mathrm{ln} \varepsilon}{\mathrm{ln} 2} \right] + 1, 可知当 n > N 时, 总有 |b_n - 1| < \varepsilon. 因此 \displaystyle \lim_{n \rightarrow \infty} b_n = 1.

P21 例1

直觉: \displaystyle a_n = \frac{n + (-1)^{n-1}}{n} 的极限为1.

证明: 对于任意给定的 \varepsilon > 0, 要找到 N 使得 \left|\frac{n + (-1)^{n-1}}{n} - 1\right| = \frac{1}{n}< \varepsilon

取 $N = + 1 $, 可知当 n > N 时, 总有 |a_n - 1| < \varepsilon. 因此 \displaystyle \lim_{n \rightarrow \infty} a_n = 1.

P22 例2

直觉: \displaystyle a_n = \frac{(-1)^n}{(n+1)^2} 的极限为0.

证明: 对于任意给定的 \varepsilon > 0, 要找到 N 使得 \left| \frac{(-1)^n}{(n+1)^2} - 0\right| = \frac{1}{(n+1)^2}< \varepsilon

取 $N = $, 可知当 n > N 时, 总有 |a_n - 0| < \varepsilon. 因此 \displaystyle \lim_{n \rightarrow \infty} a_n = 0.

数列极限的几条性质 (了解, 不需要证明)

如果数列 a_n 有极限, 那么它的极限唯一.
如果数列 a_n 有极限, 那么数列 a_n 一定有界.
如果 \displaystyle \lim_{n\rightarrow \infty} a_n = A, 且 A > 0, 那么存在正整数 N, 当 n > N 时有 x_n > 0.
如果 \displaystyle \lim_{n\rightarrow \infty} a_n = A, 那么 a_n 的任一子数列的极限也是 A.
任意改变数列的有限多项, 不影响极限的收敛.

1.2.2 函数极限

提示

函数极限跟数列极限本质上都是极限, 都是动中取静, 只不过数列极限中动的是 n, 而函数极限中动的是自变量 x. 之前我们强调过函数图像的重要性, 函数的极限过程同样可以通过函数图像来理解. 下面这张图可以作为我们对函数极限的直觉, 图中展示了 \displaystyle \lim_{x\rightarrow 2} f(x) = 4, 请大家想想在这个极限过程中什么在动, 什么是静?

上机实验

两个函数极限的例子:

limit_fun_sin_over_x.ipynb
limit_fun_sin_1_x.ipynb

重要

==函数极限的定义== (非常重要!!!)

设函数 f(x) 在点 x_0 的某一去心邻域内有定义 ( 为了让 x 能够动起来), A 为一常数. 如果对于任意给定的正数 \varepsilon, 总存在正数 \delta, 使得当 0 < |x-x_0| < \delta 时有 |f(x) - A| < \varepsilon,

则称 A 为函数 f(x) 在 x_0 的极限, 记作 \lim_{x\rightarrow x_0} f(x) = A.

上述定义可以通过下图来理解

所以函数 f(x) 在 x\rightarrow x_0 时有极限就是, 当 x 足够接近 x_0 时, f(x) 的值无限接近某个数 A. 注意跟数列极限进行对比. 跟数列极限的定义一样, 上面关于函数极限的定义提供了一个可操作的流程, 能够将我们关于函数极限的直观具象化.

用 \varepsilon-\delta 语言证明 \displaystyle\lim_{x \to 2}(5x+1) = 11。

用 \varepsilon-\delta 语言证明 \displaystyle\lim_{x \to 1}(2x - 1) = 1。

用 \varepsilon-\delta 语言证明 \displaystyle\lim_{x \to 2}(x^2 + 1) = 5。

函数极限的性质

如果 \displaystyle \lim_{x\rightarrow x_0}f(x) 存在, 则极限唯一.
如果 \displaystyle \lim_{x\rightarrow x_0}f(x) = A, 则 f(x) 在 x_0 周围有界, 即存在 M >0 和 \delta > 0, 使得当 0< |x-x_0|<\delta 时 |f(x)| < M .
如果 \displaystyle \lim_{x\rightarrow x_0}f(x) = A > 0, 则 f(x) 在 x_0 周围一定大于0, 即存在 \delta > 0, 使得当 0< |x-x_0|<\delta 时 f(x) > 0.

\varepsilon-\delta 语言

本章的主要内容是数列极限和函数极限的定义, 在数学上我们也把这套定义极限的方法称为 \varepsilon-N 语言 (数列) 或 \varepsilon-\delta 语言 (函数). 这样的定义看似繁缛, 但只有这样才能把极限的本质说清楚. 初学者不要怕麻烦, 做题时应该一字一句的把极限的定义写清楚. 怕麻烦不想写字的同学, 在熟练掌握了极限的定义之后, 可以使用两个约定的缩写符号:

\forall: 对于任意
\exists: 存在

使用这两个符号, 数列极限和函数极限的定义可以写成下面的形式 (仅仅是少几个字而已).

数列极限的定义

\displaystyle \lim_{n\rightarrow \infty} a_n = A \iff \forall \varepsilon > 0, \exists N, s. t., \ |a_n - A| < \varepsilon if n > N.

函数极限的定义

\displaystyle \lim_{x\rightarrow x_0} f(x) = A \iff \forall \varepsilon > 0, \exists \delta, s. t., |f(x) - A| < \varepsilon if 0 < |x-x_0| < \delta.

对无穷大的描述

我们有时候会说一个数列或函数趋于无穷大, 也会写 \displaystyle \lim_{n\rightarrow \infty} a_n = \infty 或 \displaystyle \lim_{x\rightarrow x_0} f(x) = \infty, 请注意, 这只是一种习惯上的说法, 并不是真正意义上的 (有限的) 极限. 尽管如此, 我们可以借用类似 \varepsilon-N 语言的做法来从数学上定义什么叫趋于无穷大, 例如:

数列趋于无穷大

\displaystyle \lim_{n\rightarrow \infty} a_n = \infty \iff \forall M > 0, \exists N, s. t., |a_n| > M if n > N.

函数趋于无穷大

\displaystyle \lim_{x\rightarrow x_0} f(x) = \infty \iff \forall M > 0, \exists \delta, s. t., |f(x)| > M if 0 < |x-x_0| < \delta.

1.2.3 极限的运算

提示

这一讲我们主要关心如何计算极限.

对于一些简单的极限计算, 每次都用直觉和 \varepsilon-\delta 语言来计算极限太繁琐, 也没有必要. 很多时候极限的四则运算能够帮上大忙.
有一些困难的极限问题, 我们需要跟强大的数学结论和工具, 本讲介绍的三明治定理和单调有界数列有极限请收好.

注意, 本讲的性质和定理全部都建立在上一讲极限定义的基础之上, 其根本还是 \varepsilon-\delta 语言.

希尔伯特的旅店

极限运算涉及到了无限的概念, 对初学者来说这是一个之前从未踏足过的未知领域, 一些有限世界中的直觉将不再成立. 希尔伯特的旅店是一个有趣的故事, 通过这个故事希望能让大家对无限有一颗敬畏之心.

数列极限四则运算

加减法: 如果 \displaystyle \lim_{n\rightarrow \infty}a_n = A, \displaystyle \lim_{n\rightarrow \infty}b_n = B, 则 \displaystyle \lim_{n\rightarrow \infty}[a_n \pm b_n]= A \pm B.
乘法: 如果 \displaystyle \lim_{n\rightarrow \infty}a_n = A, \displaystyle \lim_{n\rightarrow \infty}b_n = B, 则 \displaystyle \lim_{n\rightarrow \infty}a_nb_n = AB.
除法: 如果 \displaystyle \lim_{n\rightarrow \infty}a_n= A, \displaystyle \lim_{n\rightarrow \infty}b_n = B, 且 B \ne 0, 则 \displaystyle \lim_{n\rightarrow \infty}\frac{a_n}{b_n}= \frac{A}{B}.

证明见教学视频或问DeepSeek.

函数极限四则运算

加减法: 如果 \displaystyle \lim_{x\rightarrow x_0}f(x) = A, \displaystyle \lim_{x\rightarrow x_0}g(x) = B, 则 \displaystyle \lim_{x\rightarrow x_0}[f(x) \pm g(x)]= A \pm B.
乘法: 如果 \displaystyle \lim_{x\rightarrow x_0}f(x) = A, \displaystyle \lim_{x\rightarrow x_0}g(x) = B, 则 \displaystyle \lim_{x\rightarrow x_0}f(x)g(x)= AB.
除法: 如果 \displaystyle \lim_{x\rightarrow x_0}f(x) = A, \displaystyle \lim_{x\rightarrow x_0}g(x) = B, 且 B \ne 0, 则 \displaystyle \lim_{x\rightarrow x_0}\frac{f(x)}{g(x)}= \frac{A}{B}.

证明见教学视频或问DeepSeek.

用 \varepsilon-N 定义证明 \displaystyle \lim_{n\rightarrow \infty}\frac{1}{n}=0。

\varepsilon-N 定义图解 — 给定 \varepsilon 带, 找到 N 使 n>N 后所有点都落在带内

计算 \displaystyle \lim_{n\rightarrow \infty}\frac{1}{2n}。

解法一

解法二

计算 \displaystyle \lim_{n\rightarrow \infty}\frac{1}{n^2}。

计算 \displaystyle \lim_{x\rightarrow 1}(2x-1)。

解法一

解法二

计算 \displaystyle \lim_{x\rightarrow 2}\frac{x^3-1}{x^2-5x+3}。

计算 \displaystyle \lim_{x\rightarrow 3}\frac{x-3}{x^2-9}。

1.2.4 两个重要的极限

重要极限一

还记得”割圆法”求圆面积的例子吗? 圆的内接正 n 边形的面积当 n \rightarrow \infty 的极限的计算最后就会落到极限 \displaystyle \lim_{x\rightarrow 0} \frac{\sin x}{x} 的计算, 这个极限与圆周率 \pi (阿基米德常数)有着深刻的联系.

三明治定理

定理陈述：
设函数 f(x), g(x), h(x) 在点 x_0 的某去心邻域内满足：

g(x) \leq f(x) \leq h(x)
\displaystyle \lim_{x\to x_0} g(x) = \lim_{x\to x_0} h(x) = L, 则 \displaystyle \lim_{x\to x_0} f(x) = L.

数列版本：
若数列 \{a_n\}, \{b_n\}, \{c_n\} 满足：
1. b_n \leq a_n \leq c_n（对充分大的 n）
2. \displaystyle \lim_{n\to\infty} b_n = \lim_{n\to\infty} c_n = L, 则 \displaystyle \lim_{n\to\infty} a_n = L.

重要极限1

\boxed{\displaystyle \lim_{x\rightarrow 0} \frac{\sin x}{x} = 1}

证明: 首先考虑 x>0 的情形. 我们从几何出发, 把 x 看作是单位圆上的一小段弧度, 注意到

\sin x 为对边长度
x 为圆弧长度（弧度制）
\tan x 为切线长度

通过几何上观察可知

\sin x < x < \tan x

同时除以 \sin x 并取倒数得

\cos x < \frac{\sin x}{x} < 1, \quad x>0

对于 x < 0 的情况, 利用奇函数性质：

\frac{\sin(-x)}{-x} = \frac{\sin x}{x}

因此同样有

\cos x < \frac{\sin x}{x} < 1, \quad x < 0 注意到 \lim_{x \to 0} \cos x = 1

应用三明治定理, 得

\lim_{x \to 0} \frac{\sin x}{x} = 1.

重要极限二

极限 \displaystyle \lim_{n\rightarrow \infty} \left(1+\frac{1}{n}\right)^{n} 与无理数 \mathrm{e} (欧拉数)有密切的联系. Jacob Bernoulli 于1683年在研究复利的时候考虑过这个数列的极限.

雅各布·伯努利与数e的发现

上机实验

limit_array_e.ipynb: 数列极限的例子.

重要极限2

\boxed{\lim_{n\rightarrow \infty} \left(1+\frac{1}{n}\right)^{n} = \mathrm{e}}

证明见教学视频或问DeepSeek.

警告

\boxed{\lim_{x\rightarrow 0} \left(1+x\right)^{\frac{1}{x}} = \mathrm{e}}

注意

可以证明

\mathrm{e} = 1 + \frac{1}{1!} + \frac{1}{2!} + \cdots + \frac{1}{n!} + \cdots

证明的方法也是用单调有界数列有极限.

中学学过导数的同学可以算一下展开式

\mathrm{e}^x = 1 + \frac{x}{1!} + \frac{x^2}{2!} + \cdots + \frac{x^n}{n!} + \cdots

的导数, 看看会发现什么有趣的现象?

1.2.5 复合函数的极限

提示

下面的结论相当于极限运算中的换元法, 在计算极限的时候十分有用.

警告

假设 y=f[g(x)], \displaystyle \lim_{x\rightarrow x_0}g(x) = u_0, \displaystyle \lim_{u\rightarrow u_0}f(u) = A, 则 \displaystyle \lim_{x\rightarrow x_0}f[g(x)] = A.

这个结论请自行根据直觉理解, 证明略.

计算 \displaystyle \lim_{x\rightarrow 0}\frac{\tan x}{x}。

计算 \displaystyle \lim_{x\rightarrow 0}\frac{1-\cos x}{x^2}。

计算 \displaystyle \lim_{x\rightarrow 0}\frac{\arcsin x}{x}。

计算 \displaystyle \lim_{x\rightarrow \infty}\left( 1-\frac{1}{x}\right)^{x}。

计算 \displaystyle \lim_{x\rightarrow 0}\frac{\tan 2x}{\sin 5x}。

1.3 连续函数

1.3.1 连续和间断

提示

所谓连续函数, 直白的说就是能笔不离开纸面一气画出来的函数, 下面我们就来运用极限的概念把这个连续的直观给数学化.

重要

函数在某一点的连续

若 \displaystyle \lim_{x\rightarrow x_0}f(x) = f(x_0), 则称 f(x) 在 x_0 处连续.

连续函数

如果函数在某个区域上每一点都连续, 则称 f(x) 是该区域上的连续函数.

讨论函数 f(x) = |x| 的连续性。

讨论函数 \displaystyle f(x) = \frac{1}{|x|} 的连续性，指出间断点（若有）。

间断函数

不连续的函数就是间断函数. 间断函数一定有某处是不连续的, 造成不连续的原因很多, 其中有些间断点还能够被挽救回来变成连续的 (可去间断点), 有些则挽救不回来.

讨论函数 \displaystyle f(x) = \frac{\sin x}{x} 的连续性。若存在间断点，判断其类型，并说明能否通过补充定义使其成为连续函数。

\sin x / x 在 x=0 处空心圆 — 极限值 1 存在但函数无定义, 是可去间断点

讨论函数 f(x) = \sin\dfrac{1}{x} 在 x=0 处的连续性。若不连续，判断间断点类型，并说明能否通过补充定义使其连续。

\sin(1/x) 在 x \to 0 时无穷次振荡 — 极限不存在, 第二类间断点 (振荡型)

单侧极限

左连续(注意极限记号下方的 - 号)

\displaystyle \lim_{x\rightarrow x_0^-} f(x) = A \iff \forall \varepsilon > 0, \exists \delta>0, s. t., |f(x) - A| < \varepsilon if -\delta < x-x_0 < 0.

右连续(注意极限记号下方的 + 号)

\displaystyle \lim_{x\rightarrow x_0^+} f(x) = A \iff \forall \varepsilon > 0, \exists \delta>0, s. t., |f(x) - A| < \varepsilon if 0 < x-x_0 < \delta.

造成函数 f(x) 在 x=x_0 处的极限不存在的一个常见原因是 f(x) 的左右极限不相等.

符号函数 \mathrm{sgn}(x)

\mathrm{sgn}(x) = \begin{cases} 1, & \text{if $x>0$}, \\ 0, & \text{if $x=0$}, \\ -1, & \text{if $x<0$}. \end{cases} 该函数在 x_0=0 处不连续, 造成不连续的原因是函数在该点的左极限 (x 从左往右趋于0) 等于 -1, 右极限 (x 从右往左趋于0) 等于 1, 左右极限不相等. 这种情况也没有办法通过简单的修改 f(0) 的值来让函数连续.

警告

函数的连续性是一个很自然的性质, 我们所感受到的世界就是连续的: 物体运动的轨迹, 温度的变化, 甚至计算机里的0-1也是用连续函数来近似的. - 在做目标追踪问题的时候, 连续是一个很重要的先验; - 在求解物理方程的时候, 解的连续性是一个很重要的约束; - 在人工智能里, 连续性是解决高维问题的一个核心底层逻辑.

1.3.2 闭区间上连续函数的性质

提示

闭区间上的连续函数是函数中的乖宝宝, 因为这类函数的值总是可以被控制住.

闭区间上连续函数的定义

如果函数 f(x) 在 (a, b) 内连续, 在 a 处右连续, 在 b 处左连续, 则 f(x) 是闭区间 [a, b] 上的连续函数.

维尔斯特拉斯 (Weierstrass) 极值定理/极大极小值定理

闭区间 [a, b] 上的连续函数有界, 且至少有一点 x_1 \in [a, b] 使得 f(x_1) 是 f(x) 在 [a, b] 上的最大值, 也至少有一点 x_2 \in [a, b] 使得 f(x_2) 是 f(x) 在 [a, b] 上的最小值.

函数 f(x) = \dfrac{1}{x} 是否在闭区间 [-1, 1] 上连续？若不连续，说明原因，并说明维尔斯特拉斯极值定理是否适用。

符号函数 \mathrm{sgn}(x) = \begin{cases} 1, & x>0, \\ 0, & x=0, \\ -1, & x<0 \end{cases} 是否在闭区间 [-1, 1] 上连续？若不连续，说明原因，并说明维尔斯特拉斯极值定理是否适用。

符号函数 \mathrm{sgn}(x) — x=0 处跳跃间断, 左极限 -1, 右极限 +1, \mathrm{sgn}(0)=0

布尔查诺 (Bolzano) 定理/介值定理

设闭区间 [a, b] 上的连续函数 f(x) 在端点的值分别为 f(a) < 0, f(b) > 0, 则一定存在 x_0 \in [a, b] 使得 f(x_0) = 0.

证明方程 x^3 - 4x^2 + 1 = 0 在区间 (0, 1) 内至少有一个根。

f(x) = x^3 - 4x^2 + 1 在 x=0 取正值, x=1 取负值 — 由零点定理保证 (0,1) 内有根

注意

布尔查诺定理是一个存在性定理, 它只告诉我们一个东西有还是没有, 与之相对的是所谓的构造性定理, 后者会给出找出这个东西的具体办法. 存在性定理和构造性定理都是数学的重要组成部分, 按照一般的理解, 前者在纯数学中的地位更高, 后者则一般更受工程师和程序员的青睐.

为了让大家体会存在性定理的奇妙之处, 下面我们用布尔查诺定理来证明一个看起来并不明显的命题(摘自库朗所著的《什么是数学》一书). 命题如下: 如果 A 和 B 是平面内的任意两个区域, 那么在平面内一定存在一条直线, 该直线同时平分 A 和 B. (注：所谓一个”区域”, 是指平面内一条简单闭曲线所包围的部分.)

证明：

先在平面上选择某一固定点 P, 并且从 P 引出一条射线 PR 当作度量角度的始边. 如果作与 PR 的夹角为 x 的任一射线 PS, 那么在平面上会有一条与 PS 同方向且 平分区域 A 的有向直线.

因为, 如果我们作一条与 PS 同方向的有向直线 l_1, 但它整个在 A 的一侧, 然后平行地移动这条直线, 直到直线处在位置 l_2, 那么由区域 A 在直线右侧（如果直线指北, 则东向是右侧）的面积减去 A 在直线左侧的面积所定义的函数, 其值对 l_1 是负的, 对 l_2 是正的. 因为这个函数是连续的, 由布尔查诺定理, 必有某个中间位置 l_x, 使它为零, 也就是 l_x 平分了 A. 因此, 对于 x 由 x = 0^\circ 到 x = 360^\circ 的每个值 x, 平分 A 的直线 l_x 都是唯一确定的.

现在把函数 y = f(x) 定义为 B 在直线 l_x 右侧面积减去 B 在 l_x 左侧的面积. 假设直线 l_0 与 PR 同方向且平分了 A, 并且 B 在 l_0 右侧的面积大于左侧, 则对 x = 0^\circ, y 是正的. 如果 x 增加到 180^\circ, 那么直线 l_{180} 和 RP 平行, 它虽然和 l_0 一样地分割 A, 但与 l_0 方向相反, 右和左互换, 因此 y 在 x = 180^\circ 时和在 x = 0^\circ 时的数值相同, 但符号相反, 所以是负的. 当 l_x 旋转时, y 是 x 的连续函数, 那么在 0^\circ 和 180^\circ 之间, 存在 x 的某个值 \alpha, 使 y 等于零.

因此方向线 l_\alpha 同时平分 A 和 B, 证明完毕.