随机事件与概率概率的定义概率的计数模型概率的几何模型随机变量离散型随机变量连续型随机变量从映射角度来理解随机变量期望与方差期望方差条件概率乘法准则加法准则条件独立性统计推断

内容提要
第一讲: 随机事件与概率
通过生活中的例子, 本讲介绍了与随机事件和概率的基本概念.

第二讲: 随机变量
随机变量是对随机事件的抽象描述, 本讲介绍了离散型随机变量及其对应的概率质量函数, 以及连续型随机变量及其对应的概率密度函数.

第三讲: 期望与方差
期望和方差是描述一个随机变量的重要指标, 本讲介绍了期望和方差的定义和计算.

第四讲: 条件概率
本讲通过具体的例子介绍了条件概率, 乘法准则和加法准则的基本概念, 稍微提了一下统计推断和贝叶斯公式. 这部分内容是机器学习和统计学中的核心内容.
_Ol

随机事件与概率

生活中有各种各样我们无法准确预知结果的事件, 比如抛硬币, 掷骰子和明天的天气. 数学上我们用概率 (probability) 来描述这类随机事件 (random event).

概率的定义

样本空间 $\Omega$ $\Omega = \{ 正面朝上, 背面朝上\}$ $\Omega$ 随机事件 $[0, 1]$ $P$ 概率 $P(\{0\}) = P(\{1\}) = 0.5$ ).

我们再来看两个例子:

例1.1 掷骰子
样本空间
$\Omega=\{1, 2, 3, 4, 5, 6\}$
随机事件
掷出的数字分别为: {1}, {2}, {3}, {4}, {5}, {6}
掷出奇数: {1, 3, 5}
掷出小数: {1, 2, 3}
掷出小数或奇数: {1, 2, 3, 5}
...
概率
$P(\{1\})=P(\{2\})=P(\{3\})=P(\{4\})=P(\{5\})=P(\{6\})=1/6$
$P(掷出奇数)=P(\{1\})+P(\{3\})+P(\{5\})=0.5$
$P(掷出小数)=P(\{1\})+P(\{2\})+P(\{3\})=0.5$
$P(掷出小数或奇数)=P(\{1\})+P(\{2\})+P(\{3\})+P(\{5\})=2/3$
_Gn

例1.2 明天的天气
样本空间
$\Omega=\{晴, 多云, 雨\}$
随机事件
明天天晴
明天多云
明天下雨
明天不下雨={晴,多云}
...
概率
$P(晴)=0.6$
$P(多云)=0.3$
$P(雨)=0.1$
$P(明天不下雨)=P(晴)+P(多云)=0.9$
_Gn

Tip

概率可以看成是从随机事件到一个数之间的映射, 这个映射需要满足下面的一些条件, 这些条件都很容易从直观上理解:

非负性 $P \ge 0$ . 当一个事件不可能发生时, 它所对应的概率为0.
归一性 $P(\Omega)=1$ , 它表示无论随机事件的结果如何, 一定会包含在样本空间中, 必居其一. 如:

$P(\Omega) = P(0)+P(1)=1$ .
例1.1 $P(\Omega) = P(1)+P(2)+P(3)+P(4)+P(5)+P(6)=1$ .
例1.2 $P(\Omega) = P(晴)+P(多云)+P(雨)=1$ .

可加性 $A, B \subset \Omega$ $P(A \cup B)=P(A)+P(B)$ . 例如:

例1.1 $P(\{1, 3\})=P(\{1\})+P(\{3\})=1/3$ .
例1.1中, 骰子抛出奇数或小数不是_Rd $P(掷出小数或奇数) \ne P(掷出小数) + P(掷出奇数)$ .

概率的计数模型

$N$ $M$ $P(上上签)=M/N$ $N$ 个签中的任何一个)的可能性都相等.

Tip
$\Omega$ $N$ 个单位事件构成时,

P = \frac{我 们 关 心 的 单 位 事 件 总 数}{所 有 单 位 事 件 的 总 数} = \frac{M}{N}

我们来看两个通过计数模型计算概率的例子:

例1.3: 抛2次硬币得到2次正面朝上的概率
$N=4$ 种可能的结果, 且出现每一种的可能性都相等:
正-正
正-背
背-正
背-背
$M=1$ $P(抛2次硬币2次正面朝上) = 1/4$ .
_Gn

例1.4: 掷2次骰子的数字加起来等于8的概率
$N=6\times 6=36$ 种可能的结果, 且出现每一种的可能性都相等. 在这36种结果种, 2次数字加起来恰好等于8的情形包括:
2+6
3+5
4+4
5+3
6+2
$M=5$ $P(掷2次色子的数字加起来等于8) = 5/36$
思考: 请你算一算掷2次骰子的数字加起来等于2的概率是多少呢？
_Gn

概率的几何模型

接下来我们借助几何的观点将概率具象化. 我们先来看两个例子:

例1.5: 幸运大转盘获一等奖的概率
$P (一等奖) = \frac{深红色对应的弧长}{转盘周长}$
_Gn

例1.6: 陨石砸到居民区的概率

$P (陨石砸到居民区) = \frac{居民区的面积}{区域总面积}$
_Gn

Tip
$A$ $A$ $\Omega$ 的几何度量中的占比, 即

P (A) = \frac{事 件 A 所 对 应 的 区 域 的 长 度, 面 积 或 体 积}{样 本 空 间 Ω 所 对 应 的 区 域 的 长 度, 面 积 或 体 积}

Note
$\Omega$ 划分成许多大小相等的小区间, 并把每一个小区间看成是一个单位事件, 则概率的几何模型就跟概率的计数模型完全等价了. 因此, 概率的计数模型和几何模型本质上是相同的, 只不过前者更适合描述离散的随机事件, 而后者更适合描述连续的随机事件.

随机变量

$X$ $X=5$ $X=9.99$ $X$ $X$ 随机变量 $X, Y, S, T$ 来表示随机变量. 用随机变量来表示随机事件很方便也很自然, 有些事件的结果是离散的, 比如盘子里苹果的数目一定是个整数, 而有些事件的结果是连续的, 比如苹果的价格可以是任意实数. 用来表示离散事件的随机变量称为离散型随机变量, 用来表示连续事件的随机变量称为连续性随机变量.

离散型随机变量

先来看几个离散型随机变量的例子.

例2.1: 用随机变量来表示抛硬币
$P(硬币正面朝上)=0.5$ $\iff$ $P(X = 1)=0.5$
$P(硬币背面朝上)=0.5$ $\iff$ $P(X=0) = 0.5$
_Gn

例2.2: 用随机变量来表示掷骰子
$P(掷出数字k)=1/6$ $\iff$ $P(X = k)=1/6$ $k=1,2, 3, 4, 5, 6.$
_Gn

例2.3: 用随机变量来表示天气
$P(晴)=0.6$ $\iff$ $P(X = 1)=0.6$
$P(多云)=0.3$ $\iff$ $P(X = 2)=0.3$
$P(雨)=0.1$ $\iff$ $P(X = 3)=0.1$
_Gn

例2.4: 用随机变量来表示盘子里苹果的数目
$k \ge 0$ :
$\displaystyle P(盘子里有 k 个苹果) = \frac{\lambda^k \mathrm{e}^{-\lambda} }{k!} \iff P(X=k) = \frac{\lambda^k \mathrm{e}^{-\lambda} }{k!}$
这个分布也叫泊松分布.
_Gn

Tip

概率质量函数 $P_X(k) = P(X=k)$ $X$ $k$ $P_X(k)$ 的取值可以像 例2.1, 例2.2 和 例2.3 中那样直接一一列出, 也可以像 例2.4 那样用通项表示.

Tip

$P(X)$ 需要满足两个条件:

非负性 $P(X) \ge 0$ .
归一性 $\displaystyle \sum_{k}P(X=k) = 1$ .

非负性归一性 $P(\Omega)=1$ ).

Warning

$P_X(k)$ 是否满足归一性条件.

例2.4 $e^{x} = 1 + \frac{1}{2} + \cdots + \frac{x^k}{k^!} + \cdots$ .

连续型随机变量

我们再来看几个连续型随机变量的例子.

例2.5: 用随机变量来表示灯泡的寿命
$X$ 等于某种型号灯泡的使用寿命(单位为天), 则
$P(换上该灯泡后一个月内坏掉的概率)= P(X < 30)$ .
_Gn

例2.6: 用随机变量来表示测量误差
$L$ $L'$ $X = L' - L$ 为测量误差(单位为米), 则
$P(测量误差在\pm 1米范围)= P(-1<X<1)$ .
_Gn

概率密度函数 $p_X(x)$ $p(x)$ .

例2.5中的概率密度函数
在 例2.5 中, 灯泡的寿命可以用指数分布 (exponential distribution)来描述, 指数分布对应的概率密度函数为
$p (x) = λ e^{- λ x}, λ > 0, x \geq 0$
其对应的函数图像如下图所示.
_Gn

例2.6中的概率密度函数
在 例2.6 中, 测量误差可以用峰值位于0点处的高斯分布 (Gauss distribution) 来描述, 其对应的概率密度函数为
$p (x) = \frac{1}{\sqrt{2 π} σ} e^{- \frac{x^{2}}{σ^{2}}}, σ > 0$
高斯分布也叫正态分布 (normal distribution), 其对应的函数图像如下图所示.
_Gn

Tip
$p(x)$ 也需要满足两个条件:

非负性 $p(x)\ge 0$ .
归一性 $p(x)$ $x$ 的积分等于 1(没有学过微积分的同学只需要把积分理解成求和就行了).

这两个条件的意义跟概率质量函数所满足的非负性和归一性条件是一致的.

Note

$p(x)$ $X$ $x$ $P(X=x)$ $p(x)$ $x$ 概率的密度 $X$ $(x, x+\Delta x)$ $P(x \le X \le x+\Delta x)$ 概率密度 $p(x)$ 区间长度 $\Delta x$ 概率质量 $\times$ $P(x \le X \le x+\Delta x) \approx p(x)\Delta x$ .

Warning

物理上的质量_Rd 和密度_Rd 有什么不同?
为什么概率质量必须要小于1, 而概率密度的取值则可以大于1?

从映射角度来理解随机变量

我们可以用映射的观点来理解随机变量及其概率质量函数或概率密度函数:

随机变量
随机变量本质上是一个映射, 这个映射把样本空间_Rd中的随机事件映射到一个数_Rd $X$ , 如
$\rightarrow X= 0$
$\rightarrow X = 165.2$
相比随机事件而言, 随机变量的描述方式更具准确性, 简单性和通用性.
_Aq

概率质量函数和概率密度函数
概率质量函数和概率密度函数本质上也是映射, 而且是从数到数的映射, 即函数. 其中:
$[0, 1]$ 区间内, 其意义代表对应事件发生的概率_Rd.
$[0, +\infty)$ $p(x)$ $x$ 处的概率密度_Rd.
_Aq

Tip

一般来说, 从样本空间到概率相当于2重映射, 如下图所示, 第一重映射是将样本空间映射到数, 第二重映射是从数到概率.

映射与概率

期望与方差

上一讲中我们介绍的概率质量分布和概率密度分布可以看作是对随机变量的完整细致的描述, 期望和方差是对概率质量分布的一个整体宏观上的描述. 我们举拿下面的员工工资单做一个类比.

例3.1 你更喜欢哪份工作?
$X$ $Y$ , 2023年的工资单如右边表格所示. 这份工资单记录了每个月的收入, 但很多时候我们并不关心这么详细的信息, 比如说我们只想知道谁的收入更高, 或者谁的收入更稳定.

谁的收入更高?
我们可以计算每个月的平均收入期望 $X$ $Y$ 的期望分别是 34,396 和 26,058.

谁的收入更稳定?
方法一 计算最大月收入与最小月收入之间的差, 表示月收入变化的幅度. 但这个方法实际上只计算了最大和最小两个月的收入, 过于极端, 不能很好的反映收入的整体情况.
方法二 计算每个月收入与平均月收入的差, 然后把差额平方求和再除以月份数. 这样算出来的方差方法一 $X$ $Y$ 的方差分别是 723,910,000 和 2,876,000.
所以你更喜欢那份工作呢?
X 和 Y 两份工作的工资单
$X$ $Y$
2023.01 28,000 25,400
2023.02 37,640 26,200
2023.03 21,000 25,750
2023.04 8,070 28,160
2023.05 27,000 25,120
2023.06 39,780 23,090
2023.07 78,230 26,320
2023.08 4,350 27,340
2023.09 23,370 25,880
2023.10 98,640 23,170
2023.11 9,890 28, 900
2023.12 36,780 27,360

	$X$	$Y$
2023.01	28,000	25,400
2023.02	37,640	26,200
2023.03	21,000	25,750
2023.04	8,070	28,160
2023.05	27,000	25,120
2023.06	39,780	23,090
2023.07	78,230	26,320
2023.08	4,350	27,340
2023.09	23,370	25,880
2023.10	98,640	23,170
2023.11	9,890	28, 900
2023.12	36,780	27,360

基于上述动机, 我们引入概率质量分布期望(Expectation)和方差的(Variance)概念.

期望

Tip
$X$ $\mathrm{E}(X)$ 表示, 其数学定义如下.

离散型随机变量的期望
$X$ $P_X(k)$ $X$ 的期望等于
$E (X) = \sum_{k} k \cdot P_{X} (k)$
_Aq

连续型随机变量的期望
$X$ $p(x)$ $X$ 的期望等于
$E (X) = \int_{x} x \cdot p (x) d x$
_Aq

Tip

期望具有某种平均的含义, 下面来看几个计算期望的例子.

例2.2中随机变量的期望
例2.2 $X$ $P(X = k)=1/6$ $k=1, 2, \cdots, 6$ $X$ 的期望等于
$E (X) = \sum_{k = 1}^{6} \frac{1}{6} k = 3.5 .$
Warning
也就是说, 掷很多次骰子, 每次的点数可大可小, 但平均下来每一次得到的点数大约在3.5附近.
_Gn

例2.6中随机变量的期望
例2.6 $X$ 的概率密度函数为
$p (x) = \frac{1}{\sqrt{2 π} σ} e^{- \frac{x^{2}}{σ^{2}}}, σ > 0$
$p(x)$ $y$ $X$ $\mathrm{E}(X) = 0$ .
Warning
也就是说, 做很多次测量, 误差可正可负, 但这些误差平均起来大约等于0.
_Gn

方差

Tip

$X$ $\mathrm{Var}(X)$ 表示, 其数学定义如下.

离散型随机变量的方差
$X$ $P_X(k)$ $X$ 的方差等于
$Var (X) = \sum_{k} (k - E (X))^{2} \cdot P_{X} (k)$
_Aq

连续型随机变量的方差
$X$ $p(x)$ $X$ 的方差等于
$Var (X) = \int_{x} (x - E (X))^{2} \cdot p (x) d x$
_Aq

Tip

方差描述的是随机变量取值的波动例3.1 $X$ $\mathrm{Var}(X)$ $Y$ $\mathrm{Var}(Y)$ 就会比较小. 下面再来看几个计算方差的例子.

例2.2中随机变量的方差
例2.2 $X$ $P(X = k)=1/6$ $k=1, 2, \cdots, 6$ $X$ $X$ 的方差为,
$Var (X) = \sum_{k = 1}^{6} \frac{1}{6} (k - 3.5)^{2} \approx 2.9167 .$
_Gn

例2.6中随机变量的方差
例2.6 $X$ 的概率密度函数为
$p (x) = \frac{1}{\sqrt{2 π} σ} e^{- \frac{x^{2}}{σ^{2}}}, σ > 0$
$X$ $\sigma^2$ 图4 $\sigma^2$ $p(x)$ $X$ 的值分布得更分散.
_Gn

条件概率

前面几讲我们讨论的都是单个随机变量, 实际问题中我们经常需要同时考虑两个或多个随机事件, 这一讲我们将把两个随机变量放在一起分析.

例4.1: 小红帽与大灰狼
$X$ 来表示小红帽选的岔路:
$X = 0$ 表示小红帽选择了左边的岔路;
$X=1$ 表示小红帽选择了右边的岔路.
$Y$ 来表示小红帽是否会碰到大灰狼:
$Y=0$ 表示小红帽没碰到大灰狼;
$Y=1$ 表示小红帽碰到了大灰狼.
因为两条路看起来都一样, 所以小红帽选左边岔路或右边岔路的概率是相等的, 都等于0.5_Pr. 然而小红帽所不知道的是, 左边的岔路碰到大灰狼的概率是0.6_Pr, 右边的岔路碰到大灰狼的概率是0.2_Pr. 条件概率能够告诉我们小红帽的命运如何.
_Aq

Important

$A$ $B$ , 我们把事件B发生的条件下事件A发生的概率条件概率 $P(A|B)$ .

Note

在例4.1中:

如果_Rd小红帽选择左边岔路那么她碰到_Rd $= P(Y=1|X=0)=0.6$ .
如果_Rd小红帽选择左边岔路那么她没碰到_Rd $= P(Y=0|X=0)=1-0.6=0.4$ .
如果_Rd小红帽选择右边岔路那么她碰到_Rd $=𝑃(𝑌=1|𝑋=1)=0.2$ .
如果_Rd小红帽选择右边岔路那么她没碰到_Rd $=𝑃(𝑌=0|𝑋=1)=1-0.2=0.8$ .

Warning

$X$ $P(Y|X)$ $Y$ 的概率质量函数, 因此也满足非负性和归一性. 非负性很好理解, 对于归一性, 我们举例说明:

如果_Rd $P(Y=1|X=0)+P(Y=0|x=0)=1$ .
如果_Rd $P(Y=1|X=1)+P(Y=0|x=1)=1$ .

乘法准则

Tip

$A$ $B$ 事件A和事件B都发生的概率 $P(A, B)$ .

Warning

$A$ $B$ $P(A, B) = P(B, A)$ .

Tip

下面的等式称为**乘法准则:

事件A和事件B都发生的概率 = 事件A发生 且 事件A发生的条件下事件B发生, 即
$P (A, B) = P (A) P (B | A)$
事件A和事件B都发生的概率 = 事件B发生 且 事件B发生的条件下事件A发生, 即
$P (A, B) = P (B) P (A | B)$

Note

在例4.1中:

小红帽选择左边岔路碰到大灰狼 $= P(X=0, Y=1) = P(X=0)P(Y=1|X=0)=0.5\times0.6=0.3$ .
小红帽选择左边岔路没碰到大灰狼 $= P(X=0, Y=0) = P(X=0)P(Y=0|X=0)=0.5\times0.4=0.2$ .
小红帽选择右边岔路碰到大灰狼 $= P(X=1, Y=1) = P(X=1)P(Y=1|X=1)=0.5\times0.2=0.1$ .
小红帽选择右边岔路没碰到大灰狼 $= P(X=1, Y=0) = P(X=1)P(Y=0|X=1)=0.5\times0.8=0.4$ .

上面的关系可以整理成下面的表格:
小红帽与大灰狼
$Y=0$ $Y=1$
$X=0$ 0.2 0.3
$X=1$ 0.4 0.1

	$Y=0$	$Y=1$
$X=0$	0.2	0.3
$X=1$	0.4	0.1

联合概率质量函数
$\Omega$ $X$ $Y$ $P(X, Y)$ $\Omega$ $X$ $Y$ 联合概率质量函数 $P(X, Y)$ 满足:
非负性 $P(X, Y)\ge 0$ .
归一性 $\sum_{x, y} P(X=x, Y=y) = 1$ .
表2 $0.2 + 0.3 + 0.4+ 0.1=1$ .

加法准则

Warning

在例4.1中, 我们不关心小红帽到底走的那条路, 而只想知道整个故事中小红帽碰到狼_Rd或没碰到狼_Rd的概率.

$Y$ $P(Y)$ ?_Gn

Tip

$P(X)$ $P(Y|X)$ 加法准则 $P(Y)$ :

P (Y) = \sum_{X} P (X) P (Y | X) .

Note

在例4.1中, 运用加法准则:

$P(Y=1)=P(X=0)P(Y=1|X=0) + P(X=1)P(Y=1|X=1)=0.5\times 0.6+0.5\times 0.2=0.4$ .
也就是说: 小红帽碰到狼的概率小红帽走左边 $\times$ 走左边碰到狼小红帽走右边 $\times$ 走右边碰到狼
$P(Y=0)=P(X=0)P(Y=0|X=0) + P(X=1)P(Y=0|X=1)=0.5\times 0.4+0.5\times 0.8=0.6$ .
同样是说: 小红帽没碰到狼的概率小红帽走左边 $\times$ 走左边没碰到狼小红帽走右边 $\times$ 走右边没碰到狼
Tip
$P(Y=k)$ , 加法准则把所有_Rd $P(Y=k)$ $P(Y=k)$ .

条件独立性

Warning

如果我们问, 小红帽走那条路碰没碰到大灰狼 $A$ $B$ 在概率上是有关的还是独立的呢?

Important

$A$ $B$ $P(A, B)=P(A)P(B)$ $A$ $B$ 条件独立.

Note

在例4.1中:

$P(Y=0, X=0)=0.2$ $P(Y=0)=0.6$ $P(X=0)=0.5$ $P(Y=0, X=0) \ne P(Y=0)P(X=0)$ , 因此事件 小红帽选左边岔路 与 没碰到大灰狼 不是条件独立的, 也可以说二者是条件相关的.

Tip

$A$ $B$ 条件独立 $P(A|B) = P(A)$ . 这是因为

$P(A, B) = P(B)P(A|B)$
$P(A, B)= P(B)P(A)$

$P(A|B)=P(A)$ $A, B$ $P(A|B)$ $B$ $B$ $P(A|B)$ $P(A)$ .

Warning

什么时候例4.1中的 小红帽选哪条岔路 与 碰到大灰狼 是_Rd $P(Y=1|X=0)=P(Y=1|X=1)=P(Y=1)=a$ $0\le a \le1$ , 那么小红帽选哪条岔路 与 碰到大灰狼 是_Rd $P(X, Y)$ 如表2所示.

小红帽与大灰狼 (条件独立版本)
$Y=0$ $Y=1$
$X=0$ $(1-a)/2$ $a/2
$X=1$ $(1-a)/2$ $a/2

	$Y=0$	$Y=1$
$X=0$	$(1-a)/2$	$a/2
$X=1$	$(1-a)/2$	$a/2

统计推断

Warning

$Y=1$ 条件概率 $P(X|Y=1)$ . 这类由已知的观测结果来反推物理过程统计推断 $Y=5$ $X=0$ $X=1$ $P(X|Y=5)$ . 本质上这个例子和小红帽与大灰狼的例子是一样的, 所以下面我们还是回到 例4.1 来讨论如何求解这类统计推断问题.

Tip

我们首先给出一个公式:

\begin{matrix} (1) & P (X | Y) = \frac{P (Y | X) P (X)}{P (Y)} \end{matrix}

这个公式的推导很简单, 根据乘法准则我们有

P (X, Y) = P (Y) P (X | Y) = P (X) P (Y | X)

$P(Y)$ $\eqref{eq1}$ .

Note

$\eqref{eq1}$ $P(X|Y=1)$ :

\begin{aligned} P (X = 1 | Y = 1) & = \frac{P (Y = 1 | X = 1) P (X = 1)}{P (Y = 1)} = \frac{0.6 \times 0.5}{0.4} = 0.75, \\ P (X = 0 | Y = 1) & = \frac{P (Y = 1 | X = 0) P (X = 0)}{P (Y = 1)} = \frac{0.2 \times 0.5}{0.4} = 0.25 . \end{aligned}

也就是说, 如果我们知道小红帽碰到了狼, 这条额外的信息能够帮助我们推出小红帽更可能走的哪条路: 虽然无论小红帽走的是哪条路, 她都有可能碰到狼, 但是如果非要猜小红帽走的是哪条路的话, 我们会以0.75的概率猜左边的路, 以0.25的概率猜右边的路. 这就是概率的魅力.

Important

$\eqref{eq1}$ 叫做贝叶斯公式, 这个公式虽然非常简单, 但它却是整个统计学和机器学习的核心, 建议大家在以后的学习中结合具体的例子反复理解其背后的思想.

随机事件与概率

概率的定义

例`1.1` 掷骰子

例`1.2` 明天的天气

概率的计数模型

例`1.3`: 抛2次硬币得到2次正面朝上的概率

例`1.4`: 掷2次骰子的数字加起来等于8的概率

概率的几何模型

例`1.5`: 幸运大转盘获一等奖的概率

例`1.6`: 陨石砸到居民区的概率

随机变量

离散型随机变量

例`2.1`: 用随机变量来表示抛硬币

例`2.2`: 用随机变量来表示掷骰子

例`2.3`: 用随机变量来表示天气

例`2.4`: 用随机变量来表示盘子里苹果的数目

连续型随机变量

例`2.5`: 用随机变量来表示灯泡的寿命

例`2.6`: 用随机变量来表示测量误差

从映射角度来理解随机变量

期望与方差

例`3.1` 你更喜欢哪份工作?

期望

例2.2中随机变量的期望

例2.6中随机变量的期望

方差

例2.2中随机变量的方差

例2.6中随机变量的方差

条件概率

乘法准则

加法准则

条件独立性

统计推断

随机事件与概率

概率的定义

例1.1 掷骰子

例1.2 明天的天气

概率的计数模型

例1.3: 抛2次硬币得到2次正面朝上的概率

例1.4: 掷2次骰子的数字加起来等于8的概率

概率的几何模型

例1.5: 幸运大转盘获一等奖的概率

例1.6: 陨石砸到居民区的概率

随机变量

离散型随机变量

例2.1: 用随机变量来表示抛硬币

例2.2: 用随机变量来表示掷骰子

例2.3: 用随机变量来表示天气

例2.4: 用随机变量来表示盘子里苹果的数目

连续型随机变量

例2.5: 用随机变量来表示灯泡的寿命

例2.6: 用随机变量来表示测量误差

从映射角度来理解随机变量

期望与方差

例3.1 你更喜欢哪份工作?

期望

例2.2中随机变量的期望

例2.6中随机变量的期望

方差

例2.2中随机变量的方差

例2.6中随机变量的方差

条件概率

乘法准则

加法准则

条件独立性

统计推断

例`1.1` 掷骰子

例`1.2` 明天的天气

例`1.3`: 抛2次硬币得到2次正面朝上的概率

例`1.4`: 掷2次骰子的数字加起来等于8的概率

例`1.5`: 幸运大转盘获一等奖的概率

例`1.6`: 陨石砸到居民区的概率

例`2.1`: 用随机变量来表示抛硬币

例`2.2`: 用随机变量来表示掷骰子

例`2.3`: 用随机变量来表示天气

例`2.4`: 用随机变量来表示盘子里苹果的数目

例`2.5`: 用随机变量来表示灯泡的寿命

例`2.6`: 用随机变量来表示测量误差

例`3.1` 你更喜欢哪份工作?