大数定理的英文是,它的中文翻译通常是“大数定律”而不是大数定理。但俺却偏要叫它大数定理!
定律或是英文里的law都是指不需要证明但可以被验证的理论假设。比如牛顿的万有引力定律。从数学上说,不需要证明就被接受的假设被认为是公理。但是这个大数定理并非公理,它是被严格证明出来的(证明也不复杂,只要用马尔可夫不等式或切比晒夫不等式就行了),因此准确的数学语言应该叫它“定理”。管他叫“定律”会让人以为这个东东就是假设出来的公理,从而产生歧义,当年也不知道谁这么没涵养管它叫“law”。所以,不管你们服不服,俺都要管它叫大数定理。
大数定理大概说了这样一个意思。假设有某个随机实验会产生一个随机变量x。如果你重复做这个随机实验n次,你就会得到一个随机变量序列x1,x2,x3,…,xn。这里假定这些随机变量相互独立(即这些随机实验互不影响)而且n是个很大的数(比如,一万,十万,百万),那么把这n个数加起来除以n(即取平均),得到的数(即(x1+x2+…+xn)/n)几乎总是很接近随机变量x的均值。同学们注意一下俺这里“几乎总是”和“很接近”的用词哈。虽然俺是个马虎的人,这里的遣词造句是极其考究,极负责任,极具情怀的。
咱们用老千掷硬币的例子先看看大数定理到底说了些啥子嘛。假设那个老千掷了n次硬币,那么他就得到了n个在{0,1}里取值的数。因为这n个数都是随机的,这n个数的均值当然也是个随机变量,就是说也有一个概率分布函数,有一定的不确定性。大数定理告诉俺们,当n很大的时候,这n个数的平均值“几乎总是很接近”1/3。“几乎总是”和“很接近”是可以在数学上严格定义的,不过当俺讲完它们的定义的时候,估保守,但俺码字已经快要吐血,正在后悔俺为什么要揽下这么个差事,所以就随便套了一下切比晒夫不等式得出下面这些“至少有”的结论):
当n=1000时,至少有91.1%的概率这个平均值很接近1/3。
当n=10000时,至少有99.1%的概率这个平均值很接近1/3。
当n=100000时,至少有99.9%的概率这个平均值很接近1/3。
如果把“很接近1/3”理解为跟1/3相差不到0.02,那么: