聚书轩hbcjlp.com

繁体版 简体版
聚书轩 > 玄幻小说 > 数学心 > 第四百七十四章 信源编码对应二十个问题

第四百七十四章 信源编码对应二十个问题(1 / 2)

 推荐阅读: 穿越仙界之门 美漫:开局调查神盾局长税务问题 畅游诸天影视 明末之天降神兵 农门锦鲤妻的娇宠日常 网游之超神驯兽师 重生动画大时代 这个忍界不正常 克死前夫后我成了心软的神 兽语小村医
最新网址:hbcjlp.com

现在回到“二十个问题”游戏。如果这个游戏一个一个分开玩,其实就是在数据压缩的时候,对信息源里蹦出的每个随机变量单独做压缩。如果这个游戏攒n个一起玩,其实就是对随机序列中的n个随机变量同时进行压缩。显然,对每个随机变量单独进行压缩一定不会比对整个随机序列同时做压缩效率更高(这里的效率是用平均每个随机变量压缩后的比特数来衡量的,比特数越低,效率越高)。这里的道理是这样的:比如俺俩攒n个“二十个问题”游戏一起玩,但你设计问题的时候,每个问题只是针对序列中的一个随机变量,而不是针对整个序列。这样的问问题策略显然等同于把每个游戏分开玩。也就是说,这个游戏一个一个分别玩可以认为是攒起来一起玩的一种特例。因而分别玩能达到的效率,攒起来玩也可以达到。因为同样的道理,如果这个游戏攒2n个一起玩,其效率也一定不比攒n个一起玩低。也就是说,为了提高效率,n应该越大越好。

那么攒起来玩的效率到底最高可以达到多少呢?或者说,对一个给定的信息源,平均每个蹦出来的随机变量最少需要多少个比特来表示呢?这个数字通常跟序列的长度n相关,而且对于任意一个给定的n,即使俺们能够确定最优的压缩方法,精确地确定这个数字也是一件很棘手的事。不过既然俺们已经认识到n越大越好,那不妨考虑n取无穷大吧。

当n取无穷大时,如果俺们能够计算出信息源里平均每个蹦出的随机变量最少需要多少比特来表示,这个数字不仅标记了最优的压缩效率,它同时还有着更深刻的物理意义:它跟序列的长度n无关,也跟编码方法无关;换言之,这个比特数只取决于信息源本身(即随机变量x或其分布p(x))。因为这个比特数是由最优编码/解码方法实现的,它同时说明了两件事:

1.只要解码端接收到的平均比特数不到这个数字(平均到每个随机变量上),不论用什么编码/解码方法都一定无法重建信息源里蹦出的随机序列。

章节错误,点此举报(免注册),举报后维护人员会在两分钟内校正章节内容,请耐心等待,并刷新页面。
『加入书签,方便阅读』