图灵机,二战结束后,不长的时间里,假想出来的机器,它需要使用纸带作为输入输出,纸带是无限长的,并且机器每次只能读取并处理纸带上的一个符号,然后基于一定的规则,这个机器就能表达一切事物并能处理所有计算!
为了简单起见,图灵使用的符号也是二进制的0和1。图灵机的构想,奠定了电子计算机的理论基础,也证明了二进制正好也是最适合计算机系统的。
并且,二进制也是最简单有效的机器语言,可以用电路的通断,高电平和低电平等状态非常方便地表示0和1,因此二进制成为了整个行业的标准,也造就了整个21世纪,信息的世纪的来临。
2019年7月15日,英国央行英格兰银行宣布,图灵将成为英国50英镑新钞人物,以表彰其对今天人们生活方式产生的巨大影响。这一殊荣堪比英国女王。
在多位科学巨人的努力下,这些由0101组成的二进制符号串也就理所当然地成为了信息传输,处理以及存储的最小计量单位,其中每一位就是一个比特(bit),简写为小写的b。
实际使用中比特这个单位还是太小了,因此,以2的10次方(也就是1024)为步长,又定义了以下的一些单位:
kbit—千比特,也就是1024bit
mbit—兆比特,也就是1024kbit
gbit—吉比特,也就是1024mbit
……
后面还有更大的单位,每一级乘以1024就可以了。
虽然不太理解,但乌利亚所处的时代:1个金龙=1024个银狼,1个银狼=1024个铜鹿。
可见,这个世界,也许创造者,就是一个地道的穿越者,一个比乌利亚他们更古老的穿越者,而形成了某种闭环,发明了帝国货币上的进制。
不然,乌利亚很难相信,不用二进制的人,会在这用上这样的单位进制!所以,乌利亚由此得出一个结论,一定有更早的穿越者来到了这里,并塑造了这里,制定了规则。
这一点而言,炼金术士常用的“衔尾蛇”符号,乌利亚就有点理解了,那是生生不息的循环往复的标识!就代表着不断地穿越和轮回。
有了这些假设基础,乌利亚冒着流鼻血薅头发想破脑袋的风险,开始进一步作死:那黑盒中的它们,如果假设就是一串不能解读的信息,而这串信息又可以从意识状态改变物质世界,比如通过黑盒输出了整个世界最终毁灭的命运,他该如何自处?
这个假设不可谓不大胆,但他很清楚,越是伟大的假设,越需要他伟大的求证,甚至可能需要用上他一辈子的时间!
这些信息源头又来自于哪里?如果有一个更古老的穿越者,也许光用上未来的知识还不够,而是要开始整个异世界帝国的考古?
当然,眼下,他这婴儿般的身体,还具备考古的条件。他目前唯一具备的,只有一副近万年的头脑。
他现在很像看看:一些人们常见的事物,到底含有多少信息,占用多少数据量。
文字
众所周知,英文字母有26个,理论上5比特就可以全部表示。且慢,刚才说的是小写字母,那算上大写字母,阿拉伯数字,标点符号怎么办?
正好,一个字节有8个比特,含有256种组合,也就可以表示所有的英文大小写,数字,标点和控制字符了!这就是著名的ascii码表的由来。
乌利亚最热爱的中文情况,又要比上面的英文复杂上一些。因为中文并不是基于字母的拼音文字,而是由大量各不相同的字组成。康熙字典共收录汉字47035个,实际汉字总体数量达到了惊人的近10万个!这种情况下,用8个比特来编码汉字显然是远远不够的。
实际使用中,常用汉字,在utf-8编码下,一个汉字占用3个字节(byte),也就是用24比特来表示,不常用汉字甚至占到了4个字节。
《红楼梦》共有731,017个汉字,算下来就有2193051个byte,在不考虑存储压缩算法的情况下,大约有2mb大小。
这个数据在21世纪看来的确很小,在曾经一块软盘只有1.4mb大小的时代,那也是庞然大物了。
图片
那么图片呢?最主流的图片格式是位图。什么叫位图呢?只需要把图片放大即可看出端倪,比如一张图片上,美女细腻的脸庞不再光滑,而是呈现为一个一个不同颜色的小方格。
位图是由像素组成的
所谓位图,也叫bitmap,实际上是由很多“带有颜色的点”组成的。
这些点是图像显示的基本单位,也就是放大图像之后看到的小方格,称为“像素”。
人们通常说一幅图片的大小,例如是1920x1080,就是长度为1920个像素,宽度为1080个像素点。乘积是2,073,600,也就是说,这个图片是两百万像素的。
每个像素必须要有颜色,才能组成缤纷绚丽的图片。
那么,这个颜色,又该如何表示呢?
三原色视觉理论告诉人们,任何颜色,都可以通过红色(red)、绿色(green)、蓝色(blue)按照一定比例调制出来。这三种颜色,被称为“三原色”,就是rgb。
光学三原色:红绿蓝
在计算机里,红、绿、蓝也被称为“基色分量”,分别计作r,g,b,每种颜色都用8个比特来表示。