未来这里肯定会升级成为奥创云计算平台,蓝厂平台对虚拟化技术的支持更加领先。
定下了基调,吉姆自然会去跟谢莉尔对接,服务器和存储分别需要多少,然后再将它们采购回来,以暂时减轻Meta社区的存储压力。
趁着这一个星期,王正已经把人脸识别模块全部写完,并且整理出了数个分支算法。
人脸识别算法,是一个大的集合。
这套算法里包括了图片处理算法,人脸提取算法,图片对比算法等一系列的算法。
这些算法集合起来,才能够实现人脸识别。
如果中间缺一项,或者说这项技术被注册了专利拿不到授权,那么人脸识别功能就不完整,无法使用。
这个时候要么另辟蹊径,要么花钱买授权。
国内很多技术落后也是这个原因,中间被卡住了。
换方向就代表之前的努力白费,不换吧,人家不给授权只能绕路。
所以王正把这些算法代码发给了周若云。
她会以王正的个人名义在全球范围内注册专利,然后再把专利授权放到离岸公司,再用知识产权授权的方式,正大光明的授权给Meta使用。
专利这东西的判断标准是谁先提交,所以即使现在专利还发不下来,没关系,照常用就可以了。
在Meta那边的开发部门找个两个人,在学了仓颉语言之后,只花了一天时间就根据这个算法,做出了一个程序挂载到Meta社区的上传功能。
毕竟对于这些开发人员来说,是有了题目和解题步骤,还提供了笔,算出结果是在不难。
这个程序很简单,Meta这边的工作人员收集大量的违规图片,再把这些图片上的违规内容抠出来作为样本库,这个工作会一直持续下去,完善样本库。
用户上传的图片会先进入到这个程序,和样本库进行对比,设定一个阈值,比如相似度达到80%以上就可以直接过滤了,告诉用户这图我不要。
相似度达到60%左右的才转人工审核,而低于60%的直接放行。
随着样本库的完善,这个程序将会越来越准确,当然,消耗的计算资源也会越来越多。
程序经过两天的测试,人工审核工作量大幅度下降。
王正扭头把这程序再发给国内,小云书上直接挂载就好了。
接下来,迫切需求的还有图片压缩技术。
一般情况下,用数码相机拍出来的照片是RAW格式图片,这是原生图片,没有经过任何压缩,照片质量最好。
但是这种图片动辄几十MB甚至上百MB,要是一不小心多拍几张,SD卡就塞不下了。
而且要是用这种格式去做动画或者电影,一秒钟都得1个GB没哪个人受得了这个。
所以用数码相机通常拍摄图片,都是直接把RAW格式压缩成JPG格式,就是我们用相机、手机等设备拍摄后所看到的图片,除非手动调整,否则99%默认都是JPG格式。
JPG格式是一种有损压缩技术,就是说它虽然体积小,但是画面质量会有损失。
而且要说体积小,单张照片也有3MB左右,根据相机的画幅有所变动。
Meta社区一次最多允许上传9张照片,这些照片的存储要占用30MB左右的空间,如果再做个数据容灾备份,就奔着60MB去了。
随着用户量越来越大,未来还要开通音频、视频服务,Meta可能要建上百个数据中心才能满足图片存储的需求。
再有一个原因,30多MB的图片再上传到网页上,流量占用大,网页打开速度慢,也会影响用户的体验和Meta的成本。
多图杀猫,就是这么来的。
唯一的解决办法就是,将JPG再次压缩,还要尽可能的保证质量,提高存储效率和传输效率,以此避免客户看到的图片全都是糊的。
但是具体怎么做?万事不决还是要去找U盘。