收集原始影像后,面临的最大问题就是如何使得这些收集的影像数据具有参考比对的权威性;深度学习的价值。就好比说,某老师要出一个辅导练习册让学生们自学,册子后面要给出标准答案。这个标准答案老师总不能不经选择就采用原来学生的习题吧,必须经过他自己的审阅后才敢拿来用,或者再严谨一些,可能还要经过几个资深教师的反复审阅。
所谓影像学的人工智能就是如此,必须“喂”给系统海量的经过诊断鉴定的影像资料才能谈得上去图像识别和深度学。比如alphago最开始就是结合了数百万人类围棋专家的棋谱进行了自我训练,而到了alphagozero阶段,它的能力则在这个基础上有了质的提升。它不再需要人类数据,它进行的是自我博弈,自身学习。
可是没有前一个阶段的积累,就不能达到后一个阶段的自主。
经过不断积累,图维目前已经有了海量的原始数据,按照他们原来的计划,请一些专家帮忙再做一下审阅,这些数据就可以用了。可没想到,在请专家帮忙这件事上特别不顺,那些主任都忙得不可开交,很少有空能来帮忙;即使不忙了也看不上他们三瓜俩枣的报酬。
这件事就一直耽误到现在,他们的有效影像资料还只有区区可怜的几万张,还是不同患部的全部资料,他正为此头痛呢。
他原来有考虑过,索性利用医院的his和pacs系统来作为反馈系统,通过它们去查证、追踪、验证,可是这样的数据验证的积累要到猴年马月才能足够充分?他公司账上的资金可只够维持两个月的运转了。
他看新闻前段时间gg公司用机器人和美国一些最权威的放射科医生进行了阅片比赛,最后的结果是机器人完败了这些放射科大牛们,而且超出的比率竟然高达80%。但人家是国际大公司,财大气粗,获得这样的海量数据自然不是难事。
他意识到这大数据还真不是他这样的小公司玩得起的,可是他已经入坑了,已经把自己的所有资源都砸进去了,要想跳出来也不是那么容易,每每想到这里,他都要哭了。
可是现在崔明浩竟然找上门来,这不是利用他们的数据来撬他们的墙角嘛。他当然恼羞成怒来。
他自动忽略了崔明浩说的这程序是他朋友的,直接认定是崔明浩等几个放射科医生搞出来的东西。他们有专业,有现成的途径,再利用一点业余时间干私活,然后就想把这私活卖给他,真是打得好算盘啊!
可图大维也不怵,就你们这些人弄出的放不上台面的小玩意也敢找我这要钱?看我不玩死你们!
崔明浩淡定地看着图老板,坦然地笑着说:“图老板可要看仔细了,这是本院的数据吗?”
这不是本院的数据?那他们从哪里获得的?要知道现在是数据时代。数据时代什么最宝贵?数据啊!这在任何地方可都是宝贵的资源。
图老板不由得低头仔细翻看起来,看了几十张之后他便意识到,这些还真的不是本院的数据,它们和自己公司收集到的医院影像资料形式大不一样。人家做得资料可他公司精细多了,不仅有正位、侧位的对比,甚至还有三维图像的建立,只不过容量太小,三维图像转动起来非常卡。而且,从影像图片上看,有些人体就不是亚洲人的体型和骨骼,他们的资料很可能相当部分是来自国外。
图老板立刻意识对方的价值,顿时欣喜若狂,这些数据不仅是经过了图像识别,而且是经过优化处理过的数据,是拿来就能用的数据。也就是说这些数据只要倒入他们公司的软件可以卖钱了。
图老板的眼睛绿了。