cASp今年的开赛时间大约在5月初,等它比赛结束,出结果的时候已经8月了。
贾扬清询问了一番孟繁岐的目的,得知他准备参加cASp,不由得感觉有些担忧。
“你这比赛结果出来那么晚,六月份的事情可怎么办,三个月这也来不及啊?”
言下之意,没有官方的结果背书,这个工作的具体贡献到时候说不清楚。
“啊?我没打算那这个去跟她比啊。”
杀鸡焉用牛刀?
孟繁岐这才醒悟过来,原来大家都以为他刚刚开会回来就急着联络同事是为了准备和霍尔姆斯的竞争。
这完全是思维惯性了,孟繁岐只是因为这件事情先选择了一个在谷歌大脑的工作方向,并且医疗智能方面他早就计划涉足。
视界当初公司本就注册了两个,视界视觉和视界医疗,只不过由于种种原因,先只发展了一个,医疗方面还需要等待时机成熟。
“对付她哪里用得到那么多创新,她都十年了还没见产品呢。我拉几个同事在你的caffe上把之前的轮子造一下,然后针对几个比较常见的疾病图像做一些针对性优化就好了。”
比的也是短期内服务的患者人数和成本上的节约,阿尔法fold这个大工程就算两三个月做得出,也来不及起到相应的作用。
它的影响力很大,意义深远,后劲比较足,肯定值得去做。
要说短期的赌约对策,孟繁岐首先要做的是一整套医疗视觉基础范式。
就如之前所说的,在识别病症种类,检测疾病位置,分割病灶区域这三个主要方面做文章。
基于caffe框架,打造出这方面的易用工具,然后加以自己的开源协议公布出去。
这些都是基于孟繁岐已经发布的技术,要做的事情基本上都是苦力活,两三周就能完成的事情。
如果能多拉几个冤大头,一两周时间就差不多够了。
“残差网络天生就适用于所有的简单分类任务,对于图片和简单标签的形式,基本上没有太多工作量。”
孟繁岐在思索自己应该如何安排时间,分类任务是最方便的,需要做的其实只是把几种常见疾病的数据集按照特定格式重新准备一下就好。
并且,作为人工智能领域的一个重大突破,caffe早已适配了残差网络,这部分内容贾扬清等人已经基本完成了。
检测方面,此前的YoLo算法可以直接应用,不过这一次的侧重点有所不同。
此前,孟繁岐在保持了一定准确度优势的情况下,尽可能地加快了检测的速度。
意图是使用极高的帧数来作为核心卖点,这是自动驾驶等方向会比较看重的。
但在医疗领域当中,大多数时候就不会那么过度追求上百的帧数了,除非有海量的数据积压。
多数情况下需要检测的结果越精准越好,速度方面有很大的空间可以妥协。
“偏移总体的重心也不是那么容易的事情,一昧地加大模型的规模和图像的分辨率只会事倍功半。”
孟繁岐浏览了一番,医疗领域也已经有一些跟进的工作了,一些草稿公布了出来,出发点也和自己想的差不多。
将重心从速度往准确率上转移。
不过可以看出,他们的总体思路还比较简单,不得要领。
“让我给你们好好的上一课!”
孟繁岐如此想着,开始了一系列相关改进技术的研发工作。
图像的分类任务是最为简单的前向网络,一般来说,不会从中间层提取很多信息,因为目的只是为了判断类别。
但是,检测和分割的任务则不然,其中最主要的不同就是分类任务不需要定位目标在图片中的位置,检测和分割则需要提供这个信息,而且越准确越好。
检测任务需要用选框非常准确地框出目标物体在图片的何处,而分割更为精确,连精细的轮廓也要标注清楚。
出于计算量的考虑,骨干网络在处理图片的时候,通常并不会一直在极高的分辨率下进行。
一般来说,是分四个阶段,每过一个阶段,分辨率就会再小四倍(长宽都变成原本的一半)。
分辨率为256 x 256的图片输入之后,在不同阶段的特征图分辨率很可能会是[64, 32, 16, 8]。
这样成倍减少的特征图叠在一起,形成一个锥型,被称为特征金字塔。
分辨率变小的一大问题就是会丧失非常准确的位置信息,分辨率越小的特征图抽象程度越高,也就越难去表达原本图像中物体的位置。
由于这些不同尺寸的特征通常对融合后的输出特征作出了不平等的贡献,为了解决这一问题,孟繁岐计划实现一个简单而高效的加权双向特征金字塔网络(biFpN)。
它引入可学习的权重来学习不同输入特征的重要性,同时反复应用自顶向下和自底向上的多尺度特征进行融合。
如此以来,就不需要大量增加图像的原始分辨率和算法模型的规模和参数量,用较少的额外计算量争取到了更加多的性能。
此外,孟繁岐还对一些其他的方面进行了一系列测试调整。
争取到了一个六七人的小队协助,大约两周多不到三周的时间,孟繁岐就已经整理好了这些以分类,检测和分割为主题的综合应用手段。
并写成了一篇更像是实验报告的论文,《医疗图像算法实用技巧:以分类、检测与分割任务为例》
这篇论文是孟繁岐有史以来写得最长也最短的一篇论文。
最长是指论文的页数,多达四五十页,远超之前每篇十多页出头的惯例。
最短则是指其中略显多余的套话废话部分很少,几乎是没有。
孟繁岐直接尽可能将这些东西进行了精简,取而代之的是更多的实验测试结果和表格。
这篇论文在公共平台的公布,正式地引发了媒体对两边进度的高度关注。
虽然大家都知道孟繁岐的厉害,也见识了好几次他产出技术的速度,但谁也没有想到这一次竟然是一个三合一的合订本。
重剑无锋,大巧不工,没有特别多完全创新的新东西,反而是将之前已经公布的三个技术在相应的医疗图像领域内仔细打磨了一番。
就像乔峰一套太祖长拳锤爆各路高手一样,让众人均大彻大悟,原来这几种技术还可以这么用??
孟繁岐论文的结果,别说是对比原本的传统方法了,就是相比那些拿来主义,使用了孟繁岐技术的人,都有着相当可观的进步和提升空间。
这就有些惊人了。
你有能力,做出新的算法比我强,我能理解,我也认了。
这怎么大家都用一个算法也能差这么多呢?人与人之间的差距也太大了吧??
斯坦福会谈之后,霍尔姆斯没有什么能做的,只能尽量加强宣传工作,一副自己已经胜券在握的样子。
短短两周,就已经登上了财富和福布斯两家的封面。
“孟先生,我们知晓,您整合了自己此前的图像智能工作,并在极短的时间内针对医疗领域做了很强的优化,这实在太令人惊叹了。”孟繁岐对面,一位来自华尔街日报的记者开局先客套夸赞了两句。
上次在生成式智能事件当中,华尔街日报的报道最为中肯,因而孟繁岐对其印象很好,此次接受了华尔街日报的专访。
“三个月的时间,已经过了四分之一,不知道孟先生后续还有没有其他的计划?对最后取胜又有没有信心呢?”
“我回来之后查询了一下,霍尔姆斯的公司已经成立十年了,却一直没有检测过多少病例。如果她没有什么重大举措的话,我想胜负已经非常明显了。”
“除非是她要跟我比杂志封面,要论上杂志封面那我确实彻底输了。”