更精细的对象表示方法RepPoints,抛弃了流行的边界框表示,结果与最先进的基于 anchor 的检测方法同样有效。
如今,谷歌的工程师置身于一条伟大存在链当中:始于1级,也就是底部的IT技术支持人员;2级是大学应届生,3级通常拥有硕士学位……
若成为10级的谷歌院士就是赢得一种终身荣誉,通常是各自领域的世界领先专家。
而Jeff和Sanjay是谷歌最高级研究员——该公司有史以来也是唯一的11级……
请看来自《纽约客》的文章:
2000年3月的一天,谷歌的六位顶级工程师聚在一间临时作战室。公司正处在前所未有的紧急状态。
去年10月,它的核心系统——通过爬梳网站建立索引——已经停止了工作。用户仍然能在google.com上输入查询信息,但得到的结果已经过期五个月了。风险远远超出了工程师的预计。
此时谷歌的联合创始人Larry Page和Sergey Brin正在洽谈强化雅虎搜索引擎的事宜,并承诺提供比自己现有大十倍的索引规模——这个体量可以媲美万维网,后者的规模在去年已翻了一番。
如果他们失败了,google.com将变成遗迹,和雅虎的生意很可能谈崩,公司将冒着烧光资金的风险,最后被人遗忘。
在这一间阶梯会议室里,工程师们给锯木架放上门板,然后装上电脑。Craig Silverstein靠墙坐得很远,他只有二十七岁,小身板,嗓子尖。Silverstein是Google的第一个员工:他刚加入公司的时候,还是在Brin的客厅办公,一个人重写了大部分代码。
这次他和罗马尼亚的系统工程师Bogdan Cocosel工作了四天四夜,毫无进展。“没有任何有意义的分析,” Silverstein回忆道,“一切都被破坏了,而我们一筹莫展。”
Silverstein几乎没觉察到,越过他的左肩,有一位三十三岁的Sanjay Ghemawat,浓眉黑发、两鬓稍灰,十分安静。他毕业于麻省理工。
Sanjay在几个月前加入了公司,那时是12月。他跟随了一位同事的脚步——三十一岁的Jeff Dean,他瘦瘦高高、精力充沛。他们都来自Digital Equipment Corporation,Jeff比Sanjay要早十个月离开。他们极其要好,而且喜欢一起写代码。
谷歌11级工程师:Sanjay Ghemawat
在作战室里,Jeff把椅子推到Sanjay的桌前,自己的桌子空着。Sanjay敲着键盘,Jeff就倚在一边,像个制作人对新来的主播那样唠唠叨叨。
Jeff和Sanjay开始研究熄火了的索引。他们发现有些词语不见了——他们搜索“邮箱”没得到任何结果——其它结果的顺序完全是乱的。这些天他们一直在寻找代码的漏洞,沉浸在编程逻辑里,上上下下都检查遍了。他们找不到错在哪里。
程序员有时会将软件想象成一种有层次的结构,从顶层的用户界面,下降到越来越基础的层次。冒险进入这种结构的底层,即软件与硬件的交汇之处,就背离了理想的代码秩序,而转向它所凭依的电与硅的元素世界。
在作战室的第五天,Jeff和Sanjay开始怀疑他们要找的问题不是出在逻辑上,而是在物质上。他们将混乱的索引文件转换为原初形式:二进制代码。他们想知道机器能观察出什么。
Sanjay的显示器上出现了一大串1和0的粗体,每行代表一个索引词。Sanjay发现:一个应该是0的数字是1。当Jeff和Sanjay将所有来源错误的词放到一起的时候,他们看出一个规律——每个词都有同样的问题。机器的内存芯片不知怎么被搞坏了。
Sanjay看着Jeff。谷歌在这几个月经历了越来越多的硬件故障。问题在于,随着谷歌的壮大,它的计算基础设施也在不断扩大。在你拥有足够的计算机硬件之前,它很少会出问题——但之后它会一直出问题。
谷歌11级工程师:Jeff Dean
电线磨损了,硬盘坏了,主板过热了。许多机器从未开始工作;有些会莫名奇妙地变慢。奇怪的环境因素也会产生影响。当超新星爆炸时,爆炸波会产生向各个方向散射的高能粒子;科学家认为,有一种微小的可能,让宇宙射线的一个出轨粒子能够击中地球上的计算机芯片,把一个0拨到1。
世界最强大的计算机系统,比如在NASA、金融公司,使用可以容忍单个字节变动的特殊硬件。但谷歌的运营像一家初创公司一样,买的是更便宜的缺少这项功能的电脑。公司已经到达了一个转折点。它的计算集群已经如此庞大,以至那些少见的硬件故障都会变得很普遍。
中国观察