漆黑的会场,眼擎科技的这颗芯片是如何识别出不同颜色的?
751D·PARK 北京时尚设计广场,大绿罐,IF 2018 极客公园创新大会正在进行中。
场馆内光线并不明亮,以至于在不开闪光灯的情况下,即使不考虑噪点的问题,将我手里这台佳能 6D 的 ISO 调至 2000,依旧无法达到理想中的效果。
在眼擎科技创始人朱继志演讲临近尾声的时候,工作人员把现场的灯光全部关闭,只保留了两块大屏幕,甚至即便是坐在会场第一排,我们依旧没有察觉到已经有两名举着色卡的姑娘站在了舞台上。
让原本已经处于弱光状态下的会场,变得更加昏暗,眼擎科技想要做的事情是,用他们的产品来现场完成对于暗光成像的挑战。
朱继志拿出了一个装有识别软件的工程样机,用它对准两名模特之后,很快大屏幕上传来了实时的视频画面。这段演示用时极短,但却赢得了全场的掌声。当然,这并不只是出于捧场。
灯光熄灭的那一刻,全场都处于一片漆黑的状态,只有两块大屏幕可以提供些许微弱的光线。令人惊讶的是,在大家已经看不到模特衣服以及色卡颜色时,眼擎科技的设备却可以做到。
如果以其演示的应用场景来作为参考,他们在技术层面上已经实现了机器在微弱光线下对色彩的还原能力超越人眼。
眼擎科技是如何做到的?或许是大家共同的兴趣点。
让机器拥有超越人眼视觉能力的成像引擎芯片 eyemore X42
eyemore X42,一颗刚刚在极客公园创新大会上发布,眼擎科技口中的「全球首款 AI 视觉专用成像芯片」,也正是现场演示环节中那台设备真正的核心所在。
「创立这家企业眼擎科技,愿景就是给机器开发超越人眼视觉能力的成像引擎,给更多的机器配置视觉的中枢。」朱继志这样说道。
在他的眼中,eyemore X42 芯片,只专注于做一件事情——成像。它采用了全新的成像架构,具备很强的超大规模的计算机能力,里面加载了超过 20 种的全创新的成像的算法,感光度超过 40 万,单帧、单次曝光动态范围可以到 16 比特。
当然,在这些数字背后,一切并没有像我们看到的这样简单。过去的四年里,他们将大概三年多的时间花在了验证各种各样不同的光线环境,来让芯片能够适应复杂环境这件事情上。同时,为了提高芯片的成像性能,甚至把标准的视频压缩也去掉了。
眼擎科技是一家很年轻的公司,但朱继志却是一名实打实的老芯片人。在决定自主创业之前,他已经在芯片行业沉浸了八年多。
也正是之前那段长达八年的从业经历,让朱继志对于公司未来的发展趋势看的更加清楚:「我们是做芯片的,芯片是个硬件,但是我相信,未来是一个软件定义硬件的世界。」
因此在极客公园创新大会上,我们看到的 eyemore X42 从最底层成像的功能,到各种各样的成像算法、接口,预留了非常丰富的软件调用接口,他们把它做成了白盒式的成像芯片,支持各种各样开发的平台(包括 Windows、Linux、安卓、iOS),并且专门开发了直接连接 iPhone 的麦听口开发工具。
「之所以我们把它做成一个白盒,我们的目标是希望我们的芯片是给软件算法工程师来使用的,我们希望视觉算法工程师不需要懂任何硬件的知识,就能够精准的来控制前面成像的过程,大幅度的提升整个 AI 视觉的效率和准确率。」朱继志说。
很多时候,光线条件的好坏,并不是我们所能够决定的。日常的拍摄过程中,抛开摄影棚等预设好的场景,室外环境下,遇到弱光、逆光、反光等等光线条件较差的情况,在所难免。
个人拍照的时候我们等,又或者一些技术大牛们可以通过后期处理来进行补救,但很多时候即便是在一张照片上花费 3 个小时或者更多的时间,也并不一定能够得到我们理想中的效果。
之于企业或者特殊的应用场景,等,并不是解决问题的办法。自动驾驶汽车大概是最好的例子,一旦上路行驶,需要面对各种各样的光线条件,如果它作为「眼睛」的摄像头无法正确识别前方障碍物,很容易造成不可挽回的后果。
2016 年的时候,一辆特斯拉 MODEL S 在自动驾驶时发生车祸,导致驾驶员死亡。究其原因,正是由于在逆光以及反光的情况下,其所配备的摄像头无法识别前方车辆,才酿成了那起事故。
中国观察