取消
热搜词
热点资讯

广州地铁试点“刷脸”进站,人脸识别的发展令人惊叹!

    10月29日 HinaTA 热度:1161

导语:“刷脸”时代已经来了。

视觉是人类与生俱来的能力。

但要从1万个人中快速找到目标人物?这个任务对于人类来说,就显得力不从心。

不过,随着AI技术的发展,机器视觉已经可以替代甚至超过人类。现代社会中越来越多“看”的工作已经由机器来完成,比如刷脸支付、刷脸认证等。

人脸识别技术甚至还助攻警察破案。在2017年的青岛啤酒节上,人脸智能识别系统识别抓获了25名网上逃犯。此外,还成功比对涉毒前科人员71名,抓获吸毒人员19名,预警有扒窃前科人员37名,当场抓获扒手5名。

就在今天,广州地铁五个车站也开始试水三种新安检模式,分别是AI识别危险品、光波安检通道、“刷脸”安检门,在机器视觉的商业化应用上又迈出了一大步。

计算机视觉技术的不断发展,正在一点一点改变着我们的生活,不过回顾机器视觉的发展历程,是经过了几代人心血和汗水灌溉,才有了今天的成果。

(马文·明斯基)(马文·明斯基)

1966年,有一个非常有名的人工智能学家——马文·明斯基。他给学生们布置了一道非常有趣的暑假作业,让学生在电脑前面连一个摄像头,然后想办法写一个程序,让计算机告诉我们摄像头看到了什么。

不管是当时还今天,这道题都非常具有挑战性。

通过一个摄像头让机器告诉我们它到底看到了什么,这几乎代表了计算机视觉的全部。不得不说,能在60多年前就能提出一个如此超前的问题,的确是名副其实的大师。

因为这个问题的出现,1966年也被认为是计算机视觉(CV)的元年,也拉开了计算机视觉发展的大幕。

在今后长达半个多世纪的光阴里,为了解决这个问题有无人数前仆后继,发展方向也是几经调整,他们当中不仅有国外的专家学者,也有我们中国人的身影,在推动计算机视觉技术商业化应用落地上,我们更是写下了浓墨重彩的一笔。

01机器的“眼睛”

上个世纪七八十年代,随着现代电子计算机的出现,计算机视觉技术也初步萌芽。

人们开始尝试让计算机回答出它看到了什么东西,而解决这个问题的方法是,借鉴人类看见东西的方式。

一些人认为,人类能看到并理解事物,是因为人类通过两只眼睛可以立体地观察事物。因此要想让计算机理解它所看到的图像,必须先将事物的三维结构从二维的图像中恢复出来,这就是所谓的“三维重构”的方法。

但另一些人认为我们之所以能识别出一个苹果,是因为我们知道了苹果的某些特征,比如苹果是红色的、圆的、表面光滑的,如果给机器也建立一个这样的知识库,让机器将看到的图像与库里的储备知识进行匹配,是否可以让机器识别乃至理解它所看到的东西呢,这就是“先验知识库”的方法。

这两种方法是最直接的,但是效果却并不理想,这个阶段的识别准确度非常低。

到了九十年代,由于CPU、DSP等图像处理硬件技术的飞速进步以及新算法的引入和尝试,计算机视觉技术取得了更大的发展,并开始广泛应用于工业领域。

进入21世纪后,得益于互联网兴起和数码相机出现带来的海量数据,加之机器学习方法的广泛应用,计算机视觉发展迅速。以往许多基于规则的处理方式,都被机器学习所替代,自动从海量数据中总结归纳物体的特征,然后进行识别和判断。

这一阶段涌现出了非常多的应用,包括典型的相机人脸检测、安防人脸识别、车牌识别等等。

相机人类识别相机人类识别

而在2010年以后,计算机深度学习算法的兴起,为计算机视觉技术带来了爆发式增长和产业化。通过深度神经网络,各类视觉相关任务的识别精度都得到了大幅提升。

而在这一个黄金档口上,中国企业也开始迅速崛起。

02中国的“战场”

如果说计算机视觉的萌芽和发展是由国外主导,而计算机视觉落地应用的主战场应该是中国。

在中国多如牛毛的CV公司中,旷视、依图云从算是当中的佼佼者。

旷视科技

2011年8月第一款体感游戏《Crow Coming》发布,任谁也没想到,正是这款游戏拉开了中国计算机视觉时代的序幕。

开发这款游戏的团队叫VisionHacker,成员只有三个人:印奇、唐文斌和杨沐。两个月后,三人正式成立旷视科技,这应该是中国最早定位于计算机视觉的创业公司。

任 CEO的印奇和CTO唐文斌是 2006 届清华姚班同期,大二时又共同在微软亚研(MSRA)实习,只不过一个在人脸识别组,一个在图像搜索组。而担任工程副总裁、曾经的国际信息学奥赛金奖得主杨沐,则是两人的学弟。

三人早早便制定了旷视的“三步战略”:第一步,搭建 Face++ 人脸识别云服务平台,目标是识别人脸;第二步,搭建 Image++,目标是识别万物;最后,则是实现“所见即所得”的机器之眼。

在2014 年,经过两年的积淀和发展,旷视拿下FDDB评测(人脸检测)、300-W 评测(人脸关键点定位)和 LFW 评测(人脸识别)冠军,有力证明其算法水平之高,发展速度之快。

2015 年 3 月,在德国汉诺威消费电子、信息及通信博览会上,马云对着手机摄像头微微一笑,买下一枚 1948 年的汉诺威纪念邮票。

马云刷脸支付马云刷脸支付

这次面向世界的人脸支付场景展示,既宣告着人脸识别技术开始走向商业场景,同时也是旷视一次面向世界的技术展示:作为合作伙伴,其人脸支付认证技术已得到蚂蚁金服认可。

依图科技

而与旷视不同的是,依图科技的创始人朱珑说他创业是“一种感觉”。这种感觉是“计算机视觉离产业化非常近、非常近了”。

2012 年,正在麻省理工实验室担任博士后研究员的朱珑,在 UCLA 视觉识别与机器学习中心主任、导师 Alan Yuille 教授的支持下毅然回国。他拉上自己的童年好友、ACM 全球大学生程序设计竞赛冠军林晨曦,共同创办了依图科技。

广州地铁试点“刷脸”进站,人脸识别的发展令人惊叹!广州地铁试点“刷脸”进站,人脸识别的发展令人惊叹!

由于需要从海量视频监控数据中精准、快速找到要找的目标,安防领域有大量的视频、图像比对需求,是图像识别、特别是人脸识别技术的天然土壤。同时安防产品亟待智能化,这个市场既有需求,也有购买力。

基于此,朱珑定位的第一个产业化场景正是安防。

有技术、没客户,创业之初的朱珑和林晨曦坐在办公室里,罗列团队所有人的资源和人脉。

与大部分白手起家故事类似,最开始总是重重困难。当委托朋友的朋友、辗转找到一位公安局副局长时,朱珑只得到一句话:“我们现在套牌车的识别率不到30%,如果你们能将识别率提升到70%,就考虑用。”

两个月后接受测试时,依图给出满意的答卷。系统的号牌识别率和车辆品牌识别率都达到 90%。而系统上线时,正赶上一起入室抢劫案。通过过滤车辆品牌,警方十分钟便锁定了驾车逃离的犯罪嫌疑人。自此,依图便敲开公安系统大门。

2015 年,这套名为蜻蜓眼系统还获得了“公安部科技进步奖”

车辆识别之后,朱珑开始把精力放到人脸识别上。据称某省公安厅曾用依图的系统比对常住人口、暂住人口与通缉犯库,当天比中 17 个通缉犯,抓到 3 人。后来还传奇般的抓到一名背负 3 条人命,流亡 16 年的九华山住持。

云从科技

作为海归的周曦同样也有“计算机视觉离产业化非常近了”的感觉。

周曦,“计算机视觉之父”黄煦涛教授的得意门生。2011 年,他以中国科学院“百人计划”专家身份回国,拉上大学好友李继伟和温浩,组建了当时中科院最大的人脸识别研究团队。

为了拿到中科院战略性先导科技专项,周曦团队重新设计产品、更新算法、换感光设备,在新疆和重庆之间来回奔波了好几个月,最终击败其他团队,其人脸识别系统也被应用到新疆安防项目中。

2015年,偏居重庆的周曦悄悄创立云从科技,从成立之初,云从科技的目光一直紧盯着银行。

事实也证明,这是一次准确的选择。目前工商银行、农业银行、建设银行、中国银行均使用其提供的人脸识别软件,应用于柜台、直销银行、手机银行、网银等场景。

大型银行之外,西安银行、重庆银行、贵阳银行,海南银行等中小银行,广电运通、信雅达等大型银行系统供应商同样选择云从作为人脸识别供应商。

起步晚,发展快是中国CV的发展标签,而这三家公司用他们的努力和付出,在这场“机器视觉”大战中拔得头筹,不过这仅仅只是开始。

03CV的未来

三个故事讲述了三家公司的创业者从不同的方向推动了计算机视觉的发展。

虽然他们只是中国CV界公司中的冰山一角,但是足以窥得近年来国内计算机视觉技术发展的概括。

2013 年,旷视科技为 Face++写下:“最好的人脸识别云计算平台”的愿景;

2014年,依图科技完成红杉资本和高榕资本的A轮融资;

2015 年,偏居重庆的周曦悄悄创立云从科技,将目标定为只做人脸,深耕金融和安防。

……

他们从四面八方赶来,加入到这场正在上演的CV大戏,在这里他们竞相追逐,颇有一番你方唱罢我登场的韵味。

如今,云从的初心仍未改变,业务已渗透到四大国有银行;依图拿到2亿美元C +轮融资;旷视科技Face++现已成长为世界最大的人脸识别技术平台,距上市更进一步。

“如果我活到 70 岁,无论经历多少失败,我所做的事情一定会改变这个世界。”如今,有很多人都质疑中国科技界缺少这样的精神,但是在计算机视觉领域,我们可以清晰地看到有些人正在默默的耕耘、默默的坚持。

正如周曦所说,只有掌握核心技术,中国的人工智能技术才能在国际上保持领先。

对于周曦这一代计算机视觉专家来说,他们的时代,或许才刚刚开始。


新闻来源:隐技术