扩博智能CTO柯严:如何用计算机视觉数字化改变世界?
2019-02-27 15:42 扩博智能 严治庆 柯严

扩博智能CTO柯严:如何用计算机视觉数字化改变世界?

风电和零售行业落地的解决方案,共用的不是具体技术,而是技术储备。

文 | 李夜

计算机视觉如何数字化改变世界?

或许,可以从扩博智能的落地案例中找到答案。它横跨风机叶片巡检和零售快消两个领域,为它们提供特种飞行机器人全自动风机叶片巡检和实体零售数字化管理解决方案。即便风电行业和零售业在外界看来,毫不相干。

扩博智能成立于2016年11月,由四位微软前高管发起成立(文章末尾附四人简历)。博士多,是该公司的一大特点,研发团队有25%的博士及以上学历。扩博智能创始人兼CEO严治庆说,“在计算机视觉、机器学习、云计算和智能硬件领域,他们有十几年的经验,打好这个组合拳是扩博智能的核心技术优势。”

这群博士如何在两个看似毫不相干场景中大开脑洞,带着这个疑问,i黑马&黑智采访了扩博智能CTO柯严。

在回答这个问题之前,黑智先介绍一下柯严这位扩博智能技术灵魂人物的工作履历。和严治庆一样,他曾在微软工作,是Bing search(必应搜索)美国总部的研发团队负责人。

WechatIMG61

(柯严)

柯严2008年CMU卡耐基梅隆博士毕业后,进入西雅图的微软公司Bing必应团队工作,他从Web Index Selection项目开始成名,在当时就使用了Machine Learning的方法做Page Ranking,完全没有使用人工标注数据。

随后,柯严提出IE的Flip Ahead功能,通过机器学习的方法判断客户最有可能下一步点那个页面,在机器端进行提前加载,提升用户体验??卵洗?013年开始带团队做高难度知识图谱项目工作,Knowledge Graph有3亿个真实的用户使用场景对象,利用一万亿个互联网上的网页,服务于5亿用户。即便跑一个普通的任务,也需要使用高达数十万台的微软云端的高端虚拟服务器,该项目从开展到交付使用,仅用时四年,比同期谷歌项目缩短了一半时间。“我们没有利用外部资源或者收购第三方技术,完全是内部自有资源从头开始完成的。”

后来,他一直在思考如何能够把计算机视觉和机器学习更广泛地分享给更多企业。这可以为被看作柯严2016年出来创业的动机。再加上当时,一些硬件制造商可以生产带有高分辨率摄像头的智能硬件,比如无人机;一些软件公司在做数据分析平台,但都是割裂的,并不成体系。“我们当时决定做点和计算机视觉、智能硬件相关的事情,因为行业中一定会生成大量的数据。我们开始利用自身在企业服务和计算机视觉方面积累的能力,尝试帮助企业,把物理世界进行数字化。”

一开始,柯严他们构建了一个无人机平台,“数以千万计的无人机可以跟我们的数据中心相连接,我们的机器学习和计算机视觉的算法可以帮助我们去分析这些无人机采集的数据。”但他们很快发现由于无人机需要飞手,操作上对于普通人群有困难,企业购置的无人机多被闲置在角落,很难普及。

这让扩博智能意识到行业需要一个端对端的解决措施。“方法只有一个:软硬结合。我们把机器学习的算法应用在其中,来帮助这些企业去把所有的视觉化过程都完成,找到一个自动化的端对端的解决措施。”

柯严如是描述该方案,“例如在风电行业,企业一线工作人员只要按一个按钮,特种飞行机器人就会起飞。通过固态雷达+机器视觉+传感器,能够全自动飞行,跟踪叶片,然后拍照。拍完了,数据会传到云上,有深度学习可以自动识别,生成数据。你可以想象它是一个硬件+软件+算法的视觉的一个集成。

这台机器人就像是自动驾驶汽车一样,有固态雷达、摄像头、传感器,机器视觉算法等飞行控制算法等,通过中控来全自动的对飞机姿态,拍摄效果,飞行路线做定义,不需要人工进行干预。我们的算法会不断地进行优化,让整个飞行拍摄过程越来越有效率。因为是全自动的三维自动驾驶,所以不需要对风机,风场,品牌进行任何定制化的设置。”

这个方案最先被用到风电领域,风电行业是一个听起来陌生但体量却不小的领域。据悉,每年全球风电行业有 250 亿美金投入风电机运维当中。其中,中国约占市场的三分之一,还是全球增速最快的市场。在中国,有 10多万台风电机组,而且每年还在扩建,目前主要建设都是挑战更大的海上风机。

风电机运维痛点也不小。工程师需要爬到风机顶端,用绳索、梯子、昂贵设备做检查。一般情况下, 4 个人要花半天时间才能完成一次风机检查。每年,类似的检查需要两次。如果是在海上,运维的难度就不是一个指数级别的了,很多地方海上巡检和维修就是看天吃饭。

用机器人巡检叶片有几个优势: 一,更简便,比传统的巡检设备更快,巡检效率比过去高 10 倍;二,数据报告、生产速度提升了 8 倍,接近 10 倍; 三,在 30 分钟以内完成巡检,一个人监测就可以了,一个技术人员可以同时进行多个巡检;四,在清晰度、精度这方面,可以实现 1-3 毫米的高精度图片采集。

未来,扩博智能从风机叶片巡检切入以后,还会做预测和全生命周期的资产管理。“如果数据足够多的话,我们就可以知道在哪里搭建风车比较好,因为温度、天气(雨、雪、风沙)对风车影响很大,这会导致运营成本差别很大。如果我们能够拿到数据,就可以告诉风车厂应该在哪里造风车,在哪里造风车的维修成本是最低的。”

涉足零售行业是因为客户的一次需求,这个客户是“一个比较有名的饮料公司”。公开资料显示是可口可乐。“他们在上海每天派上千个人到店里查看货架、冰柜等,看重点的SKU瓶子摆得对不对,每个瓶子的数量够不够多、位置摆得对不对、有没有缺货。”和风电巡检一样,这也是一个耗时费力,数据难以可视化的枯燥、重复工作。

当这个问题摆到扩博智能的桌面上,柯严想到的是用计算机视觉来做。但是这需要解决一个如何识别海量SKU的问题。比如说像沃尔玛、家乐福这种大型超市,有10万种SKU,如果每个SKU都要训练模型的话,这个是完全不行的,因为人工标注的成本太高了。

扩博智能采取的方式是半自动化,“我们的工作是教会机器去联想 (More generalization), 通过相似度的方式去联想 (Similarity), 机器不需要知道A是什么东西,叫什么,但是机器知道A和B两个是同一样东西。我们使用少量的渲染过的照片,就可以开始学习识别了。而且可以在海量数据里找新产品,不认识的产品,数据量越大的时候,价值越大,找相似的产品越准确。”

在柯严看来,人工智能最终实现的是人和机器的结合,纯人工做太苦、太累,纯机器做又不太准确,而且需要大量的数据标注,最好就是人和机器的交融。任何学习也都是如此,双向互动最合适,要学会跟机器交流。“传统的机器学习,就是把大量的数据喂给机器,人是不知道机器要什么,机器也不知道它需要什么,这种方式最终也是可以做成的,但是成本是非常非常高的。”

和风电一样,在零售领域,扩博智能也是和大公司一起打造行业解决方案。这样做的好处在于头部企业的多样化需求和具有参考价值的行业标准,“今后,我们服务同类其它型公司会轻松很多。”据了解,打造实体零售数字化管理解决方案用了一年的时间。从最开始的小规模的POC测试,慢慢上量、上规模,2018年夏正式交付。

回到本文开始提到的问题,如何横跨两大看似毫不相干领域,并落地产品?

柯严提到,风电和零售行业落地的解决方案,共用的不是具体技术,而是技术储备。技术储备指的是,人才和经验。“机器学习Machine Learning自身的工具是相通的(Tooling), 对于人才来说,深度探讨理论知识很重要,除了算法数学好,还需要了解机器边界和限制,这就需要我们的人才除了有深度还有广度,也就是经验丰富。”

问及扩博智能在零售领域的积累,柯严认为两个方面:一,算法本身识别的模型。二,数据。“这个是最重要的,其他公司是没有的。我们花了很多时间,除了积累数据外,还开放很多工具和算法,数据积累速度变快,我们积累的数据比别人多,还比别人快。”

从某种角度来看,品牌公司跨界需要平衡,“做一个具体解决方案,如果你有很针对性地做,那你就做得深,但风险是很难扩展到其他领域。如果你一开始就做一个平台,希望平台是通用的,但最后可能发现平台不解决任何问题,平台对某一个领域能够解决80%的问题,但客户要求的是100%,剩下的20%怎么办?这需要平衡。”

2019年,扩博智能将全面开拓国际化市场提上日程。“现在,扩博智能已经开始做海外市场了,我们选的品牌商都是国际化的,他们的市场不只是在中国,也是全球分布,我们跟着他们一起做布局。现在,风电和零售业务已经在四个国家和地区落地了。”柯严在采访的最后说道。

扩博智能补充资料如下:

商业化

在风电行业,2018年10月,扩博智能发布风机叶片全自动巡检新品,正式提出“全自动”的风机叶片运维服务。并宣布与双瑞风电和上海电气等国内知名风电厂商达成战略合作协议;

2019年2月,扩博智能宣布与欧洲最大的风机运维商GEV达成战略合作共同拓展欧洲、北美、非洲等国际市场。

在零售领域,扩博智能已与可口可乐等国际知名零售品牌在全球多个地区建立战略合作,所供方案已在北美、东南亚等四个市场落地。

团队

扩博智能由四位前微软高管创立,成立于2016年11月。他们分别是创始人兼CEO严治庆,前微软大中华区副总裁;联合创始人兼CTO柯严是卡耐基梅隆大学机器视觉领域方向的博士, 曾经是微软Bing search的在美国总部的研发团队负责人,将微软Bing搜索业的市场份额从8%做到21%;

联合创始人兼CRO李炤在微软公司工作10年,专注商业解决方案构建与销售;联合创始人兼COO陈丽苹也曾经是严治庆在Microsoft Azure业务团队中的伙伴,负责在中国地区落地及运营微软Microsoft Azure和 Office365业务。

黑智签名档

黑智
文章评价
匿名用户
发布