计算机视觉，落地的技术与艺术

发布时间：2020-09-23 10:22 所属栏目：25 来源：网络整理

导读：从1956年的达特茅斯会议起,人工智能就深深地烙印在了IT技术的发展史上。60余年的发展、沉淀,已是“AI技术万口传,至今已觉不新鲜”。从概念到实践,从技术到产品,A

从1956年的达特茅斯会议起,人工智能就深深地烙印在了IT技术的发展史上。60余年的发展、沉淀,已是“AI技术万口传,至今已觉不新鲜”。从概念到实践,从技术到产品,AI技术已经在智能客服、智能家居、医疗诊疗、工业机器人、无人驾驶等领域多点开花。

计算机视觉技术堪称AI皇冠上的一颗明珠,不论是在技术深度还是商业应用方面都走在了行业的前沿。9月5日,腾讯云TVP AI技术闭门会遍邀计算机视觉领域的技术大咖、专家学者、资深从业者们一起线上论道,层层深入解构计算机视觉技术,从个性化的商业化实践中探索共性化的发展方向,为行业进一步发展勾勒出潜在的蓝图。

面向规模化落地的视觉AI技术

计算机视觉，落地的技术与艺术

“视觉AI技术严谨的叫法是计算机CV,在过去,AI是AI,CV是CV。最近几年伴随着深度学习的火爆,开始逐渐有了统一融合的趋势,所以有了现在的视觉AI。在To B领域,视觉AI技术已经渗透到了众多行业,开启了一轮规模化的落地之旅。”

优图实验室-昊天研究中心负责人 & 专家研究员郭晓威老师向与会者介绍了视觉AI技术的历史起源。他表示,视觉AI的基本任务就是读懂图像,目前为大众所熟知的商业化应用案例包括人脸核身、内容理解与广告推荐、泛娱乐、内容审核等方向。目前尤其是在教育、工业、支付、广电等行业有深度结合。

郭晓威表示,影响AI规模化、商业化落地的因素无非就三个:成本、安全和数据。

成本 :数据、设备、人才、市场培育与开拓,这些都需要大量资金的投入,成本高昂。

安全 :精度和可靠性,在某些领域比如医疗行业,AI能给的只是参考,对解决医生痛点的帮助不够大。

数据 :AI需要的数据尤其是细分场景数据的获取难,标注难,此外数据隐私的问题也是一大掣肘。

细分之下,又有5大规模化落地挑战需要解决。

挑战一:标注成本过高,如何降本增效

业界曾有过一种自嘲的说法叫有多少人工,就有多少智能。这一句话道出了标注成本过高的痛点,如何用技术的手段实现降本增效?郭晓威表示主动学习是一个有效的解决方式。主动学习的好处是不需要进行全量标注,经验下只需要小于标注总量的一半即可,这个过程可以边学习,边筛选,直至收敛。为此,他举了一个优图实验室在智慧医疗场景下糖网分级识别的案例。在这个案例中,腾讯优图基于信息熵与特征空间密度的主动学习,做到了同等效果下,标注成本节省超过一半,标注量级达到数十万时,节省成本可达百万级。

计算机视觉，落地的技术与艺术

挑战二:数据量太少,训练效果差,怎么办

第二个挑战在于数据量太少,影响到训练效果。在To C场景下,数据的获取方式相对容易,数据量也比较大,但在To B场景下却完全相反。这种情况下,样本增强,小样本学习(Few shot learning),GAN等技术就比较值得推荐。尤其是小样本学习,支持极少量样本训练,最大化利用存量的样本,以实现最大可能性的泛化效果。在货架商品识别与小样本学习技术方面,腾讯优图提出了样本构成、损失函数和后处理三个相对业界主流方案的创新点,实现了相对优化前提升10-30个百分点,与全量样本差距小于10%的显著效果。

计算机视觉，落地的技术与艺术

挑战三:数据太少,伪造行不行?

第三个问题其实是对第二个的追问,能不能通过数据生成的手段,或者说伪造数据的方式来弥补数据的不足。GAN是最近几年比较火的对抗生成技术,它的本质其实就是通过生成器来学习符合目标分布的数据,也就是所谓的“无中生有”。郭晓威表示,如果GAN的结果符合目标的真实分布,还是能起到一些作用。但是这种作用可能还是分场景,不见得每个场景都一定会有很好的效果,所以需要小心的设计。

计算机视觉，落地的技术与艺术

郭晓威提到一个车型识别的案例:白天场景下的车型识别对AI而言相对轻松,但在夜晚场景就难度陡增。一是因为这类数据量相对较少,另一个是光线昏暗也不利于人工标注。优图实验室的解决方案是利用CycleGAN的技术,通过大量使用白天数据自动生成、模拟夜晚数据,然后将模拟后的夜晚数据与真实夜晚数据混到一起训练,最终成功使夜晚识别效果大幅提升。

挑战四:商业场景多变,AI泛化能力差,调优又太慢

技术上而言,在一个特定场景下训练出的表现效果可以做到非常好,但换了场景以后效果就直线下降。解决方案上,技术手段要做场景迁移,常用的手段就是迁移学习,最简单的就是把目标数据标完之后再进行训练。但这种情况下需要大量的标注数据,从采集标注到训练,通常也需要较长周期。郭晓威推荐了领域自适应技术,可以快速适应新场景,具有成本低、效果好、普遍适用等优势。

计算机视觉，落地的技术与艺术

优图实验室针对领域自适应技术,提出了一个创新的ReID技术,具体原理及效果如下图所示:

计算机视觉，落地的技术与艺术

挑战五:AI需要海量数据,如何保护客户/用户隐私?

AI的成长需要海量的训练数据,从场景中来的数据能让效果最大最优化。但通常场景中的数据也涉及一个隐私问题,很多时候用户数据不能离开本地。有没有办法既能满足AI的训练,又能够保护用户的隐私呢?郭晓威分享了一个名为AceCV系统,它可以支持本地数据训练,模型自主进化与集成,实现方案基于领域自适应与模型集成等技术,完成端+云升级。

与联邦学习相比,AceCV系统不需要传数据和梯度,只需低频进行模型回传,同时具备自主进化模块和模型集成模块,保证场景模型持续低成本迭代、联合多场景优势升级云端模型。优图实验室去年创新地提出了滤波器嫁接技术(Filter Grafting),可支持多模型之间取长补短,互助升级。

计算机视觉，落地的技术与艺术

分享结束后,郭晓威老师还针对留言区提出的问题作了精彩解答,篇幅所限,此处不再赘述。

腾讯云视觉AI的商业化产品实践探索

计算机视觉，落地的技术与艺术

“顶天还是立地,改变世界还是努力赚钱?这是我本次分享的副标题,也是我们想与业界一起探讨的问题。”

（编辑：ASP站长网）