中国计算机视觉应用专题研究报告2016
——中国人工智能行业系列研究
2016/9/20 指数成长的比特动能 2
前言
研究背景
研究范畴
研究方法
本报告将针对计算机视觉技术发展的关键节点、市场现状及应用场景进行分析和研究。
本报告涉及的研究主体为:国内外应用计算机视觉技术的巨头和创业公司
资料来源:报告中的资料来源于对行业公开信息的研究、对业内资深人士和相关企业管理人员的深度
访谈,以及易观分析师综合以上内容作出的专业性判断和评价。
数据来源:易观根据公开资料整理
2016年,Alpha Go战胜韩国围棋选手李世乭再次引爆了全球对于人工智能的讨论和关注。计算机视觉
作为人工智能技术的基础,受到深度学习的成功影响在近几年内取得了突破性的进展,正在成为影响
行业发展的下一个引擎。巨头纷纷布局,市场也吸引了越来越多的人才创业参与其中。计算机视觉正
在成为人工智能最火热的细分领域之一。
2016/9/20 指数成长的比特动能 3
目录
技术发展及市场现状分析 1
技术应用场景及典型厂商分析
行业趋势分析
2
3
2016/9/20 指数成长的比特动能 4
人工智能是一场从终极概念到分级落地的技术演变
人工智能 定义 常见形态
人工智能
(理想)
人工智能
(现实)
理想的人工智能指的是通
过技术创造「类人」的机
器,使其具备人的感知能
力、表达能力和思考能力。
这是继1955年约翰·麦卡
锡提出人工智能概念的初
衷,但受技术局限目前远
不能达到这一目的,其形
态更多出现在虚构的影视
作品中。
现实的人工智能指的是技
术能够训练机器掌握某项
「近于人」的能力,将人
从最基础最单一的繁杂事
务中解放出来,作为工具
提高人的生活和工作体验。
这是目前学术界和工业界
共同努力的方向,伴随技
术的发展已经取得了一定
的成果。
2016/9/20 指数成长的比特动能 5
人工智能所依赖的基础设施已经就位,但当前仍属于早
期阶段
大数据 高性能处理器 云存储
机器学习(深度学习算法为主)
计算机视觉 自然语言处理 人机交互
行业应用/创新产品
创新者 早期采用者 早期大众 晚期大众 落后者
人
工
智
能
架
构
人
工
智
能
技
术
生
命
周
期
曲
线
图
(
横
轴
时
间
,
纵
轴
用
户
数
量
)
1955
年人
工智
能概
念诞
生
2000
年互联
网发展
进入拐
点,数
据量开
始逐步
增长
2012年
深度学
习算法
通过
Image
Net比
赛中名
声大噪,
进而被
广泛采
用
目前GPU芯
片/云计算成
本被大范围
使用;巨头
与创业公司
开始涌入,
探索应用及
商业化
2016/9/20 指数成长的比特动能 6
当前国内人工智能领域产业格局尚未成熟,上中下游均蕴含着不
俗的创业空间,但进入门槛较高
基础
设施
技术
研究
及
服务
行业
应用
传感器 芯片
中科寒武纪
云计算服务
操作系统 数据服务平台 网络运营商
计算机视觉
深度学习研究
自然语言处理 人机交互
机器人 虚拟个人助理 无人机 无人驾驶 智能安防 娱乐/营销 智能家居
智能医疗 可穿戴设备 金融
2016/9/20 指数成长的比特动能 7
计算机视觉是机器认知世界的基础,也是最主要的
人工智能技术之一
步骤1
产品1
步骤3
产品3
步骤2
产品2
步骤1
产品1
步骤2
产品2
步骤3
产品3
步骤1
产品1
步骤2
产品2
信息采集
(大数据)
目标检测
特征定位及提取
(模型训练)
人脸识别
图像识别
(识别反馈)
计算机识别的图像一类为静态
内容,以图片为主;另一类为
动态内容,包括视频和实景,
其中实景需要利用传感器技术
进行采集编码
将采集到的信息进行检测、
关键点定位及特征提取,给
定相应的数据和标签提交到
学习平台进行训练,提高识
别的精度
经过大量的训练之后,最终计算
机给予相应的识别反馈信息,主
要有人脸、物体、手势等。目前
计算机识别主要停留在感知的表
层,未来识别的广度与深度还需
要进一步的挖掘
国际主流计算机视觉比赛项目一览
赛事名称 运营方 赛事类型 数据库
ImageNet
ILSVRC
斯坦福大学视
觉实验室
图像识别
1千多万张图片,
共计2万多个标签
类别
FDDB
马萨诸塞大学
计算机系
人脸检测
2845张图片,共
包含5171张人脸
LFW
马萨诸塞大学
阿默斯特分校
人脸识别
超过13000张人脸
图片
COCO 微软
图像说明,
最多5种不同
的描述
超过30万张图片,
80种物体类别
2016/9/20 指数成长的比特动能 8
计算机识别准确度和识别类型多寡是影响计算机视
觉技术应用发展的基础因素
28%
26%
16%
12%
7%
%
0%
5%
10%
15%
20%
25%
30%
2010 2011 2012 2013 2014 2015
2010年-2015年ImageNet ILSVRC大赛冠军
团队识别分类的错误率
© Analysys 易观
深度学习的应用起到
了至关重要的作用
已超过
人眼
260
123
169
154
106
97
92
65
33
机器学习(应用)
机器学习(通用)
自然语言处理(应用)
自然语言处理(通用)
计算机视觉(通用)
计算机视觉(应用)
虚拟助理
机器人
手势控制
数据来源:易观根据Venture Scanner报告、中信证券报告及公开资料整理
© Analysys 易观
截至2015年全球人工智能细分领域创业公司数量
2016/9/20 指数成长的比特动能 9
受技术发展影响,计算机视觉正在带动全球新一轮
的市场热潮
21
11
机器学习
计算机视觉
智能机器人
手势控制
自然言处理
全球人工智能细分领域创业公司平均融
资额TOP5
(单位:百万美元)
2016/9/20 指数成长的比特动能 10
国内计算机视觉创业热度递增且深入行业,但处于
早期阶段
截至2016年第三季度国内计算机视觉创业公司一览
数据来源:易观根据IT桔子公开资料进行整理
公司名称 创立时间 融资轮次 投资方 创业方向
依图科技 2012年 B轮 高榕资本/云锋基金 安防/金融/互联网应用
格灵深瞳 2013年 B轮 真格基金/联创策源/红杉资本 安防/金融/无人驾驶/医疗应用
商汤科技 2014年 B轮 IDG/StarVC 安防/金融/互联网应用
旷视科技 2012年 A轮 联想之星/创新工场 安防/金融/互联网应用
Viscovery 2013年 A轮 汉鼎股份/起点创业营 广告营销/互联网应用
衣+ 2014年 A轮 乐博资本/优酷土豆合一集团等 电商搜索购物应用
图普科技 2014年 A轮 北极光创投 互联网应用
阅面科技 2015年 A轮 上海栩远投资 硬件等应用
云从科技 2015年 A轮 未透露 安防/金融/无人驾驶应用
图森科技 2015年 Pre-A轮 新浪微博 互联网/ADAS应用
图麟科技 2015年 Pre-A轮 同创伟业 工业检测/视频搜索应用
极视角 2015年 Pre-A轮 初心资本/中美创投等 算法平台
码隆科技 2014年 天使轮 达晨创投/远镜创投 时尚购物应用
泼辣熊 2014年 天使轮 真格基金 美图应用
2016/9/20 指数成长的比特动能 11
国外巨头自研和收购双管齐下布局,将视觉技术广泛应用于自身产品
升级,并基于自身基因打造技术服务平台和新品类持续提升影响力
Truven Health
Analystic,医疗数
据及分析公司
Faceshift
实时动作捕
捉技术公司
Fly Labs
图片编辑工具,并
入Google photos
• Perceptio 图像分
类体系技术公司
Pebbles
Interface
手势识别公司
Alchemy API
非结构化数据
实时分析公司
• 微软研究院Project
Oxford开放API为开发
者提供微软认知服务
(
or 均以此为基
础)
• 小冰商业平台发布图
像识别功能
• 存储应用OneDrive提
供图片识别创建标签
功能
• 搭建两大实验室分别
专注于基础研究与产
品应用
• 与谷歌、Vision Labs
合作推出通用计算机
视觉开源平台
• 推出智能照片管理应
用Moments
• 提供谷歌图像搜索功能
• 提供开源深度学习系统
Tensor Flow
• 打造结合计算机视觉等
多项技术的黑科技
Project Tango原型机
• 研发谷歌无人车
• 开放Cloud Vision API
帮助开发者创建具有视
觉识别功能的APP
• 提供Google Photos智
能识别搜索服务
• 研发Prime Air
无人机
Moodstocks
图像识别技术公司
Jetpac
图片数据分析应用
• 基于ios和
macOS提供
照片管理应
用
• 成立虚拟现
实项目团
队,研发相
关产品
• 收购欧洲
某家计算
机视觉公
司用于无
人机研究
(未对外
公布公司
名称)
Metaio
AR技术公司
Orbeus
图像识别
公司
Emotient
面部识别技术公司
• 打造
Watson
技术平
台,并
开放API
帮助开
发者创
建APP
Oculus
VR公司
Nimble VR
手势识别公司
对外收购
自主研发
2016/9/20 指数成长的比特动能 12
国内巨头百度相对激进,阿里巴巴、腾讯基于自身产品进行功能试水
B
A
T
• 深度学习研究院的基础研究
• 百度金融产品的审批应用
• 以图搜图的基本功能
• 无人驾驶
• 与协和医院合作食道癌基因测序
对内 对外
宣布成立独立风投公司,专注
于人工智能等早期投资
• 电商图像搜索—拍立淘的应用
• 支付宝应用人脸识别
• 蚂蚁金服生物识别技术小组推
出识别机器人“蚂可”
云锋基金投资计算机视觉公司依图
科技B轮数千万美元
开始密切关注海外机器学习创业公
司,寻找投资标的
• 腾讯优图团队对外提供鉴黄服务,
并为内部P图产品提供技术支持
• 微信事业群对图像识别自主研究
• 搜狗以图搜图功能
2016/9/20 指数成长的比特动能 13
目录
1
技术应用场景及典型厂商分析
行业趋势分析
2
3
技术发展及市场现状分析
2016/9/20 指数成长的比特动能 14
计算机视觉技术已应用于传统行业和前沿创新,安全/娱乐/营销成
最抢先落地的商业化领域
+自然
语言处
理
+人机交
互
+生物科
技
静态内
容识别
动态内
容识别
ADAS
无人驾驶
无人机
疾病辅助检测
技术要求及应用分类
......
......
VR/AR
计算机视觉
主导的应用
计算机视觉
与其他技术
结合的综合
应用
应用详情
工业
检测
......
照片管理
(标签分类检索/美颜
特效)
智能
安防
金融
服务
三维
分析
视频
平台
营销
直播
监管
搜索变革
(以图搜图/电商搜图购物)
2016/9/20 指数成长的比特动能 15
计算机视觉的应用从软硬件两个层面优化安防人员的作业效率和深度
应
用
场
景
目标嫌疑人定位
车型/车系/年份等维度识别
套牌车/假牌车识别
银行识别内部人员行为规范
以及厅内安全 民用家庭安防
作业方式 作业效率 有效监控距离
(图像达到稳定的最低可识别标准)
监控内容维度
传统安防 事后取证
原始录像文件,通过有限
的人工进行大量查看,逐
帧排查,耗时耗力
4-5米
二维信息,目标易因光
影变化或遮挡而丢失,
计算机容易漏报/误报
智能安防
事前布控
异常报警+
事后取证
将视频内容结构化之后,
利用实时大数据分析平台
进行智能搜索,便于快速
锁定目标
70-80米
(以格灵深瞳为例)
二维+三维信息,类人
眼方式进行实时追踪分
析,丰富计算机的识别
深度,提高识别精度和
复杂程度
应
用
价
值
产品支撑 软件层面
(大数据智能搜索及分析平台)
硬件层面
(创新式监控摄像头)
2016/9/20 指数成长的比特动能 16
计算机视觉的应用有效迎合直播平台的前端用户体验和后端监管要求
前端用户体验(运营优化)
后端监管要求(鉴黄刚需)
人工处理 —
智能处理
图像识别云平台
API调用
人工处理
依赖大量人工三
班倒审核色情/
暴恐/广告等违
规信息,管理难
且人力成本大
审核工具死板单
一,常出现误判
直播高峰多在深
夜,人工易疲惫,
审核效率和精度
易受影响
智能处理
调用第三方API
进行24小时不间
断审核
基于深度学习的
训练令识别更为
灵活精准,分担
人工审核的压力
主播人脸美化,
提高用户体验
海量直播内容
根据场景、颜
值等进行智能
分类推荐,刺
激用户活跃度
其他定制化要
求
+
2016/9/20 指数成长的比特动能 17
计算机视觉的应用促进视频环境中广告主和用户间交互闭环的落地
视频内容
识别视
频内广
告位
识别视
频内同
款物品
广告主
植入广
告
导流电
商平台
用户
广
告
营
销
电
商
购
物
人工贴标
耗时长
调用图像识别API
实现实时贴标
人工投放特定节目
内容,场景有限
调用图像识别API
不受场景限制实时识别
进行用户推介
2016/9/20 指数成长的比特动能 18
计算机视觉还将逐步拓展服务和工商业等多重应用场景
金融服务场景下刷
脸进行身份认证
工业检测屏幕质量
商场租铺分级管理
商场根据客流统计数据在店铺
招商过程中可进行科学定价及
营销管理
展品陈列
博物馆、展览馆根据展品的人
气调整陈列,提前预案
消费引导
识别消费者在货架前的购物行为,
可有针对性地推送广告
2016/9/20 指数成长的比特动能 19
计算机视觉作为基础人工智能技术,与其他技术融合共同推动创
新型行业应用的发展
ADAS/无人驾驶/无人机技术的发展面临的首要问题是对道路
上的关键目标物进行有效识别(比如对前方相同大小的垃圾袋和硬石
块,系统的反馈应该有所不同),在此基础上才能为驾驶员提供预警
或自动做出正确的判断和反应。
计算机视觉是VR/AR技术搭建视觉呈现模型、提供逼真的交互渲
染效果的核心基础。
针对癌症、疟疾等病理切片识别的疾病检测,可以有效地缓解医疗
资源匮乏、医术水平参差不齐等世界性难题,并提高医者的工作效
率。
2016/9/20 指数成长的比特动能 20
典型厂商分析——格灵深瞳
智能辅助医疗(独立运营孵化中)
计算机视觉+医疗科技
“格灵深瞳系”
2013年GoogleGlass核心成员
赵勇回国创立,扎根安防和商
业市场,提供大数据分析平台
2013年和2014年分别获得
数百万Pre-A轮融资和数千
万美元B轮融资
2016年研发智能亿级高清
摄像头,可将有效监控分析
距离延展至70-80米,预计
今年年底投入量产
2016年从格灵深瞳剥离成立独
立公司,前Intel研究院院长吴
甘沙任CEO,并获得格灵深瞳
数百万人民币的天使轮融资
2016年计划推出第一
批实验车进行道路测试
2017年计划走出商业化第一步
早期癌症等医疗影像辅助诊断
优
势
挑
战
• 技术复制:格灵深瞳正在将已有的技术优势迅
速复制到多个行业,形成矩阵,并成立独立团
队运营,这对拥有自研技术的创业公司具有一
定的借鉴意义。
• 市场创新:打造创新产品,提升细分市场的竞
争力。
• 市场突围:以安防市场为例,格灵深瞳既需要
面对海康威视、大华等传统成熟厂商在产品及
渠道上的压力,又面临商汤、旷视科技、依图
等人工智能创业公司在技术上的压力。
• 商业变现:投入成本高、研发时间长导致商业
化周期较长,考验市场运营及管理能力。
将三维视觉行为分析仪引入
商业分析市场
2016/9/20 指数成长的比特动能 21
典型厂商分析——商汤科技
2014年,商汤科技正式创立
2014年,获得IDG数千万美元A轮融资
2015年,达成Star VC数千万美元B轮融资
应
用
层
基
础
层
2015年11月,商汤建设支持超大规模深度学习计算的GPU超算集群DeepLink,
并推出深度学习专用服务器Sensebox
优
势
挑
战
为社交平台和手机厂商
提供智能相机和智能相
册解决方案
为公安/交通/楼宇/商超提供行业应用
智能解决方案;与上市公司东方网力
成立合资公司深网世界打造智能安防
产品;并购智能相机厂商新舟锐视
为互联网金融和传
统金融厂商提供身
份认证、VIP识别解
决方案
• 着力打造自有底层核心技术,兼顾
多点行业应用,打通从基础层到应
用层的链条,从长期来看,企业的
发展进程自主性会更强,在产业链
中也更易占据上游优势
• 短期来看,作为创业公司,商汤科
技的「产业链式」运营方式会增大
企业的成本压力、人才压力以及短
期回报压力,考验企业的管理能力
2016/9/20 指数成长的比特动能 22
典型厂商分析——图普科技
2014年,由原腾讯QQ邮箱及微信创业成员李明
强创立,以互联网刚需鉴黄切入市场
同年获得北极光数百万
美元A轮融资
2015年短视频、直播市场使
得公司业务得以迅速扩张
2016年在原有业务的基础上,利用图
像识别技术帮助直播平台进行内容分类,
精准推送
优
势
• 应用市场空间较大,布局较早,具
有一定的先发优势;
• 在保证原有业务增长的基础上,进
一步推出新的增值服务,增强客户
粘性,同时边际成本降低
挑
战
• 直播等市场格局尚未稳定,会有一
定的外部风险
2016/9/20 指数成长的比特动能 23
典型厂商分析——衣+
2014年张默创立图像
购物搜索引擎衣+
2014年获得乐博资本
及戴志康数百万RMB
天使轮融资
2015年获得优酷土豆
领投的1000万美元A
轮融资
优
势
挑
战
边
看
边
买
引
擎
对接内容
平台,
提供API
调用进行
商品识别
视频厂商-优酷土豆
电视厂商-乐视/小米
手机厂商-华为
其他平台-微博/360
图搜等
导流电
商平台
淘宝/天猫
京东
银泰
美丽说
蘑菇街
用户完成购买
支持400种场景识别,300种物体识别;
以服饰为最早的切入点,另有3C数码、
日用品、家居用品、车和交通工具等
• 拥有阿里系丰富的资源支持
• 顺应互联网公司变现压力
• 娱乐产业和消费需求爆发式增长,
VR/AR技术的发展,为衣+的发展
提供了土壤
• 内容平台的产品设计直接影响用户
体验,需要衣+作为技术平台与内
容平台共同探索,同时需要给予市
场进行用户教育的时间
2016/9/20 指数成长的比特动能 24
目录
1
技术应用场景及典型厂商分析
行业趋势分析
2
3
技术发展及市场现状分析
2016/9/20 指数成长的比特动能 25
行业评价
当前产业细分程度不足,市场处于早期探索阶段
B端需求强于C端,商业模式较为清晰
技术应用场景可复制性较强,拥有自研技术的团队容易享受技术
红利
实际应用的价值以提升效率为主,并非取代人类,而是辅助作
用,从业者需管理市场预期,耐心培育市场
计算机视觉创业投资成本巨大,行业壁垒高,对行业痛点的
洞察以及对产品性价比的控制是影响商业变现的关键因素
2016/9/20 指数成长的比特动能 26
趋势分析
… … …
底层
创新
识 别 深 度
应用
渗透
人工智能专用的
底层软硬件设施
(如操作系统、
芯片、存储等)
是目前的市场缺
口,这为垂直厂
商和创业公司提
供了巨大的市场
机会,将会成为
新的热点
与人相比,计算机的识别广度和深度
还有巨大的提升空间,因此数据量需
求将激增,掌握数据源的厂商将成为
争夺的焦点
预计未来5-10年间
将会是行业应用的
密集渗透期,这对
传统行业的发展进
程及组织架构将产
生深远的影响