第二章 人工智能应用案例
学习目标
�����了解人工智能技术在城市治理领域的应用。
��了解人工智能技术在教育领域的应用。
��了解人工智能技术在制造业领域的应用。
��了解人工智能技术在医疗领域的应用。
��了解人工智能技术在构建用户画像、智能推荐领域的应用。
阿里云城市大脑
科大讯飞英语听说智能测试系统
海尔COSMOPlat工业互联网平台
腾讯觅影
爱奇艺智能网络视频云服务平台
阿里云城市大脑
需求背景
���我国的信息化建设已经取得了阶段性成果,并积累了海量数据。然而,各部门采用的信息化管理系
统和平台大都按照传统的信息化模式建设,建设标准和运行模式不统一,不能很好地互通和协同运行,
这导致了信息孤岛的产生。各类数据资源相互割裂,数据的共享和开放程度低。这种情况下不能很好地
挖掘和利用数据的价值。城市大脑可以很好地解决上述问题。
���1.城市治理模式突破�
���以城市数据为资源,解决城市治理中的问题,实现城市治理智能化、集约化、人性化。�
���2.城市服务模式突破�
���随时随地为组织和个人提供针对性服务,使城市服务更加高效,同时有效节约城市公共资源。�
���3.城市产业发展突破�
���共享、开放的城市数据是重要的产业发展资源,对产业发展起着催生、带动作用,能促进传统产业
转型升级。
阿里云城市大脑简介
����2016年,阿里云发布了智能城市解决方案——城市大脑。城市大脑是基于云计算、大数据、人工智
能、物联网等新一代信息技术构建的人工智能开发创新和运营的平台。城市大脑通过阿里云数据资源平
台对企业数据、公安数据、政府数据、运营商数据等多种城市数据进行汇聚,同时应用机器学习算法等
人工智能技术,对城市运行状态进行全局的实时分析,及时修正运行缺陷,推动城市可持续发展。
阿里云城市大脑简介
��阿里云城市大脑架构主要分为“云”“脑”“端”3层。
(1)稳定的“云”
“云”通过视频联网平台城市基础网络、物联网平台和区块链平台等进行全网数据实时汇聚,让数据
成为城市的资源。城市大脑能保障数据的安全性,提升数据质量,通过数据调度发挥数据价值。其中,
飞天云平台为城市大脑提供足够的计算能力。
(2)强大的“脑”
“脑”使用数据和业务双中台架构,通过云计算、大数据以及互联网高可用技术,优化和完善城市运
行管理业务体系,实现各个环节与各部门之间的无障碍沟通,实现数据及时上传,消除信息孤岛现象。
“脑”通过深度学习技术和各种机器学习算法挖掘数据资源中有价值的信息,让城市具备“思考”能力。
(3)灵活的“端”
“端”基于各种应用场景构建各种信息技术服务,包括交通治理、智慧应急、智慧监管等,这些信息
技术服务给政府和社会公众带来便利,构建绿色、低碳、环保的智慧城市,推动产业生态的繁荣发展。。
阿里云城市大脑简介
阿里云城市大脑简介
���阿里云城市大脑的技术支撑。
�(1)性能成本双领先的大数据计算能力
���城市大脑采用阿里云自主研发的云原生大数据计算服务MaxCompute进行海量数据计算。
MaxCompute是一款性能高、成本低,运算效率高的大数据计算集群。
�(2)海量多源数据规模化处理与实时分析
���城市大脑实时汇聚全网数据,让数据成为资源,可实现EB级的数据存储和PB级别的日均数据处理能
力,以及计算请求秒级响应。
��(3)实时视频识别及自动巡检
���城市大脑利用图像识别技术实时分析杭州3000多路视频,视频利用率显著提高,实现车辆图搜以及
视频实时自动巡检,在特定光照条件下,低分辨率车辆检测准确率有效提高。
�(4)类脑神经元网络物理架构
���城市大脑在百亿节点万亿边级别网络上处理EB级别数据,通过模糊认知反演算法,发现复杂场景背
后的关联情况,已成功应用到道路交通、工业制造和其他领域。
阿里云城市大脑简介
���阿里云城市大脑的技术支撑。
�(1)性能成本双领先的大数据计算能力
���城市大脑采用阿里云自主研发的云原生大数据计算服务MaxCompute进行海量数据计算。
MaxCompute是一款性能高、成本低,运算效率高的大数据计算集群。
�(2)海量多源数据规模化处理与实时分析
���城市大脑实时汇聚全网数据,让数据成为资源,可实现EB级的数据存储和PB级别的日均数据处理能
力,以及计算请求秒级响应。
��(3)实时视频识别及自动巡检
���城市大脑利用图像识别技术实时分析杭州3000多路视频,视频利用率显著提高,实现车辆图搜以及
视频实时自动巡检,在特定光照条件下,低分辨率车辆检测准确率有效提高。
�(4)类脑神经元网络物理架构
���城市大脑在百亿节点万亿边级别网络上处理EB级别数据,通过模糊认知反演算法,发现复杂场景背
后的关联情况,已成功应用到道路交通、工业制造和其他领域。
阿里云城市大脑实践应用
���1.城市事件感知与智能处理
���城市大脑通过视频识别交通事故、拥堵状况,融合互联网数据及接警数据,即时、全面地对城市突
发情况进行感知;结合智能车辆调度技术,对警车、消防车、救护车等各类特种车辆进行联合指挥调度,
同时联动信号灯,让与紧急事件相关的车辆优先通行。城市大脑增加了被智能发现的事件的数量,降低
了响应和处理事件的平均时长。
���2.社会治理与公共安全
��城市大脑用视频分析技术为整个城市建立预警体系,使有关部门能够采取预防措施,确保公众的安全。
城市大脑能加强安全保障,缩短应急响应时间,实现防患于未然
阿里云城市大脑实践应用
���3.交通评价与信号灯配时优化
���城市大脑通过高德地图实时定位、视频数据的融合,对高架和地面道路的交通状况进行全面评价,
精准锁定拥堵地点,分析拥堵原因,通过对信号灯配时的优化,降低拥堵指数,缩短通行时间。
���4.公共出行与运营车辆调度
���城市大脑通过视频数据、来自高德等位置服务提供商和运营商的数据对人群密集区域进行有效的监
控,测算所需要的运力。城市大脑根据运力需求调整和规划公交车班次、接驳车路线、出租车数量,降
低重点场馆与重要交通枢纽的滞留率,提高公共出行的效率。
科大讯飞英语听说智能测试系统
需求背景
��随着国际交流的日益增多,英语交流能力越来越重要。虽然国家、社会、学校都很重视英语教学工作,
但是由于缺乏有效的评估和教学手段,“哑巴英语”等现象仍然大量存在。目前,全国很多地区都已开
展高考英语听力考试和口语加试,在未来的教育中,英语听说考试将占据越来越重要的地位。
科大讯飞英语听说智能测试系统简介
���科大讯飞英语听说智能测试系统实现了英语听说考试全过程的自动化与智能化,该系统由考试信息
管理、试卷制作、现场考试、评分4个子系统构成,支持短文朗读、情景反应、角色扮演、口语表达、话
题复述等主流题型。
科大讯飞英语听说智能测试系统简介
���科大讯飞英语听说智能测试系统的核心技术为科大讯飞语音评测技术,如图2-8所示。科大讯飞语音
评测技术能自动对发音水平进行评价,识别错误发音,进行缺陷定位和问题分析,分析维度包括准确度、
流畅度、完整度、意群停顿、连读、重读、句末升调,每一维度都能得到对应的评测结果。科大讯飞语
音评测技术的评测对象可以是词、句、篇章,也可以是音节、音素等更细节的维度。科大讯飞语音评测
技术主要可分为两个部分:中文普通话发音水平自动评测技术和英文发音水平自动评测技术。
科大讯飞英语听说智能测试系统实践应用
���在2012年广东省科技鉴定中,科大讯飞智能语音评测技术的计算机评分相关度超过所有专家,平均
误差低于所有专家,整体效果方面全面超过人工评分。
海尔COSMOPlat工业互联网平台
需求背景
���在制造强国目标的号召下,许多制造业企业积极探索数字化转型、高质量发展之路。然而,在这一
过程中,企业往往会遭遇用户需求难以把控、设备管理流程混乱、质量问题难以追溯等一系列问题。如
果这些问题得不到妥善解决,企业就难以实现数字化转型和高质量发展。COSMOPlat利用自身技术、经
验和资源的优势,构筑工业互联网解决方案资源池,为各类型企业提供智能制造、数字化转型全流程服
务,助力企业提质增效,促进产业融通发展。
COSMOPlat工业互联网平台简介
���COSMOPlat通过实时采集设备资产数据,对资产进行在线实时监测和管理,并根据资产模型和运行
大数据,优化资产价值。例如,采集设备实时数据,结合设备机理分析和建模,实现预测性维护,提升
效率、降低成本。
COSMOPlat工业互联网平台简介
���海尔互联工厂以COSMOPlat为核心,集成了虚实融合双胞胎系统、射频识别RFID、智能相机、双
臂机器人、自动导引车AGV、网络安全等多种智能系统、设备和技术。用户可以应用在线交互设计平台,
自主定义所需产品。平台整合用户需求并形成用户订单,引进相关资源在线开展虚拟设计。订单可直达
工厂与模块商,自动匹配所需模块部件,再通过自动引导车与空中积放链等智能物流系统实现按需配料
和立即配送,全流程追溯和可视化制造过程信息数据。COSMOPlat不仅使海尔实现了冰箱、洗衣机等电
器产品从个性化定制、远程下单到智能制造的全过程,同时也实现了智能产品和智能制造的全流程无缝
连接。
COSMOPlat工业互联网平台实践应用
���1.工业制造故障分析检测
���为了更好地服务于工业制造领域,COSMOPlat自主研发了工业大模型COSMO-GPT。工业大模型
COSMO-GPT以开源通用大模型为基础,通过知识注入、模型融合、模型判决,提升其在工业制造领域
的表现。目前COSMO-GPT已在服装、化工、家电、能源等多个行业的不同工业流程中得到应用。
COSMO-GPT通过事先学习生产线上各种设备的故障代码及相应的处理方案,在生产线遇到问题之后,
它能够快速识别出是哪条生产线的哪个设备出了什么样的故障,以及该故障应该如何去维修,并将相关
信息及时告知运维人员,极大地节省了设备维修的时间。
COSMOPlat工业互联网平台实践应用
���2.工厂智慧安全管控
���某企业中央空调工厂存在员工行走越界、闯入叉车车道或叉车行驶越界、闯入人行道的问题,给工
厂的安全生产造成了隐患。COSMOPlat为该企业打造了智慧安全云平台。通过平台算法,实现叉车智能
识别,智能判断员工及叉车是否各行其道。如果出现员工进入车道的情形,即时预警播报;如果出现叉
车驶入人行道的情形,则控制车辆,自动锁车。同时在叉车作业区域布控多个摄像头,标定叉车坐标,
根据叉车行驶路线,智能计算员工安全操作区域。在叉车作业过程中,如果发现员工出现在危险区域内,
即时通过声控播报预警,同时报告安全管理人员,实现对企业工厂智能、高效、安全的全方位监控。
腾讯觅影
需求背景
���随着医学成像技术的不断进步,X光、超声波、计算机断层扫描CT,核磁共振NMR、消化道内镜、
眼底照相等新兴医学成像技术的发展突飞猛进,各类医学图像数据呈爆炸性增长。在传统临床领域,医
学图像的判读主要是由医学影像专家、临床医生来负责的,日益增长的医学图像判读需求给医生带来极
大的挑战和压力。随着计算机技术的不断突破,计算机辅助医学图像的判断成为可能,并且在临床辅助
诊断中所占比重逐年增大。相较于人工,计算机可以有效提高判读速度,降低误判率,减少医生工作量
和压力。
腾讯觅影简介
�2017年8月3日,腾讯公司发布了将人工智能技术运用在医学领域的人工智能产品——腾讯觅影。腾
讯觅影数智医疗影像平台由觅影影像云提供多模态医学影像云端存储和应用,并面向患者提供云胶片服
务;针对有科研诉求的企业、院校,通过开放实验平台的算力、资源开展人工智能模型训练,并最终实
现将成熟人工智能应用于临床场景的目标;同时,可将开放实验平台的实验数据用于临床示教实训体系,
以提升临床人员的实操技能。
腾讯觅影简介
��腾讯觅影的核心功能是AI辅诊开放平台,主要提供智能导诊、病案智能管理、诊疗风险监控三大功能。
AI辅诊开放平台旨在依托腾讯觅影在医疗领域积累的医学知识图谱、诊断模型、病情理解、名医专家库
等AI辅诊基础能力,深度切入医院的疾病预测、辅助决策、数据分析等应用场景,提供一站式的服务。
腾讯觅影简介
���AI辅诊开放平台的核心功能:
���1.智能导诊
���智能导诊是AI辅诊开放平台推出的功能,通过切入疾病预测的分诊导诊这一细分场景,可以根据医
院需求定制导诊系统,为患者提供智能服务,缓解医院分诊导诊的咨询压力。
���2.患者档案管理
���患者档案(Smart�Medical�Record)是为医生及患者双方提供医疗报告存、查、用功能的智慧电子
云病历。人工智能医疗文本结构化能力将自动解析、整理患者上传的报告,患者可随时随地在手机端查
看、使用。患者上传数据后,人工智能医疗文本结构化引擎可分析报告类型,回收数据均可通过可视化
图表快速掌握。医生可随时在医生端查看患者上传的病历资料,管理患者,提供诊后智能随访、量表下
发、患教触达等多种服务。
腾讯觅影实践应用
���通过对大量学科知识、临床数据以及专家临床经验的深度学习,“腾讯觅影”青光眼筛查功能建立
起了专业的诊断模型,实现对眼底视盘与视杯区域高精度、像素级的分割,智能化精确计算具有重要临
床意义的杯盘比等参数,辅助医生实现快速且稳定的临床参数计算,从而实现对青光眼,尤其是早期青
光眼,进行高精度智能判别,准确率超过95%,有助提高青光眼筛查的效率,弥补青光眼诊断专家稀缺
的问题。
爱奇艺智能网络视频云服务平台
需求背景
���作为国内较大的网络视频分享平台,爱奇艺每天处理上万小时的新增视频,产生千亿条的用户日志。
这些海量的内容蕴藏着很高的价值,也对网络视频行业发展提出新的挑战。首先,面对海量的内容,视
频平台急需优化生产和审核流程,提高内容生产的效率,为用户提供更加便捷、优质的服务。其次,面
对海量的内容,用户的选择成本太高,视频平台需要为用户挑选和推荐他们感兴趣的优质内容。最后,
粗放投放为视频平台带来高额的营销成本,视频平台需要精准的广告投放和精细化的商业运营。
爱奇艺智能网络视频云服务平台简介
���为了应对挑战,爱奇艺推出智能网络视频云服务平台,该平台搭载功能完备的智能网络视频云服务
系统。该系统可自动对视频进行智能识别、处理,大幅度提高生产效率,并通过智能算法对用户行为大
数据进行分析,构建用户画像,提供精准的个性化推荐。同时,该系统支持商业合作伙伴进行精准营销
和广告投放,通过“闪植”和“随视购”技术,创新性地打通了电商系统和视频系统,实现“视频内物
品所见即所买”的精准投放。
���爱奇艺智能网络视频云服务平台架构包括基础层、感知层、认知层、平台层�和应用层。
爱奇艺智能网络视频云服务平台简介
���基础层:提供人工智能服务所需的算力、数据和基本算法,极大地降低了对本地硬件设备和软件系
统的要求,减少了运维成本和风险。
���感知层:模拟人的听觉、视觉,实现语音识别、图片识别、视频分析以及增强现实虚拟现实
(Augmented�Reality/Virtual�Reality,AR/VR)配准渲染等功能。
���认知层:模拟大脑的语义理解功能,实现自然语言处理、知识图谱的记忆推理和用户画像分析等功
能,构成爱奇艺智能网络视频云服务平台的大脑。平台层通过开放服务接口,为应用层的视频创作、视
频生产、内容分发、社交互动、商业变现等上层应用赋能。
���应用层:最主要的应用系统为智能视频生产系统、智能内容分发系统和智能商业变现系统。
爱奇艺智能网络视频云服务平台简介
�����应用层系统主要是智能视频生产系统、智能内容分发系统和智能商业变现系统。
����1.智能视频生产系统
����智能视频生产系统依托音视频智能识别技术,实现基于内容的视频拆条、视频标注和视频审核。爱
奇艺自主研发基于卷积神经网络(Convolution�Neural�Network,CNN)的深度学习技术进行高精度
明星识别、情感识别、物品识别和场景识别,基于双向长短期记忆(Bidirectional�Long�Short-Term�
Memory,BLSTM)网络进行视频字幕识别、语音识别、语义标注和封面图识别。
���2.智能内容分发系统
���智能内容分发系统是在大数据分析和人工智能技术的基础上,通过研究视频内容和用户的兴趣偏好,
进行个性化推荐;通过社交网络宣发和热点发掘,给用户提供高质量的个性化内容,解决信息过载的问
题,更好地满足用户的需求。
爱奇艺智能网络视频云服务平台简介
���3.智能商业变现系统�
���智能商业变现系统利用人工智能技术充分挖掘视频内容的价值,包括闪植广告、随视购广告、智能
票房预测等系统。它通过大数据分析,对用户的浏览、点击、购买等行为进行统计和监测,可以进行用
户群体定位和商品的流行性预测,更好地指导商家生产用户需要的商品,及时调整广告的投放策略,促
进商品销量增长。
爱奇艺智能网络视频云服务平台实践应用
���该系统投入使用3年后,视频数量增长了约20倍,但员工人数仅增长了约2倍。通过人工智能技术,
剪辑视频中精彩片段的效率提升了倍。
���通过人工智能技术,实现了每天为几十万用户生成内容(User-Generated�Content,UGC)视频
自动生成封面图。
���通过情感识别技术则将三维卷积神经网络和循环神经网络模型应用到情感识别领域,准确地捕捉表
情的时序变化,协助视频推广人员发掘视频中的精彩片段。
���智能内容分发系统建立了精准的用户画像,使用人工智能技术赋能个性化搜索推荐,进行高效的内
容分发。
��智能商业变现系统打通了内容生产、人机交互和电商服务的各个层面,增加了爱奇艺作为网络视频平
台的广告和商业价值。
THANKS
谢谢