MBA智库文档行业 IT互联网让机器学习得更快.pdf

让机器学习得更快.pdf

下载

用户#2702337

32页 | 1.67MB | 0次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

科大讯飞鹿晓亮让机器学习得更快深度学习在感知智能中获得巨大成功面向感知及认知智能的深度学习平台深度学习平台训练算法并行方式探讨主要内容深度学习平台对讯飞超脑计划的支撑计算智能感知智能认知智能能存会算能听会说、能看会认能理解会思考语音识别的血泪史 1920年代：RadioRex玩具狗 1950年代：Bell Lab Audry系统 6-70年代：DSP、DTW、Viterbi、HMM、DARPA 1980年代：特征提取、大规模语料、DARPA、NIST、Sphinx 1990年代：区分性训练、模型自适应、噪声鲁棒性、HTK 2000年后：更好的区分性训练技术等深度学习应用于语音识别像素特征边缘特征眼睛嘴鼻子猫老虎深度学习应用于语音识别声学模型 H M M 语言模型识别结果深度学习应用于语音识别 DNN RNN LSTM 大数据及云计算应用于语音识别柳传志致辞周光召致辞语音云启动仪式 2010年10月28日，“语音云”在业界率先发布，为手机、汽车、智能家电等终端提供高质量语音合成、语音搜索、语音听写等智能语音交互服务能力深度学习和大数据的力量 % 2011年1月基于上线数据首次更新 % 2010年10月28日语音云正式发布 % 2012年5月 DNN技术正式上线 95%+ 2013年7月 DNN并行训练技术获得突破，数万小时训练数据 % 2011年8月超大规模语言模型技术第二次更新未来几年将语音识别的句正确率提升到90%！图像识别同样获得巨大成功系统方法效果 DeepID3 DeepLearning % Face++ % DeepID2+ % DeepID2 % DeepID % DeepFace-ensemble % FR+FCN % GaussianFace 传统方法 % % TL JointBayesian % 人眼 % 深度学习在感知智能中获得巨大成功面向感知及认知智能的深度学习平台深度学习平台训练算法并行方式探讨主要内容深度学习平台对讯飞超脑计划的支撑超算是人工智能的关键要素 • 深度学习技术的再度崛起，正在颠覆统计模式识别、机器学习和人工智能领域，相关专家成为“香饽饽” • 大数据目前已经和深度学习融合，在语音识别及图像识别等感知人工智能方面发挥了巨大作用 • 超算平台是人工智能的基础，提供海量数据处理、存储以及高性能运算解决方案 组成部分 硬件组成 软件调度 支持业务 业务场景 大规模数据预处理 进行GMM-HMM等经典模型的训练 CPUs、4TB & 6TB、10Gb/s Linux & 监控体系 & 运维体系资源调度系统集群编程框架数据预处理特征提取 N- gra m …… 硬件架构软件架构业务支撑 CPU集群 组成部分 硬件组成 软件调度 支持业务 业务场景 进行Deep Learning相关模型训练，如DNN、RNN、 CNN等 Linux & 监控体系 & 运维体系资源调度系统集群编程框架 DNN RNN CNN …… 硬件架构软件架构业务支撑 GPGPUs、IB 并行文件系统 GPU集群 CPUs，10Gb/s Linux & 监控体系 & 运维体系资源调度系统集群编程框架硬件架构软件架构业务支撑 DNN RNN CNN …… GPGPUs、IB 并行文件系统集群文件系统 GMM HMM 融合调度界面程序开发任务提交在硬件层面，全局设计网络方案、融合文件系统；在软件层面，重新设计并揉和调度界面、使HPC&BigData开发一体化；以提升程序开发效率和流程执行效率。深度学习平台深度学习在感知智能中获得巨大成功面向感知及认知智能的深度学习平台深度学习平台训练算法并行方式探讨主要内容深度学习平台对讯飞超脑计划的支撑  Acoustic model DNN-HMM VS GMM-HMM  Computation of DNN in SR model parameters : more than tens of millions speech corpus: more than ten thousand of hours  Acceleration CPU – GPU – GPUs 深度学习应用于语音识别 Fig. 2 Model parallelism training corpus 深度学习应用于语音识别 Fig. 3 Data parallelism training corpus Tradeoff between Speed-up and Convergence training corpus GPU0 GPU1 GPU2 GPU3 Central Node Fig. 4 ASGD applied to multi- GPU in a server [4][6]  central node, high bandwidth requirement  conflict between model latency and efficiency 传统的异步SGD方案 ① get mini-batch from training corpus ② receive the model from the previous node, and merge the local gradient to generate a new model ③ send the new model to the next node and train the next mini-batch simultaneously Fig. 5 Ring structure parallel strategy for multiple GPUs GPU0 GPU1 GPU3 GPU2 ③ ② ① Training corpus ③ 环形并行学习策略 start point GPU0 GPU1 GPU2 GPU3 residual residual and so on ...... train time transmit time merge time Fig. 6 Timing analysis of the RSPS  asynchronous mode  no central node, one transmission per mini-batch for each node, low bandwidth requirement  easy to hide transmission 环形并行学习策略 start point GPU0 GPU1 GPU2 GPU3 residual residual and so on ...... train time transmit time merge time Fig. 6 Timing analysis of the RSPS [ (n 1) ] 0residual calc transmit mergeT T nT T     ca( ) +transmit merge lc mergen T T T T  overlap of transmission and computation calc merge transmit merge T T n T T    环形并行学习策略环形并行学习策略 max{ ,0} max{ ( 1) ,0}wait residual transmit merge calcT T nT n T T     　 single ( )calc merge multipe calc merge wait T n T T Speedup T T T T      calc merge transmit merge calc merge transmit merge T T n if n T T Speedup T T else T T               　　　　　环形并行学习策略 max calc merge transmit merge T T Speedup T T    • Tcalc (larger mini-batch, eg. rectified linear units) • Ttransmit (compress transmission data, eg. quantize the gradient) • Tmerge (overlap merging, eg. pipelining, hierarchical merging) 实验结论 Fig. 7 Relationship between the speedup and the number of GPUs 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 s p e e d u p the number of GPUs 深度学习在感知智能中获得巨大成功面向感知及认知智能的深度学习平台深度学习平台训练算法并行方式探讨主要内容深度学习平台对讯飞超脑计划的支撑讯飞超脑计划 • 讯飞超脑的三大研究方向： – 更加贴近人脑认知机理的人工神经网络设计，更好的支撑认知智能的实现 – 实现与人脑神经元复杂度可比的超大人工神经网络（相当于目前感知智能网络规模的1000倍） – 实现基于连续语义空间分布式表示的知识推理及自学习智能引擎中国国家美国日本英国北京 9,634,057 平方公里亿万北纬 38°56' 东经 116°20' 亿华盛顿 9,629,091 平方公里北纬 38°53′ 西经 77°02' 178 平方公里 16410 平方公里亿 377835 平方公里东京 2188 平方公里东经 140°50' 北纬 35°44' …… 人口讯飞超脑预期成果实现世界上第一个中文认知智能计算引擎！ • 通过模拟人脑的知识表示达到联想和推理 • 通过自动学习获取新的知识实现不断进化 • 通过自然交互（语音、文字）更加拟人化超算平台对讯飞超脑的支持数千倍训练数据及数千倍模型参数的巨大挑战！ • 更大规模的超算平台集群建设 • 更优的深度学习并行化算法及集群调度算法 • 深度定制的人工神经网络专属芯片 THANK YOU!

联系我们

智库文档公众号

客服微信

让机器学习得更快.pdf

下载

相关文档

相关专题更多

联系我们

意见反馈

相关文档

相关专题 更多

联系我们

意见反馈

相关专题更多