14703613720
贵州省六盘水市柳江区人近大楼9134号
浏览次数: 次 发布时间:2024-10-08 来源:
本文摘要:随着华为旗舰机型Mate 10将要公布,科技媒体争相爆料,华为Mate10将首次在智能手机历史上,配备一颗人工智能芯片。
随着华为旗舰机型Mate 10将要公布,科技媒体争相爆料,华为Mate10将首次在智能手机历史上,配备一颗人工智能芯片。只不过早于在华为半年业绩发布会上,华为余承东就透漏,预计将在今年秋季发售人工智能芯片,而根据目前近期的消息,这颗人工智能芯片近于有可能就是配备在麒麟970之中的寒武纪芯片。当然,目前Mate 10的最后规格还没有公布,明确还要期望10月16日的慕尼黑发布会,上述消息仅有是我们的合理猜测。
如果有误的话,意味著Mate 10将沦为全球首款不具备人工智能芯片的机型,这将不会为业界带给怎样的冲击?却是智能手机自乔布斯后,再行无革命性的范式变革。这毫无疑问是一个有意思而又最重要的问题,本文接下来将想到寒武纪芯片的前世今生,实质上这颗芯片更加准确地说道,是一款深度网络加快芯片,其本身并无梦幻的AI技能,而其加快功能,又到底能在何种场景上带给逆天的变化?寒武纪芯片是何方神圣?根据目前最新消息,麒麟970近于有可能通过IP许可的方式配备寒武纪人工智能芯片,本文这里再行解释一下IP许可这一概念。目前无论是高通骁龙还是海思麒麟,都不是严苛意义上的纯CPU芯片,而是一块SoC(System-on-chip)芯片。所谓的SoC即芯片上构建了若干有所不同的功能模块。
以高通骁龙801为事例,801上除了四核Krait 400 CPU外,还构建了Adreno 330 GPU、Snapdragon Camera照相机图像信号处理器、蓝牙、GPS、WIFI以及视频音频编解码等模块,上面的每一个这些模块一般来说都是SoC厂商上游的技术提供商通过IP(intellectual property,知识产权)获取许可,当然这样做到的益处是技术提供商可专心于IP方案设计,而芯片PCB工作可交由高通等SoC商负责管理,这样双方扬长避短,联合加快芯片的上市及改版递归速度。麒麟970上配备的寒武纪IP,主要用作深度神经网络(DNN)中的简单计算出来,而深度神经网络正是目前人工智能技术的半壁江山,这样一来麒麟970将沦为全球首款不具备人工智能处置能力的SoC芯片。
当然目前寒武纪这家公司对于大众来说还十分陌生,这里先对寒武纪展开非常简单的讲解。寒武纪科技(Cambricon)是中科院计算所产卵的一家独角兽公司,2016年发售的寒武纪1A处理器(Cambricon-1A)是世界首款商用深度自学专用处理器,面向智能手机、安防监控、可穿着设备、无人机和智能驾驶等各类终端设备,最近取得了还包括阿里在内的1亿美元A轮融资。这家正式成立于2016年的AI芯片公司以火箭般的速度发展,据寒武纪称之为,其在2016年早已构建了盈利并取得1亿元量级的营收。
而华为与寒武纪的合作,很有可能是因为华为与中科院计算所长久以来高昂的合作关系,早在2011年,华为就与中科院计算所正式成立了“中科院计算所-华为牵头实验室”。当然庙口还得自身软,寒武纪科技创始人陈天石教授是人工智能硬件加速的早期倡导者,连谷歌在其万众瞩目的人工智能芯片TPU的论文之中,全文共计提到了寒武纪团队成员公开发表的6篇论文,在全球人工智能公司中,能享用到谷歌如此待遇难道实属凤毛麟角。
而对于华为而言,在产品中不具备这样一个中国几乎自律知识产权的人工智能芯片IP,也许更为是一项营销利器。AI芯片将为手机带给何种计算能力?大家还忘记去年疯狂的俄罗斯修图应用于Prisma吗?Prisma用于了深度神经网络来提供知名绘画大师和主要流派的艺术风格,然后对用户的照片展开智能风格转化成,一张普通的照片通过Prisma能变为不具备令人惊叹艺术效果的作品,下面是一组示例:从技术原理上说道,Prisma用于了GAN对付分解网络,是一款典型的基于深度网络的人工智能应用于。但用过Prisma的人都告诉其实际体验并不是十分友好关系,在最初的时候,用户首先要上载待修的图片到Prisma服务器上,经过一段时间才需要iTunes讲和的作品。但随着Prisma的疯狂,用户云端等待时间更加宽,国内用户堪称要承受相连到俄罗斯服务器的爆高网络延后。
尽管后来Prisma构建了本地计算出来,但其速度依然较为较慢,部分风格滤镜必须计算出来10秒以上才能已完成图片切换,当然比起此前不能倚赖云端计算出来,其体验早已有所变革,但与美图等主流修图应用于的修图速度依然无法比起。Prisma上述这些体验的不极致,其主要原因是深度神经网络的继续执行必须大量的计算出来。
一般而言,创建一款如Prisma的人工智能应用于,必须通过训练(training)和推测(inference)两个过程:训练是通过大量的数据输出,或采行强化自学等非监督自学方法,训练出有一个神经网络模型,如对于Prisma来说,在训练过程中神经网络自学了大量的绘画风格。一旦训练已完成,才可用于由训练确认的权值展开计算出来,如Prisma中通过训练好的网络转变图像风格,这个应用于的过程被称作推测(inference)。
由于深度神经网络本身的特征,在推测过程中往往必须大量的权重计算出来,这在服务器端一般来说没什么问题,但一旦放到手机等设备上就有点捉襟见肘了。如Prisma的手机本地末端计算出来,虽然通过大量优化明显减少了模型的复杂度(当然这样做到的必要后果就是效果变差了),但对于手机CPU来说依然负荷相当大。这样一来问题就摆出来了,如果要让手机掌控更好的人工智能应用于,必须让手机不具备强劲的计算能力做到inference,否则用户体验无法确保,但摩尔定律却是放到哪,CPU本身目前无法不具备如此的计算能力,这就是深度神经网络在手机等各种嵌入式设备上的应用于难题。
这时候,深度网络加快芯片应运而生了。深度网络加快芯片是怎么一其实?在深度神经网络的应用于过程中,人们找到实质上简单的神经网络架构中计算出来量一般来说都集中于在少量的计算出来类型上,比如矩阵运算,如果设计一款专门优化的硬件芯片专门从事这些艰巨的计算出来,正如当年CPU对简单的图像运算力不从心,促成了GPU的经常出现,岂不把问题给解决问题了?业界显然是这样做到的,如谷歌自家发售的深度网络加快芯片TPU,定义了十几个专门为神经网络推理小说而设计的高级指令,比如矩阵运算、计算出来转录函数、加载/载入内存等,比起用CPU展开完全相同的计算出来,TPU的功耗效率(performance/Watt, 每耗电量1瓦的性能)比CPU高达80倍,右图所列的是谷歌TPU部分核心的高级指令。
这时候,大家是不是回想了比特币矿机中的ASIC(专用集成电路)呢?到底,深度网络加快芯片也是一款ASIC,只不过比特币的ASIC不能展开哈希运算,深度网络加快芯片则以定坐落于支撑若干种深度网络的常用计算出来。而华为Mate 10将要配上的寒武纪芯片,也正是这样的一款深度网络加快芯片。由于目前寒武纪芯片仍未月发布,其真实性能情况不得而知知悉,但从寒武纪科技自家去年在计算机架构顶级会议ISCA上公布的论文《Cambricon: An Instruction Set Architecture for Neural Networks》中,我们就需要管中窥豹。
论文中提到了寒武纪(Cambricon)是一款面向于目前神经网络技术,构建了常量运算、向量运算、矩阵运算、逻辑运算、数据切换以及控制指令等功能的深度神经网络加快芯片架构(…..we propose a novel domain-specific Instruction Set Architecture (ISA) for NN accelerators, called Cambricon, which is a load-store architecture that integrates scalar, vector, matrix, logical, data transfer, and control instructions, based on a comprehensive analysis of existing NN techniques.),其主要定位是解决问题深度神经网络中推测(inference)所牵涉到的简单计算出来问题。到此为止,华为Mate 10上的麒麟970芯片,所配备的人工智能模块就非常明晰了:与其说它是一块人工智能芯片,更加精确地说道是一块深度网络加快芯片,主要用作加快人工智能中深度神经网络所带给的简单计算出来。若真如此,华为粉丝们的盼望期望难道不会沮丧了,麒麟970本身会带给任何梦幻的智能,而是彰显了手机本身处置深度神经网络中前所未有的计算能力,让如Prisma等必须跑完在深度神经网络上的应用于需要有革命性的体验。
智能手机迈进智慧手机:场景为王麒麟970上的深度网络加快模块,如果要为业界带给冲击的话,我指出首先是让大家了解思维,在手机等移动设备中重新加入深度网络硬件加速,是否是一个未来的趋势?消费者否不愿为这块芯片买单?当然这个问题是很显浅的,其核心在于否能为消费者带给有价值的应用于场景。深度神经网络作为人工智能目前的半壁江山,其在智能语音、计算机视觉中有普遍的应用于,前者典型的应用于如Siri等智能语音助手,以及基于此目前疯狂得无法再火的智能音箱;而后者在消费末端要数各种类似于Prisma的修图应用于。通过深度神经网络,能构建图像编辑的智能化。
比如以往必须大量用户手工操作的瘦脸、美颜、瘦腰、纳长腿,通过深度神经网络的护持,用户可以如用于Prisma的体验一般,智能化搞定全部。当然图像智能编辑是目前计算机视觉中的热门应用于,未来期望还有更加多梦幻的应用于经常出现。对于很有可能配备寒武纪的Mate 10,这里大胆猜测一句,其广告语不会是“智能摄影大师”吗(大笑)?图像识别是另外一个应用于点,比如,用户在手机中标准了一张人脸后(比如同事A),通过图像识别,手机能把图库中所有所含同事A的照片都检验出来,这个运算在当前的智能手机上不会十分较慢,但有了深度网络加快芯片后显得有可能。
语音辨识是深度网络的另外一个核心应用于,目前我们都告诉,Siri、外出问问等语音助手都必须在联网的状态下才能用于,原因是语音辨识的inference放到了云端处置,而某种程度通过深度网络加快芯片,也许能构建手机本底端的辨识,即在无网络的情况下,仍然能用于智能语音助手构建有限度的应用于,比如让助手找到通讯录中符合条件的某个人。当然,车站在市场营销层面,有很多实质上并不需要深度网络加快芯片去加快的应用于,都可以通过误解概念的方式划入消费者的想象之中,比如拿起手机亮屏、在漆黑的环境中自动关上手电等。然而我们客观地说道,目前智能手机上必须用于到深度网络加快芯片去加快的应用于,并无法算数很多,其中确实能却是有效地市场需求的更为寥寥无几。
在安防摄像头、无人机、自动驾驶汽车中融合人工智能专用芯片毫无疑问是未来的明晰趋势,却是如无人驾驶汽车中,我们无法确信用于云端的方式去做到inference,却是网络一旦经常出现问题,怎么会视而不见汽车撞到树上?但智能手机这个充份竞争的领域,任何功能的革新都必须经过市场的长年考验,而其中的关键还是在于场景。而这次近于有可能配备了深度网络加快芯片的Mate 10,将不会为我们带给什么仍未想象到的场景?也许这点,才是我们确实必须盼望期望的。(公众号:)按:本文作者胡嘉琪,专栏投稿文章。版权文章,予以许可禁令刊登。
下文闻刊登须知。
本文来源:开云|kaiyun-www.zzdymsstm.com