设为首页加入收藏
国际站登录注册帮助

华为发布两款AI芯片,单芯片计算密度达全球最大

时间:2018/10/11 16:49:28 来源:打印

 “之前一直传华为要做AI芯片,这确实是真的。”华为轮值董事长徐直军在今天上海举行的第三届HUAWEI CONNECT 2018(华为全联接大会)上如是说。

  徐直军表示,今天AI再次进入了“收获”的季节。这是60年来全球ICT学术界和工业界长期耕耘,相互合作的成果。如同公元前的轮子和铁,19世纪的铁路和电力,以及20世纪的汽车、电脑、互联网一样,华为认同:人工智能是一组技术集合,是一种新的通用目的技术(GPT)。

  在上午的主题演讲环节,徐直军提出了10个人工智能的重要改变方向:模型训练、算力、AI部署、算法、AI自动化、实际应用、模型更新、多技术协同、平台支持、人才获得。这十个改变不是人工智能的全部,但是基础。

  基于这十个改变,华为制定了人工智能发展战略:投资基础研究、打造全栈方案、投资开放生态和人才培养、解决方案增强、内部效率提升。

  徐直军称,华为在AI上的全新战略,包括人工智能芯片、基于芯片赋予技术框架的CANN和训练框架MindSpore、以及ModelArts,华为将其称之为“全栈全场景AI解决方案”。

  “我们提出的全场景,是指包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等部署环境。全栈指的是技术功能视角,是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。”徐直军进一步表示,基于统一、可扩展架构的系列化AI IP和芯片,包括Max,Mini,Lite,Tiny和Nano等五个系列。“包括我们今天发布的华为昇腾910(Ascend 910),是目前全球已发布的单芯片计算密度最大的AI芯片,还有Ascend 310,是目前面向计算场景最强算力的AI SoC。”

  具体来看,华为所说的“全栈”包含四个部分:

  一是Ascend (昇腾),AI IP和芯片,皆是基于达芬奇架构。芯片分为5个系列,Max、Lite、Mini、Tiny、Nano。

  二是CANN,全称为Compute Architecture for Neural Networks (为神经网络定制的计算架构),是高度自动化的算子开发工具。根据官方数据,CANN可以3倍提升开发效率。除了效率之外,也兼顾算子性能,以适应学术和行业应用的迅猛发展。

  三是MindSpore架构,友好地将训练和推理统一起来,集成了各类主流框架(独立的和协同的):包括TensorFlow、PyTorch、PaddlePaddle、Keras、ONNX、Caffe、Caffe 2、MXNet等等。这一架构全面适应了端、边、云场景。

  四是ModelArts,这是一个机器学习PaaS (平台即服务),提供全流程服务、分层分级API,以及预集成方案。用于满足不同开发者的不同需求,促进AI的应用。

  此外,徐直军在现场透露,华为昇腾910将在2019年2季度上市。

  根据现场的介绍,这款属于Max系列的昇腾910,采用7nm工艺制程,最大功耗为350W。在现场的PPT中,华为将其和谷歌TPU v2、谷歌TPU v3、英伟达V100进行了对比。“可以达到256个T,比英伟达V100还要高出1倍!”徐直军说。

  事实上,在人工智能领域,华为此前已动作频频。

  在两年前,华为另一名轮值董事长郭平就表示,公司每年至少拿出10亿美元的研发预算,用于与数据中心相关的投入。

  2017年9月,华为发布了面向企业、政府的人工智能服务平台华为云EI。今年4月,华为又发布了面向智能终端的人工智能引擎HiAI。

  但在投入的过程中,发现了一个普遍存在的问题,就是云服务平台不卖终端芯片,卖终端芯片的平台不提供云计算服务。因此,这种割裂的环节让开发者浪费了大量的时间和精力以及财力在训练和部署之间。

  此前,谷歌云推出了用于边缘计算的Edge TPU,作为Cloud TPU的补充,用户可以在云上构建和训练ML模型,然后通过Edge TPU硬件加速器在Cloud IoT Edge设备上运行这些模型,这在某种程度上降低了开发者的成本。

  但如果能出现一套框架,让手机、公有云、私有云、边缘计算等不同平台的AI应用应用一次调校就能部署,将会比Edge TPU更有效率。

  “今天,我们发布的全栈全场景解决方案是对华为云EI和HiAI的强有力支撑。基于这个解决方案,华为云EI能为企业、政府提供全栈人工智能解决方案;HiAI能为智能终端提供全栈解决方案,且HiAI service是基于华为云EI部署的。”徐直军说。

  一位华为人士在社交平台发表感叹时表示,“(华为)又多了一些强大的全球顶级竞争对手。”


责任编辑:rain

本文标签:华为发布两款AI芯片,单芯片计算密度达全球最大

相关评论