技术雷达站技术雷达站

IBM推出高能效NorthPole机器学习处理器

IBM今天推出了NorthPole,出高这是器学一种内部设计的人工智能芯片 ,据称该芯片的习处能效明显高于竞品处理器。

NorthPole由IBM位于加利福尼亚州阿尔马登的理器研究实验室的工作人员历时八年开发而成 。该芯片建立在IBM早期的出高一个研究项目之上,那个项目开发了一款名为TrueNorth的器学AI优化处理器  。据IBM称,习处NorthPole的理器速度大约快4000倍。

这款新推出的源码库出高芯片由220亿个使用12纳米工艺制造的晶体管组成。IBM表示,器学这些晶体管被组织成256个内核,习处每个内核在每个时钟周期内可以以8位精度执行2048次计算 。理器这意味着计算是出高在相对较小的数字上进行的 ,这些数字最多占用八位空间。器学

NorthPole的习处256个内核中的每一个都包含一个集成的内存池 ,用于存储计算中使用的信息。服务器租用由于芯片的存储电路和内核彼此靠近 ,数据可以在短时间内在两者之间传输。这减少了与数据移动相关的处理延迟 ,从而提高了性能 。

IBM大脑启发计算首席科学家Dharmendra Modha表示 :“从架构上讲 ,NorthPole模糊了计算和内存之间的边界。”“在单个内核级别 ,NorthPole 表现为内存靠近计算;从芯片外部看 ,在输入输出级别,它表现为活动内存。”

NorthPole核心内置存储电路的另一个好处是这种做法提高了能效。模板下载在芯片的不同部分之间移动数据不仅会延迟处理 ,还会消耗电力。NorthPole的架构将数据在存储器电路和内核之间必须传输的距离最小化  ,用这种方法节省了能耗 。

IBM使用了名为ResNet-50的开源图像识别模型来测量这款芯片的功耗 。该模型通常被用于比较不同AI处理器的功能 。据IBM表示,NorthPole运行ResNet-50的能效分别比基于12纳米和14纳米节点的显卡和中央处理器高25倍。云计算

NorthPole的能效受到以下事实的限制:它也使用12纳米节点制造,这比芯片制造商可以使用的、最先进的3纳米工艺落后了好几代。但是 ,该处理器可以升级到更新的制造技术 。据报道,IBM的研究人员估计,这样的升级可以使NorthPole提供比基于“当前设计”的香港云服务器竞品芯片高25倍的能源效率 。

处理器的功耗直接影响其产生的热量。IBM表示 ,NorthPole的能源效率限制了其最高温度,这意味着该芯片只需要简单的外部冷却设备即可运行 。因此,它或许可以部署在空间受限的系统中 ,例如冷却装置空间有限的自动驾驶汽车 。

源码下载
赞(312)
未经允许不得转载:>技术雷达站 » IBM推出高能效NorthPole机器学习处理器