menggujibaren

中兴通讯采用英特尔FPGA在深度学习上取得性能突破

0
阅读(1348)

英特尔和中兴通讯携手奠定深度学习与卷积神经网络(CNN)新基准。互联网搜索和人工智能领域众多公司都致力于提升该技术,例如图片搜索和匹配。中兴通讯在中国南京的一批工程师利用英特尔的中端Arria 10 FPGA产品,对一款采用CNN算法的云推理应用进行了测试。中兴通讯创造了一项新纪录——人脸识别速度超过每秒一千张图像——并达到其特定拓扑的理论精确度。英特尔Arria 10 FPGA使原始设计性能提速10倍以上同时保持算法精确度。Arria 10 FPGA拥有高达1.5 TFLOP的单精度浮点运算性能,115万个逻辑元件,以及超过1Tb/s的高速连接性。此类深度学习设计可以从Arria 10 FPGA系列无缝迁移至高端因特尔Stratix 10系列,用户可以期望得到多达9倍的性能提升。除了性能的大幅提升之外,中兴通讯无线研究院的研究小组还能够利用OpenCL编程语言缩短设计时间。