昆仑芯片进展如何?昆仑1已量产、预发昆仑2
百度自主研发的百度昆仑芯片,正在为新基建提供可靠动力。9月15日,“万物智能——百度世界2020”大会召开。主论坛上,百度创始人、董事长兼CEO李彦宏与百度各业务板块领军人物用一场新潮且极客的线上直播发布会形式,全方位展示了百度人工智能的最新成果,并与各界共同探讨了人工智能、新基建、智能经济等热点话题,在整个行业引发万众瞩目。
在当天下午的百度大脑分论坛上,百度智能芯片总经理欧阳剑系统的讲解了基础层芯片10年来的技术积累及最新进展:百度昆仑1已量产,已在百度搜索引擎及云计算用户部署2万片,相比T4 GPU性能在不同模型下提升1.5-3倍;同时预发布了采用7nm先进工艺的百度昆仑2,性能比百度昆仑1提升3倍,2021年上半年量产等重要内容。
(百度智能芯片总经理欧阳剑)
会上,欧阳剑首先介绍了AI芯片的发展背景。他讲到,每个IT发展的阶段都有非常独特的芯片处理器架构:大型机、小型机的时代,芯片的架构是定制的处理器;PC+互联网时代,X86CPU处理器为占据主场;移动+云的时代,处理器的架构变成ARM CPU与X86CPU共存,其中ARM CPU占领移动端,X86CPU占领了服务器端;AI+智能云时代,出现了全新的芯片架构——AI芯片。
百度研发AI芯片的积累得益于其用FPGA做AI加速的积累,也得益于其在软件定义加速器和XPU架构的多年积累。据悉,百度最早在2010年开始用FPGA做AI架构的研发,2011年开展小规模部署上线,2017年部署超过了1万片FPGA,2018年发布自主研发AI芯片,2019年下半年流片成功,2020年开始量产,以及预计2021年第二代百度昆仑量产。同时,百度昆仑团队还在业界最顶级的芯片会议Hotchips上发表了4篇论文,是目前国内发表最多的。
欧阳剑强调,AI芯片是科技竞争的制高点,只有通用的AI处理器才可以在激烈的竞争中胜出。而百度昆仑核心产品的定位正是通用AI处理器,目标是提供高性能、低成本、高灵活性的AI芯片。值得一提的是,百度昆仑芯片使得百度大脑具备了更完备的软硬一体化能力,形成了从芯片到深度学习框架、平台、生态的 AI全栈技术布局。
百度昆仑-通用AI处理器具备的三个特点可以概括为:高性能、低成本、灵活性。首选通用性,是指其可以支持全部的AI应用及场景;其次易编程,可构建强大的软件生态护城河;第三高性能,可支撑AI应用突破新可能;第四是低成本,而最重要的是自主可控。
为了更加直观的展示百度昆仑芯片的实际性能,在今天的分享中,欧阳剑还给出了一系列百度昆仑对比T4的数据。例如:百度昆仑芯片可以实测到200多TOPS的实际的性能,对比业界最先进的T4的GPU可实测到70左右的TOPS,百度昆仑相比T4有3倍的性能提升;而在图像分割YOLOV3算法中,百度昆仑性能大概是T4的2倍。除此之外,还展示了百度昆仑在工业智能设备中的应用。
可以见得,百度昆仑芯片不仅具备高性能优势,其实际模型的性能也是业界最领先的。截止目前,百度昆仑芯片全面支持语音、图像、NLP模型,灵活支持用户自定义模型,支持传统机器学习模型;100%自主芯片的设计,可以实现和国产处理器,国产OS,国产框架的完成适配;同时其也是国内业界最大部署规模,并有超过10+个外部客户。
会议的最后,欧阳剑还预发布了采用7nm先进工艺的百度昆仑第二代芯片,相对百度昆仑第一代芯片而言,性能提高了3倍,同时此款芯片还带有高速片间互联,多款细分型号,覆盖云训练、云推理以及边缘计算等优势。
目前,百度已经成为中国AI芯片界的重量级玩家,对于中国强化底层技术特别是芯片技术有重要意义。随着人工智能、新基建的发展,百度表示将在AI芯片领域继续长期投入研究,以更好的落实“软硬一体化”发展的战略目标,加速产业智能化发展步伐。(一鸣)