低调的国产RISC-V芯片玩家
在这个巨大市场潜力的推动下,IP厂商、工具厂商、芯片厂商和系统厂商都争先恐后地涌入这个赛道,其中不乏一些拥有深厚行业积累的厂商。如以ASIC芯片起家的嘉楠 科技 (以下简称“嘉楠”),就是当中一个重要的低调参与者。
从ASIC到RISC-V
众所周知,纳斯达克上市的嘉楠 科技 在ASIC芯片设计方面有深厚的积累,公司在芯片的前后端设计以及流片方面也有丰富的量产经验。早在2016年,嘉楠就成为了国内前十实现10nm芯片量产的公司。也就是从这一年开始,嘉楠开始了在边缘端AI芯片的 探索 。
据嘉楠 科技 董事长兼CEO张楠赓先生介绍,因为ASIC芯片对于计算效率的要求趋近极致,这就需要嘉楠一直在ASIC芯片设计中寻求算力与功耗之间的最佳平衡。因为这个研发过程对技术要求比较高,这无疑间就磨炼了公司的研发团队。与此同时,公司还发现,ASIC在计算效率上相比传统架构有了数量级的提升,这就为嘉楠后续进军RISC-V市场埋下了伏笔。同属计算密集型应用场景的边缘AI芯片就成为了嘉楠的目标。
经历了一番综合考量,嘉楠把目光投向了基于RISC-V的边缘端AI芯片。
嘉楠 科技 董事长兼CEO张楠赓先生
首先,从成本角度看,RISC-V开源免费的特性对于芯片创业公司而言非常友好。选择这一架构,意味着嘉楠可以在AI芯片研发过程中节省大量的IP授权成本,将资源投入到最核心的技术研发,帮助公司加快芯片的迭代速度,灵活应对市场环境的变化。
其次,从技术趋势角度看,RISC-V架构开源、精简和模块化的理念符合未来的技术发展趋势。计算体系结构宗师David Patterson(RISC-V的创始人之一)在ACM通讯上发表的论文中就指出了计算机体系结构的两个机遇,其中一个就是开源的指令集ISA,创建一个“面向处理器的Linux”。从目前来看,RISC-V无疑是开源指令集架构中最成功的一个。
第三,从开发角度看,RISC-V不需要像ARM一样考虑向后兼容,没有 历史 包袱,基础指令只有几十条,学习门槛相对较低;另一方面,RISC-V支持开发者按需拓展指令,这为芯片研发提供了更高的自由度。
第四,从性能角度看,RISC-V架构内核的性能可与ARM内核性能抗衡。
第五,从IP开发角度看,嘉楠从一开始就坚持IP核心自主研发的技术路线,RISC-V架构则提供了这一可能。嘉楠还能以SoC的形式将RISC-V CPU与自主研发的加速器组合在一起,为客户提供边缘侧的芯片解决方案。在这一过程中,公司可以把更多精力放在IP核的迭代,而不用考虑可能面临的授权风险。
从市场发展现状看来,嘉楠打造端侧RISC-V AI芯片的做法也是一个明智的决定。
熟悉行业的读者应该知道,根据应用场景的不同,AI芯片的可以粗略划分为模型训练和推理计算。其中模型训练市场已出现巨头垄断的态势,GPU巨头英伟达不仅在硬件方面建立起技术领先优势,而且结合图形计算平台构建了强大的软件生态壁垒,那就意味着这个市场给新晋者的机会并不多。反观推理芯片组市场,则还处于发展早期,特别是边缘侧市场,不同场景对芯片的要求存在差异化,给AI芯片公司留下了更多空间,因此嘉楠一开始就专注于边缘推理芯片的研发。
同时,在边缘侧市场,可穿戴设备、摄像头和传感器等联网设备越来越多。不同物联设备对功耗和算力的要求不同,这就决定很难用单一架构适配所有场景。架构的竞争归根结底是生态之间的竞争。虽然ARM仍然是移动端市场的主流,但RISC-V开源和模块化的特点允许像嘉楠这样的芯片公司基于RISC-V进行定制化的设计,拥有更大的自由度。
此外,从目前的市场环境看,Arm正成为巨头公司争相收购的目标,这对于IP授权的独立性造成了很大威胁。而如果很多组织使用RISC-V设计处理器,就可以在更大层面上推动芯片的创新。所以长期来看,RISC-V的价值在未来会更加凸显,从而为嘉楠带来更多的市场机遇。
奔跑在这条全新的赛道上,自主研发的IP成为了嘉楠最重要的底气之一。
从K210到K510
在拍板进军RISC-V之后,嘉楠就一直坚持依托RISC-V架构,自主研发IP核心的技术路线。
张楠赓表示,公司这样做有三方面板的优势:一方面是为了把核心技术握在自己手里,避免可能面临的授权风险;另一方面,自主开发核心从长期来看可以降低研发成本,并加快芯片的迭代速度;第三,自研可以形成嘉楠自身的芯片设计方法体系,确保核心技术和研发理念的传承。
本着这样的研发思路,嘉楠迄今已经推出了两代自主研发的IP核心,分别为KPU(Knowledge Process Unit)和KPU2.0。这是专门为机器视觉任务设计的神经网络加速器。因为异构计算是目前针对深度学习的主流硬件方案,为此在结合CPU与KPU加速器后,嘉楠能更好地提升芯片在视觉算法模型上的性能表现。
落实到芯片方面,嘉楠在2018年就推出了公司的第一代产品勘智K210。这款产品在过去几年里也在包括智能园区、智能家居、智能能耗和智能农业在内的多个场景中发挥了重要的作用,公司也与一些行业头部公司开发了智能产品。今年,嘉楠就作为全国大学生OS设计大赛唯一的技术支持方,也为大赛提供勘智K210和开发板作为评估工具。与勘智K210甚至还在美国和日本等国际市场上率先打开局面。
但张楠赓指出,即使K210在不少领域表现抢眼,但由于该芯片的研发时间较早,在算力规划上没有考虑到后来才出现的算法模型,导致产品在应用场景的拓展上受到限制。为此,嘉楠在日前又顺势推出了新一代的中端芯片K510。
据介绍,在全新的勘智K510芯片,继续沿用了双核RISC-V CPU架构中,但嘉楠围绕RISC-V CPU子系统进行了优化。例如该CPU集成了64位的数字信号处理器DSP,配合自主研发的KPU2.0核心为AI应用加速。
此外,DSP内部还设计了专用的本地存储,进一步提升DSP的实际运算性能。研发团队还在双核CPU和DSP之间设计了专用的mailbox模块用于通信,方便软件灵活掌控整个系统。
K510同时还在总线架构、IP核心与视频子系统等多个方面也推出了全新设计。这使其算力相比一代芯片提升了3倍,经典视觉算法mobilenetv1帧率大幅提升,自研高速PHY接口理论带宽也做到了10GB/s,8位数据压缩率更是高达50%以上,极大优化了勘智AI系列在机器视觉场景的应用性能。
为了进一步解决大功耗和大面积的问题,嘉楠在K510芯片上更是采用了NoC总线架构,让每个IP工作在特定的时钟域,解决庞大时钟树的困扰。
在K510的视觉硬件配置上,嘉楠也进行了大幅优化,使其能够支持MIPI CSI2 和DVP接口,可同时支持最多3个摄像头输入。芯片内部还集成了3个图像处理单元ISP, 其中一个ISP支持3D 功能,无需软件参与,硬件完成深度数据的提取和加工,相比软件处理深度信息方式不但节省了巨大的CPU开销,性能上也会有很大提升。
嘉楠同时还提高了K510在摄像头输入接口设计的灵活性,让其既可以硬件流水线方式将摄像头输入送至ISP硬件,也可以把输入图像写入DDR,ISP再通过线下方式读取DDR内的图像完成后续处理。满足用户可以在中间加入定制化的处理需求,或者对定制化的数据进行ISP处理。
值得一提的是,通过融合公司在算法、软硬件和编译器的最新设计,嘉楠推出全新的KPU2.0,集中突破AI芯片设计中广泛存在的“存储墙”和“性能墙”的问题。为了提升计算效率,KPU2.0采用了动态3D PE阵列,第三个维度支持多种方式共享传递数据,并实现多个维度上的计算映射,提高PE阵列的利用率。同时也可以动态开启或关闭每一个2D阵列,并根据不同层级对带宽和计算资源的需求进行调整。
据了解,通过动态3D PE阵列,K510支持多种方式共享传递数据,灵活支持多个维度的计算映射,提高PE阵列利用率。采用GLB(Global Local Buffer)设计,通过可配置的SRAM阵列实现,灵活配置以满足不同数据类型在不同层上的带宽和存储需求,并提升内部RAM的利用率。结合动态3D PE阵列和GLB设计,嘉楠还独创了计算数据流技术,在计算卷积时不需要进行数据重排;通过多级存储设计提升卷积计算的数据复用率。
此外,KPU2.0还搭载了可重构的SIMD加速单元,通过创新的meshnet网络可以灵活配置支持各种激活函数、pooling和resize等算子。
作为一款定位于中高端边缘推理芯片市场,K510无论在核心架构还是外部设备接口方面,都对芯片的视觉处理能力进行了大幅优化。这就使得这个芯片能够在高清航拍、高清视频会议、智能家居、各类机器人以及车载后装智能终端等市场发挥其功用,并占领一席之地。根据公司的规划,未来几年会有多款勘智芯片亮相,助力多个不同的应用和市场。
与全球开发者共同推进RISC-V
虽然在包括嘉楠在内的多个厂商的推动下,RISC-V取得了长足发展。但从过往的 历史 看来,任何一款架构的普及都需要时间。如PC时代的x86架构统治了指令集架构市场几十年,后PC时代才迎来Arm架构的崛起,Arm也用了几十年,才走上了巅峰。换而言之,计算负载的变迁需要经过一个长时间的生命周期。也就是说我们现在虽然已经进入了万物互联时代,给RISC-V创造了机会,但这个新兴指令集来说,也只是迈出了第一步。
再者,现在的指令的发展趋势是开放度越来越高。如Arm崛起的原因很大程度上是因为它引入了更多的市场参与者。同样地,我们也将看到RISC-V作为开源架构标杆对于新一代芯片设计厂商的吸引力,也许未来的英伟达、英特尔就会从这个生态中诞生。为此嘉楠也会持之以恒地投入其中。
张楠赓同时还强调,RISC-V生态还在持续壮大,特别在边缘侧场景中,因为很多业内通行的设计标准和协议标准尚未统一,所以在百家争鸣的现阶段中, 探索 自己独特的技术路线更有意义,这也是作为RISC-V的坚定支持者嘉楠所践行的。
“但我们也应该认识到,将芯片转化为智能产品需要一个过程。与软件不一样,硬件是一段漫长的旅程、很花时间。需要先完成原型,然后客户进行测试,可能还要进行一些反复开发,所有这些事情都会比在Linux上debug花更久时间,也需要在生态上花费更多心思”,张楠赓补充说。
基于以上考虑,嘉楠会坚持依托RISC-V架构进行自主IP核研发的技术路线,为市场带来性能表现更优的芯片。同时,公司也会在软件方面发力,给客户带来更方面的研发体验。
据介绍,通过公司采用统一的AI编译器,勘智系列KPU能支持 TensorFlow、PyTorch和ONNX 模型导入。支持算子融合、稀疏压缩和量化等优化手段,对模型的延迟和带宽进行深度优化。K510同时还支持丰富的网络模型算子,当中包括常见的 CNN、RNN 算子和各类向量计算和数据处理操作。
“嘉楠的成长受惠于开源,公司也将全面拥抱软硬件开源战略。嘉楠已经决定把公司在硬件模块、软件算法的积累,以及芯片手册等基本资料去阿奴共享出来给开发者使用,与全球的开发者共同推进RISC-V生态的繁荣。”张楠赓说。在他看来,推动RISC-V产业的发展,除了有利于公司本身以外。这于中国芯片产业来说,也是有百利而无一害的。
过去,芯片设计有时需要上亿研发费用,投入上百人,但这是中小企业不易承担,而且也不一定能掌握发展的主动权。但开源的RISC-V芯片设计能将芯片设计门槛大大降低,让3到5人的小团队在3到4个月内,只需花几万元便能研制出一款有市场竞争力的芯片,从而将促进芯片产业的繁荣,能更好地支持人工智能等新一代信息技术和数字经济的发展。
张楠赓认为,芯片产业最关键的是人才。在芯片设计门槛降低之后,将会吸引到更多的人才投入这个行业,这有助于奠定本土芯片产业长远发展的人才基础;另一方面,因为x86和Arm架构自身比较封闭,不容易进行创新。
“有了RISC-V之后,本土的一些架构创新的成果也容易以开源的形式进行推广,有助于打造中国在开源芯片领域的话语权。”张楠赓强调。
晶圆 集成电路 设备 汽车 芯片 存储 MLCC 英伟达 模拟芯片
兆易创新(GigaDevice)发布了据称是世界上首款基于RISC-V的通用微控制器(MCU), RISC-V是一款面向物联网(IoT)市场的设备。
兆易创新总部位于北京,是国内规模较大的非易失性存储器(NVM)制造商之一。兆易创新同样声称其新推出的GD32V RISC-V微控制器与基于Arm的经典GD32系列单片机“完全兼容”。
兆易创新高管强调,该公司仍是Arm的战略合作伙伴。添加RISC-V行就是为了提供选项。
几个月前,当特朗普开始对包括Arm知识产权在内的西方技术实施出口管制时,中国电子企业加强了对开源RISC-V的共同关注。然而,RISC-V是一种开源技术,不受类似的限制;对于中国制造商来说,它代表着一种易于获得的选择,可以控制自己的技术命运。
中国制造商使用RISC-V的其他例子包括华米 科技 的AI芯片黄山一号、C-Sky Microsystems的RISC-V第三代指令系统架构处理器CK902和RiVAI AI芯片Pygmy。有别人。
RISC-V为用户提供了非凡的空间。中国工程院院士倪广南在兆易创新的发布会上说:“RISC-V基于标准松散BSD (Berkeley Software Distribution)许可。用户可以自由使用design CPU,也可以开发和添加自己的CPU。他们可以扩展指令集,选择公开发布、商业化销售,或者用其他许可协议替换它,或者使用完全封闭的源代码。”
RISC-V提供了灵活性,但随之而来的不可避免的问题是缺乏一个支持生态系统。RISC-V的生态系统相当有限,特别是与基于广泛可用的Arm和X86架构的MCUs相比。这是否会阻碍RISC-V的进一步发展?
中国认为,在解决物联网(本质上是一组新兴的嵌入式市场)问题时,缺乏RISC-V生态系统不是一个大问题。物联网市场仍处于发展阶段,碎片化,客户需求多样化。没有一家公司是固定的,所以生态系统支持不是一个问题。在物联网应用方面,与英特尔和Arm相比,RISC-V在移动、台式机和服务器等更成熟的市场上的劣势要小得多。
中国嵌入式软件协会副会长何晓青在会上表示:“在生态环境中,最难做的事情是移动市场,其次是台式机和服务器。物联网生态系统要简单得多。”
新莱 科技 首席执行官胡振波对此表示赞同。“服务器和台式机的软件生态系统是不可逾越的,但在嵌入式领域,软件生态系统并不像人们想象的那么糟糕,”他说。
兆易创新MCUs的第一行将被命名为GD32VF103。这一行的目标是“主流开发需求”。在介绍中,该公司列出了14款103配置。每一个都是建立在大黄蜂108MHz核心设计与原子核系统技术合作。
这14款机型的主要区别在于不同的闪存容量,以及4种不同的包选项。据该公司称,这些产品都已大规模生产和销售。
兆易创新相信它已经建立了“与RISC-V的桥梁”——为那些一直使用基于arm的MCUs进行设计的公司提供了一条快速切换到基于RISC-V的替代品的途径。该公司表示,两个产品系列之间的“完全兼容性”应确保代码的可重用性,“使跨核心MCU的选择和设计”非常方便。兆易创新表示:“这是我们非常领先的、史无前例的创新。”
兆易创新发布的数据显示,GD32VF103系列单片机在最高频率下的DMIPS为153,在CoreMark基准测试中得分为360分,该公司声称比基于GD32 arm的核心快15%,同时消耗了一半的功耗。
兆易创新相信,它在内存技术方面的专长是一个关键的区别。兆易创新EVP和MCU事业部总经理邓宇举了一个例子:“德州仪器从Arm收购了Luminary,但德州仪器的收购并不成功。Luminary没有Flash基因,所以有些产品会有程序问题。但我们有Flash的经验。我们可以确保此类问题不会发生。”
兆易创新保证,GD32VF103的产品开发速度相当快。市场营销总监金光义表示:“用户可以使用手头的开发工具来实现RISC-V。”
这些工具包括基本IDE(集成开发环境)、调试工具、嵌入式操作系统和云解决方案。当然,也有开发板,包括功能齐全的评估板,针对学习板、电机控制开发板、触摸屏开发板、RC电机驱动板等具体场景的入门级指导。
“我们正在与许多供应商合作,包括软件、中间件、集成开发环境、调试下载工具和终端解决方案的供应商。”金说:“仅仅依靠我们的芯片是不够的。它还需要上游和下游。此外,我们提供一个开放的平台,我们有更多的第三方合作伙伴。我们准备开发一个完整的生态系统。
“我们也是第一个。你可以使用RISC-V通用单片机从头开始解决任何问题。
兆易创新已经出货超过3亿MCU,而且出货速度正在加快;从2亿到3亿的时间比之前的1亿到2亿要短。这些数字包括早期基于arm的mcu。
该公司预计明年将达到4亿美元,并在中国市场占据10%的份额。“RISC-V将推动我们的货运。尽管我们仍需关注市场的实际表现,但我们认为这一出货量是可以预期的。”
通过增加RISC-V版本的Arm MCUs,同时保持与Arm的战略合作伙伴关系,并继续销售基于Arm的MCUs, 兆易创新相信它可以摆脱客户的一站式购物。
“终端客户可以实现不同的形式、不同的应用程序、不同的架构和不同的产品。我们已经有了Arm架构产品;RISC-V是分化的补充。“我们是业内第一家进入RISC-V轨道,为客户提供差异化产品的公司。”
该产品线的下一步是增加对无线的支持。“我们希望加入MCU的连接功能,eRF,将在明年发布第一个加入WiFi连接的产品,”Jin说。
GD32VF103系列已经有了实际应用。例如,在GEZ单片机的微热打印机解决方案中,单片机是GD32VF103C8。该方案可应用于销售点(POS)打印机、税控打印机、自动柜员机等嵌入式微型打印机设备。它在展览会上印刷钞票。
另一个例子是基于GD32VF103C8的USB多点触控设备。以下触摸屏采集触摸信息,通过I2C将其传输给主控芯片GD32VF103C8实现触摸操作,同时可识别1-5个触点。有许多特定的应用程序,包括大屏幕交互显示器、交互 游戏 、智能家居等等。
上面的示例是来自IC Superman的空气净化器解决方案,其中GD32VF103C8负责控制负离子、臭氧和电机等外围操作。
鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com
图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!