文章:乔雨萌(qiaoyumeng@36kr.com) 编辑:石亚琼(syq@36kr.com) ** 行业概述 人工智能领域正不断取得突破性进展。作为实现人工智能技术的重要基石,AI芯片拥有巨大的产业价值和战略地位。 AI芯片领域的企业主要分为两类:第一类是集成电路设计龙头企业,包括Nvidia、Intel、AMD、Qualcomm、Xilinx、联发科、华为海思等,以IP授权为主要商业模式的ARM、Cadence和Synopsys等公司也在其列。第二类是以寒武纪、地平线机器人、Graphcore等为代表的专注于人工智能芯片研发的公司。第一类集成电路设计龙头企业有着多年的技术沉淀和研发积累,在综合技术实力、销售规模、资金实力、人才团队等方面拥有优势。第二类专业人工智能芯片设计公司成立时间相对较晚,在营收规模、综合技术积累等方面难以与集成电路设计龙头企业相比,但在AI算法和针对AI应用场景的专用芯片研发方面有着一定的技术优势。 2020年新冠疫情蔓延、国际关系紧张,很多行业受到了较大冲击。AI芯片行业资本市场的热度不减,多家厂商在产品技术迭代和量产落地上取得较大突破。整体上AI芯片行业在2020年保持向上发展势头。 行业投融资情况 2020年人工智能行业整体融资趋缓,但AI芯片领域有多家公司一年内获得多轮投资,其中不乏高额单笔融资。 例如,由前京东方集团董事长王东升、前三星集团大中华区总裁张元基创立的奕斯伟,2020年6月完成由君联资本、IDG资本等投资的超20亿元B轮融资。 由知名连续创业者张文、前阿里云AI基础架构总监徐凌杰等创办的壁仞科技,2020年一年内连获四笔融资。其中于2020年6月完成由启明创投、IDG资本等投资的11亿元A轮融资,刷新了国内高端芯片设计业A轮融资规模的记录。 2020年国内主要AI芯片企业融资情况 来源:企名片 代表公司进展 英伟达 推出GPU新产品GTC 2020 大会上,英伟达公布了旗舰计算GPU新品A100。A100采用了结构化稀疏技术,AI训练峰值算力达312TFLOPS,AI推理峰值算力达1248TOPS,均较上一代Volta架构GPU提升20倍,实现了英伟达史上最大的性能飞跃。搭载8个A100的英伟达DGX A100系统,单节点AI算力达到创纪录的5PFLOPS;5个DGX A100组成的一个机架,算力与一个AI数据中心相仿。 NVIDIA A100 GPU较上一代V100性能提升20倍 →芯东西《2020,AI芯片十大关键词》 意图并购Arm2020年9月,软银集团宣布将ARM以400亿美元的价格出售给英伟达。英伟达将向软银支付215亿美元的股票和120亿美元的现金,其中20亿美元将在签约时进行支付。根据ARM公司的业务表现,软银还可能获得另外50亿美元的现金或股票,ARM员工将获得15亿美元的英伟达股权。 ARM是全球最大的芯片IP供应商,在中国大陆市场的份额高达90%以上,这笔交易或将重塑半导体行业的市场格局。 业界广泛质疑这笔收购将影响ARM的独立性,例如美国可能会通过禁令形式,迫使英伟达不再为某些中国公司供货。中国工程院院士倪光南在当月表示,“相信中国商务部会否决这起并购”。 2021年1月6日,英国竞争与市场管理局(CMA)表示,将在今年晚些时候对英伟达(NVIDIA)收购Arm交易展开正式调查。 →腾讯网《英国监管当局启动对英伟达收购ARM的调查》 英特尔 推出AI优化的FPGA2020年6月19日,Intel发布了Stratix 10 FPGA系列的新产品 “Stratix 10 NX”。Stratix 10 NX被称作第一款专为AI优化的FPGA,通过定制硬件集成了高性能AI,可带来高带宽、低延迟的AI加速。 Stratix 10 NX采用了EMBI整合封装,将核心芯片、HBM存储、I/O扩展集成在一起。其中核心芯片采用14nm工艺制造,拥有高性能“AI Tensor Block”(张量区块),支持INT4、INT8、FP16、FP32等格式,其中INT8整数计算性能最大可以达到现有Stratix 10 MX方案的15倍,而且可以针对不同的AI工作负载进行硬件编程,更加灵活高效。 Intel Stratix 10 NX FPGA Stratix 10 NX可应用于包括语音识别、语音合成等自然语言处理场景,深度包检测、拥塞控制识别、反欺诈等安全场景,内容识别、视频预处理和后期处理等实时视频分析场景。 →快科技《Intel宣布首款AI优化Stratix 10 NX FPGA:INT8性能暴涨15倍》 AI训练芯片在亚马逊AWS落地在亚马逊AWS re:Invent 2020大会期间,英特尔与AWS共同宣布将推出基于英特尔Habana Gaudi人工智能芯片的云服务以降低AI数据集训练成本,计划于2021年上半年上线。 对于亚马逊AWS采用Gaudi芯片,市场普遍认为英特尔在云端AI芯片上相对于英伟达取得重大突破。谈及双方本次联手,AWS大中华区云服务产品管理总经理顾凡解释称,AWS致力于降低算法模型的训练和预测成本,因此倾向于采用性价比最高的芯片。Habana商务总监Eitan Medina称,基于Habana芯片带来的性价比优势,在降低AWS资本和运营支出后,反过来可以使AWS和其他公司有能力降低服务价格。 →腾讯网《获亚马逊AWS大单,英特尔AI芯片能否撬动英伟达市场份额?》 Apple 5nm芯片量产落地2020年9月,搭载A14 Bionic(仿生)处理器的Apple新品发布。A14 Bionic处理器是苹果首款采用5nm工艺打造移动设备的芯片,晶体管数量相较于A13 Bionic处理器的7nm芯片增加了近40%,晶体管数量达到了118亿颗。 在AI算力上,A14相比A13有了较大的提升,从之前的8核NPU翻倍提升到16核NPU。根据苹果的测试,A14的AI运算能力提升到了11.8万亿次,机器学习速度提升了70%,机器学习加速器令运算速度快达10倍,将各种机器学习应用的性能表现提升至全新水平。 →脑极体《从A11到A14仿生,苹果AI算力爆发增长意欲何为?》 AMD 计划收购赛灵思2020年10月27日,AMD宣布已经就全额换股收购FPGA龙头厂商赛灵思达成合意,交易价值达到350亿美元。AMD 预计该交易将在2021年底完成。AMD收购赛灵思后将兼具CPU、GPU、FPGA研发能力并补充加速AI应用的实力。 →金融界《半导体巨头AMD斥资350亿美元收购赛灵思 预计交易2021年底完成》 高通 5nm芯片量产落地2020年底, 高通发布5nm制程的骁龙888芯片。AI部分,高通5G芯片骁龙888采用了整体全新设计的第六代AI引擎,Hexagon 780处理器实现了Scalar、Tensor、Vector三个AI加速器之间的内存共享,拥有每秒26万亿次算力,性能增加了73%,每瓦特性能提升至前代的3倍。第二代高通传感器中枢集成的专用低功耗AI处理器的运用,实现了低功耗(节能80%)与高效能的兼得。 →砍柴网《高通5G芯片骁龙888升级显著 GPU实现迄今为止最大提升》 三星 5nm芯片量产落地2020年三星发布猎户座1080,由vivo X60系列机型首发搭载。三星Exynos 1080旗舰芯片基于先进的5nm EUV FinFET工艺制程打造,与8nm LPP工艺相比,性能提升14%,功耗降低30%;与7nm DUV工艺相比,性能提升7%,功耗降低18%。 →天极网《vivo X60首发三星Exynos 1080:首款5nm A78芯 跑分超骁龙865》 华为 5nm芯片量产落地2020年10月30日,华为发布业界首款5nm 5G SoC麒麟9000芯片,搭载在华为手机新旗舰Mate40系列上。 AI方面,麒麟9000AIBenchmark跑分全球第一。在强大算力的支持下,标清以下的视频画质可实现接近超清720P的效果,480P到高清以下视频内容超分后实现接近蓝光1080P效果,拯救低画质,填补高规格硬件下与低质量视频内容之间的视觉体验鸿沟。AI视频实时动漫化也得到了实现,Mate40系列在录制影像时,可直接渲染成卡通风格,且保留了主体轮廓和大量细节纹理,做到了精准的区域分割,解锁更多趣味视频玩法。 超高算力的实现往往意味着NPU功耗的提升,麒麟9000升级达芬奇架构2.0后,加持了华为SmartCache2.0,使得AI计算更快更强更省电。INT8性能相较竞品提升了60%,能效更是提升了150%。同时,NPU微核则实现了超低功耗感知、隔空手势解锁、灵动熄屏等需要芯片时刻“待命”的AI操作,全天候待机耗电也只有3mA。 →中关村在线《麒麟9000 AI Benchmark跑分全球第一》 联发科 推出天玑8202020年5月18日,联发科推出天玑820 5G芯片。在苏黎世AI跑分中,天玑820大胜同级竞品300%。它搭载的独立AI处理器 APU3.0拥有强劲的浮点 AI 运算能力,并灵活运用了联发科独家的多任务排程技术。针对手机用户日常应用最多的拍照和视频拍摄功能,天玑820在AI拍照、AI相册、视频优化、人脸识别等方面都有出色表现。同时,天玑820支持联发科独家MediaTek MiraVision画质引擎,最高支持120Hz屏幕刷新率,支持HDR10+,可以带来更好的视频画质表现。 →快科技《联发科天玑820性能超越 全面碾压同级5G芯片》 Imagination 推出了多核GPU IP新品2020年10月,Imagination宣布推出全新的IMG B系列(IMG B-Series)图形处理器(GPU),进一步扩展了其GPU知识产权(IP)产品系列。 IMG B系列采取了多核架构,多核架构结合了所有内核的能力,具备扩展性,可以为单个应用提供最大化的性能,或者根据需要支持不同内核去运行独立的应用,可以针对给定的性能目标实现更低的功耗和高达35%的带宽降低。 其中IMG BXT产品系列可以满足从手持设备到数据中心等应用的高性能要求。据悉,该款内核是B系列GPU的旗舰款。这是一个四核部件,可以提供6 TFLOPS的性能,每秒可处理192 Gigapixel(十亿像素),拥有24 TOPS(每秒万亿次计算)的人工智能(AI)算力。 →36氪《半导体IP厂商「Imagination」推出IMG B系列图形处理器,多核结构适应多种需求》 瑞芯微 AI芯片适配百度飞桨2020年5月13日,瑞芯微Rockchip正式宣布,旗下AI芯片RK1808、RK1806适配百度飞桨(PaddlePaddle)开源深度学习平台,充分兼容飞桨轻量化推理引擎Paddle Lite。基于此次合作,双方有望为AI行业赋能更多应用、场景,加快AI产品的落地速度。 瑞芯微的AI芯片RK1808及RK1806,内置独立NPU神经计算单元,INT8 算力高达3.0TOPs。它们采用22nm FD-SOI工艺,相同性能下的功耗相比主流28nm工艺产品降低约30%。经实测,瑞芯微AI芯片在Paddle Lite中运行MobileNet V1耗时仅为6.5 ms,帧率高达153.8 FPS,二者充分兼容并高效稳定运行。 →快科技《瑞芯微AI芯片适配百度飞桨 加速AI应用落地》 寒武纪 科创板上市2020年7月20日上午,国内AI芯片独角兽寒武纪正式在A股科创板上市,成为国内首个专注于AI专用芯片研发的上市公司。上市首日寒武纪市值一度突破千亿大关,全天涨幅达230%,随后几个交易日最高市值达1190亿元,但后续市值下跌,截至2021年1月14日低于700亿人民币。 →腾讯网《曾市值千亿!相比高位缩水超600亿,寒武纪长期亏损前景几何?》 地平线机器人 征程2出货量超10万2020年,地平线推出了全新一代AIoT边缘AI芯片旭日3和新一代高效能车规级AI芯片征程3。据介绍,其即将推出面向高等级自动驾驶的征程5,基于功能安全(ISO 26262)开发流程,可打造满足汽车行业较高安全级别ASIL D要求的车载中央计算平台和系统。 地平线征程2在长安 UNI-T和奇瑞蚂蚁两款车型上分别实现了智能座舱域和高级别辅助驾驶域国产AI芯片量产上车的零突破。截止2020年11月,中国首款车规级AI芯片地平线征程2出货量已超10万。 目前,地平线已同长安、上汽、广汽、一汽、理想汽车、奇瑞汽车、长城汽车,以及奥迪、大陆集团、佛吉亚等国内外知名主机厂及 Tier1 深度合作,成功签下20余个量产定点车型,预计2021年装车量可达百万台。 →DoNews《地平线计划C轮融资总额超7亿美金“征程2”AI芯片出货量超10万》 Graphcore 2020年7月15日,Graphcore正式发布第二代IPU以及用于大规模系统级产品IPU-Machine: M2000(IPU-M2000)。IPU-M2000产品是一款即插即用的机器智能计算刀片,搭载第二代Colossus IPU处理器GC200,采用7nm制程工艺,由Poplar软件栈提供支持,易于部署。 据介绍,IPU-M2000是目前世界上继英伟达GPU、谷歌TPU之后,全球范围内第三个公开发布的能够训练BERT-Large模型的AI处理器,Benchmark blog、Performance results table等已在Graphcore官网发布上线。 相比V100,IPU-M2000在ResNet的吞吐量提升了4倍,在ResNeXt的吞吐量提升了5.4倍,在EfficientNet的吞吐量达到了18倍,在Deep Voice3达到了13倍。此外,Graphcore与马萨诸塞大学、Facebook一起使用近似贝叶斯计算的方式做流行病的模型分析,与CPU相比IPU速度提高了30倍,与GPU相比提高了7.5倍。 →51CTO《Graphcore卢涛:仅把NVIDIA作为竞争对手,力争中短期实现市场第二的目标》 平头哥 含光800正式商用在2020阿里云线上峰会上,阿里云发布了第七代高主频云服务器ECS和含光800云服务器等产品,这标志着阿里云自研含光芯片正式大规模商业化。含光800是阿里巴巴平头哥在2019杭州云栖大会首日发布的AI芯片。一颗含光800的算力相当于10颗GPU,例如实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。 →新浪科技《世界第一的平头哥芯片含光800,正式商用》 百度 昆仑系列量产2020年12月17日,百度CTO王海峰宣布,百度自主研发的云端AI通用芯片百度昆仑1已实现量产和应用部署,量产约2万片,性能相比T4 GPU提升1.5-3倍;百度昆仑2预计在2021年上半年实现量产,与百度昆仑1相比性能将提升3倍。 →北京商报《百度AI通用芯片昆仑2预计2021年上半年量产》 北京君正 高市值、高市盈率2020年半导体板块一路高涨,全年半导体板块涨幅60%,其中北京君正的涨势尤其迅猛。截至2021年1月14日,北京君正的市值达387.14亿元,市盈率为1295.02亿元。 →腾讯网《2020A股收官之战暗流涌动,2021怎么投?》 其他国内AI芯片创业公司 知存科技:针对本地智能语音应用的轻量级存算一体芯片WTM1001已批量试产,针对智能语音、健康监控的WTM2101芯片将于2021年初批量试产→电子发烧友网《知存科技:多款存算一体芯片已批量试产》 燧原科技:推出首款云端推理芯片,成为国内唯一一家兼具云端训练和云端推理完整解决方案的初创公司→智东西《挺进云端AI训练&推理双赛道!独家对话燧原科技COO张亚林:揭秘超高效率背后的“内功”》 清微智能:多模态智能计算芯片TX510已于2020年7月底开始量产,2020年累计出货量数十万→芯东西《清华可重构技术再下一城!对话清微智能CEO,视觉芯片月出货数十万颗》 亿智电子:2020年实现超过百万颗芯片量产落地→芯东西《亿智电子吴浪:超百万颗芯片量产落地,AI芯片规模化落地的四大难点 | GTIC2020》 鲲云科技:推出面向边缘和云端的首款数据流AI推理芯片CAISA→电子发烧友网《鲲云科技数据流技术实现新突破,更高算力性价比AI芯片CAISA发布》 光子算数:光电混合AI加速计算卡已成测试级的产品→半导体行业观察《光子AI协处理芯片,为传统加速计算卡装上“涡轮增压”》 来源: 36氪 https://baijiahao.baidu.com/s?id=1689189528382113770&wfr=spider&for=pc |