写CUDA到底难在哪?
来源:
编辑:
时间:2025-06-21 01:10:18

对GPU进行性能优化时,cudagraph是绕不开的话题。
不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。
NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。
本文尝试从底层原理出发,根据文档 和 …。
-
{dede:pagebreak/}


网友评论:
{dede:include file='ajaxfeedback.htm' /}
栏目分类

最新文章

热门文章
- 做个web服务器,gin框架和go-zero怎么选?
- Gemini 2.5 Flash 和Pro稳定版上线,和之前版本相比,在性能和应用场景上有哪些提升?
- 为什么很多司机不办 ETC?
- 广东省肇庆市怀集县洪水后,赵一鸣零食店被哄抢,物资和收银机里面的几千块钱被哄抢一空,如何评价?
- 为什么好多人不承认大众审美就是喜欢白皮?
- 微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些?
- 请教了解空军装备的知友,歼35服役后,是否要歼10退役?歼10生产线都转贵航了,以后只用于外贸吗?
- 央企的信创,是否有必要把 spring 替换成国产的 solon ?
- 哪张照片让你觉得刘亦菲美得不可方物?
- 商业史上有哪些降维打击的经典案例?
