网站地图官方微信:
网站首页 依龙镇 小越镇 鳌溪镇 谷营乡 高观乡 凤合镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 有没有什么路由器让你用过之后彻底惊艳了? |

    tplink商用版本路由器 路由+交换机+3个大饼AP挂天上...

    查看详情>>
  • | 自己拥有一台服务器可以做哪些很酷的事情? |

  • | 什么是「雷军比较法」?雷军比较法为什么很火? |

  • | 哪张照片让你觉得刘亦菲美得不可方物? |

  • | MiniMax Week第三天推出通用 Agent,体验如何?对行业会带来哪些影响? |

  • | 什么是稳定币?有人说它是「一场饮鸩止渴的游戏」,你怎么看? |

  • | 为什么一般人不建议住别墅? |

  • | 鱼缸粪便解决方法和技巧有哪些? |

  • | 用J***a写Android的时代是不是要结束了? |

  • | 超级喜欢穿短裙正常吗? |

  • | ***拍大尺度片子时摄影师不会看光吗? |

  • 现在都2025年了,AI写代码已经很智能了,受影响最大的就是...

    2025-06-21
  • 准确的说:业务越宽泛,用Golang就越费劲,垃圾到不至于。...

    2025-06-21
  • [***] 鱼缸要养庞大的清洁工队伍,清道夫、红眼大帆、各种...

    2025-06-21
  • 谁要是不信这个邪。 你们就亲自做实验: ①有伴侣的,你们要...

    2025-06-21

关注我们

添加微信好友,关注最新动态