本文共 903 字,大约阅读时间需要 3 分钟。
最近需要使用 nvprof 此时cuda 程序运行的性能,下面对使用过程进行简要记录,进行备忘:
Non-Visual Profiler 和 Visual Profiler 的使用:
# nvprofnvprof python train_mnist.py nvprof --print-gpu-trace python train_mnist.py #nvvp (可以使用x11 forwarding 使用,当然更适合在本机使用)nvprof -o prof.nvvp python train_mnist.py (在GPU集群上生成 .nvvp文件)scp your_gpu_machine:/path/to/prof.nvvp . (scp 拷贝文件到本地)nvvp prof.nvvp (在本地机器上进行可视化分析)
参考链接:
(简单使用教程)
(nvidia 官网教程)
(一个日本工程师写的文档,不错,本文大多命令摘自此文档,文档中有较为详细的实例截图,可以参考)
(CSDN 上较为简洁的博客,可以参考使用)
(德国一个简单介绍的资料)
保持更新,更多内容请关注 cnblogs.com/xuyaowen; 如果对您有帮助,还请点击推荐或关注~!
转载地址:http://muuki.baihongyu.com/