博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
nvprof 使用记录; 以及使用 nvprof 查看tensorflow-gpu 核函数运行记录
阅读量:3964 次
发布时间:2019-05-24

本文共 903 字,大约阅读时间需要 3 分钟。

最近需要使用 nvprof 此时cuda 程序运行的性能,下面对使用过程进行简要记录,进行备忘:

  • 常用使用命令:nvprof --unified-memory-profiling off python run.py (这是因为某块内存被设置了不允许分析,导致)参考: 
  • nvprof --unified-memory-profiling off python run.py (2>run.txt 1>out.txt)
  • nvprof --unified-memory-profiling off --print-gpu-trace python run.py 
  • nvprof --unified-memory-profiling off --print-gpu-trace -o prof.nvvp python run.py
  • nvvp prof.nvvp (使用 x11 forwarding) 
  • ./run.sh 2>runsh_out.txt 

Non-Visual Profiler 和 Visual Profiler  的使用:

# nvprofnvprof python train_mnist.py nvprof --print-gpu-trace python train_mnist.py #nvvp (可以使用x11 forwarding 使用,当然更适合在本机使用)nvprof -o prof.nvvp python train_mnist.py (在GPU集群上生成 .nvvp文件)scp your_gpu_machine:/path/to/prof.nvvp . (scp 拷贝文件到本地)nvvp prof.nvvp (在本地机器上进行可视化分析)

参考链接:

 (简单使用教程)

 (nvidia 官网教程)

 (一个日本工程师写的文档,不错,本文大多命令摘自此文档,文档中有较为详细的实例截图,可以参考)

 (CSDN 上较为简洁的博客,可以参考使用)

 (德国一个简单介绍的资料)

保持更新,更多内容请关注 cnblogs.com/xuyaowen; 如果对您有帮助,还请点击推荐或关注~!

转载地址:http://muuki.baihongyu.com/

你可能感兴趣的文章
Mule ESB-Content-Based Routing Tutorial(3)
查看>>
年末项目经验总结
查看>>
做事情要放下面子,拿起责任
查看>>
敏捷开发实践(1)-故事工作量估算导致的问题
查看>>
记一次解决jenkins持续构建,自动部署的问题
查看>>
敏捷开发实践(2)-要不要文档?
查看>>
写博意味着什么
查看>>
比较Cint() , int() , fix() ,round()的区别
查看>>
举例说明常用字符串处理函数
查看>>
软件生存期模型
查看>>
制定计划(问题的定义,可行性研究)
查看>>
需求分析
查看>>
软件设计
查看>>
程序编码
查看>>
软件测试
查看>>
软件维护
查看>>
软件项目管理
查看>>
面向过程的分析方法
查看>>
软件设计基础
查看>>
UML的基本结构
查看>>