核显 DirectML 深度学习环境

本贴最后更新于 867 天前,其中的信息可能已经沧海桑田

参考文档:

  tensorflow-directml 官方文档

  Enable TensorFlow with DirectML in WSL

  ‍

  环境: win10 + wsl2-ubuntu20.04

  安装显卡驱动(确保型号匹配,我是 amd 的 r5 核显):

  1. py36 环境安装

    截至 2022 年 10 月 5 日, tensorflow-directml==1.15.8 最高支持 py37,但是其依赖 gast 0.2.2 并不支持 pep517 的方式安装,推荐用 py36 版本。
    若已有 py3.6 或者用 conda 安装可以跳过这一步。

    cd $HOME
    curl -Lo https://www.python.org/ftp/python/3.6.14/Python-3.6.14.tar.xz
    tar xJvf Python-3.6.14.tar.xz 
    cd Python-3.6.14
    install -dv $HOME/.local/lib/python3.6
    ./configure --prefix=$HOME/.local/lib/python3.6
    make && make install
    
    # 添加环境变量
    install -dv $HOME/.local/bin/
    ln -s $HOME/.local/lib/python3.6/bin/python3.6 $HOME/.local/bin/python36
    # 检测是否成功
    python36 -V
    # Python 3.6.14
    
    # 安装成功后移除安装包
    rm -rf Python-3.6.14/ Python-3.6.14.tar.xz
    
  2. pdm 配置

    仍推荐直接用 conda,用 pdm 多半是为了节省硬盘。pdm 安装和使用可以参考 pdm 简易使用说明pdm 官方手册

    自行添加需要的依赖。注意,因为使用 py3.6,所以 py 模块的编译使用的是 flit_core, 而非 pdm 默认的 pdm.pep517.api

    install -dv PDM-Project/tensorflow-gpu
    cd PDM-Project/tensorflow-gpu
    # 生成PDM配置文件
    cat <<'EOF' | tee pyproject.toml
    [project]
    name = ""
    version = ""
    description = ""
    authors = [
        {name = "your_name", email = "your_email"},
    ]
    dependencies = [
        "tensorflow-directml==1.15.8",
        "matplotlib==3.3.4",
        "jupyter==1.0.0",
        "scipy==1.5.4",
    ]
    license = {text = "MIT"}
    requires-python = ">=3.6.2"
    
    [tool.pdm]
    
    [tool.pdm.dev-dependencies]
    lint = [
        "flake8",
        "black"
    ]
    
    [[tool.pdm.source]]
    url = "https://mirrors.aliyun.com/pypi/simple/"
    verify_ssl = true
    name = "pypi"
    
    [build-system]
    requires = ["flit_core >=3.2,<4"]
    build-backend = "flit_core.buildapi"
    'EOF'
    

    然后选择 py 版本,并下载依赖包。

    # 选择对应的python36版本
    ➜ pdm use
    Please enter the Python interpreter to use
    0. /home/bingo/.local/pipx/venvs/pdm/bin/python (3.8)
    1. /usr/bin/python3.8 (3.8)
    2. /home/bingo/.local/bin/python37 (3.7)
    3. /home/bingo/.local/bin/python36 (3.6)
    Please select (0): 3
    Using Python interpreter: /home/bingo/.local/bin/python36 (3.6)
    # 下载依赖
    ➜ pdm update --save-compatible
    
  3. 结合 vscode python 工作区使用

    vscode python 插件从 2022.10.0 开始不再支持 py36debug,要回滚至 v2022.8.1

    1. 创建 python 工作区,添加 python 相关开发的插件。vscode 配置、调试 python 的已经有很多教程了,自行百度。

    2. 将 PDM-Project 添加至工作区,方便后面复制 Path

    3. 将需要写的项目添加至工作区

    4. 在项目 .vscode 目录下添加 settings.json 文件(第一步的配置应该在工作区,这一步的配置只对项目生效),添加 pylance 的 extra 路径配置。(如果不配置,pylance 插件会提示缺少模块文件,以及没有对应的代码补全)

      // settings.json
      // 根据自己的PDM-Project/tensorflow-gpu库和py36路径调整
      {
          "python.autoComplete.extraPaths": [
              "your_path/PDM-Project/tensorflow-gpu/__pypackages__/3.6/lib"
          ],
          "python.analysis.extraPaths": [
              "your_path/PDM-Project/tensorflow-gpu/__pypackages__/3.6/lib"
          ],
          "python.analysis.autoSearchPaths": true,
          "python.defaultInterpreterPath": "your_py36Path",
          "python.envFile": "${workspaceFolder}/.env",
      }
      
    5. 在项目 .vscode 目录下添加 .env 文件,这样子 launchF5 的时候可以关联 python.analysis.extraPaths 声明的目录到 PYTHONPATH 变量。根据实际路径调整

      PYTHONPATH=your_path/PDM-Project/tensorflow-gpu/__pypackages__/3.6/lib
      

      不推荐在 .vsocode/launch.json 中添加 env,因为对 vscode-jupyter 不生效。

    6. 测试是否使用显卡(请务必用 vscode 的 luanch 运行,不然是无法链接到 python.analysis.extraPaths

      import tensorflow as tf
      
      tf.test.is_gpu_available()
      print(tf.test.is_gpu_available(cuda_only=False))
      
      # output
      DirectML device enumeration: found 1 compatible adapters.
      DirectML: creating device on adapter 0 (AMD Radeon(TM) Graphics
      True
      

  性能就不测试了,只能说比用 cpu 快那么一丢丢。

  ‍

注意事项

  1. 安装 amd 显卡驱动后,待机时 cpu 负载异常

    86c37d7d3fa5747ff790abd5db0644b.jpg
    在 WMI 错误事件中锁定 pid 号

    2491dfcd6d6c7e6feeddb3730aef2f2.jpg

    5cd3cec5e597f70217fbd5ff01228d5.jpg这是因为勾选了 amd 的匿名信息收集(AMD User Experience Program),在 amd 的驱动程序中关闭收集就好了。

  ‍

为什么使用 pdm?

  1. 节约空间,因为经常要从网上下载库,总会需要添加环境。如果是用 conda 的环境管理,每创建一个虚拟环境就会多拷贝一份 python 二进制文件、标准库。以及在多数项目中存在相同依赖包,在虚拟环境中,都是存在冗余的。

    pdm 并不创建虚拟环境(除了 pdm 运行本身会创建虚拟环境),并且模块库是通过 PEP582 本地链接的方式,可以极大节省硬盘空间(需要开启配置 install.cache = True install.cache_method = symlink)。(主要是我的 wsl2 装在固态硬盘上,能省则省)

    # 可以看到下载的模块文件基本都是软连接
    ➜ ls -al your_path/PDM-Project/tensorflow-gpu/__pypackages__/3.6/lib
    
    # 使用pdm后,依赖包的总空间占用大小
    ➜ du -sh ~/codeEnv/pyCache/packages/
    1.4G    /home/bingo/codeEnv/pyCache/packages/
    
  2. 有没有好方法复用当前配置好的项目开发环境?

    pdm2.0 推出了虚拟环境(本质上还是基于 virtualenv/venv/conda),我并不是很推荐这个。如果没有更改依赖的话,推荐将配置好的 .vscode 目录和 .env 目录拷贝到 PDM-Project 对应的项目目录下。后续要复用直接将这两个 copy 到新的项目目录下即可。

  image.png

  ‍

  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    548 引用 • 674 回帖
  • DirectML
    1 引用
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    54 引用 • 40 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 13 关注
  • OnlyOffice
    4 引用 • 14 关注
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 8 关注
  • 旅游

    希望你我能在旅途中找到人生的下一站。

    93 引用 • 901 回帖
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖
  • sts
    2 引用 • 2 回帖 • 203 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    107 引用 • 295 回帖 • 1 关注
  • 快应用

    快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。

    15 引用 • 127 回帖 • 1 关注
  • 京东

    京东是中国最大的自营式电商企业,2015 年第一季度在中国自营式 B2C 电商市场的占有率为 56.3%。2014 年 5 月,京东在美国纳斯达克证券交易所正式挂牌上市(股票代码:JD),是中国第一个成功赴美上市的大型综合型电商平台,与腾讯、百度等中国互联网巨头共同跻身全球前十大互联网公司排行榜。

    14 引用 • 102 回帖 • 330 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 23 关注
  • TGIF

    Thank God It's Friday! 感谢老天,总算到星期五啦!

    289 引用 • 4492 回帖 • 657 关注
  • Outlook
    1 引用 • 5 回帖
  • 运维

    互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。

    150 引用 • 257 回帖 • 1 关注
  • PostgreSQL

    PostgreSQL 是一款功能强大的企业级数据库系统,在 BSD 开源许可证下发布。

    22 引用 • 22 回帖 • 2 关注
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 303 关注
  • 尊园地产

    昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。

    1 引用 • 22 回帖 • 780 关注
  • V2Ray
    1 引用 • 15 回帖 • 4 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖
  • FFmpeg

    FFmpeg 是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。

    23 引用 • 32 回帖 • 1 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    70 引用 • 193 回帖 • 414 关注
  • Gzip

    gzip (GNU zip)是 GNU 自由软件的文件压缩程序。我们在 Linux 中经常会用到后缀为 .gz 的文件,它们就是 Gzip 格式的。现今已经成为互联网上使用非常普遍的一种数据压缩格式,或者说一种文件格式。

    9 引用 • 12 回帖 • 165 关注
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 66 关注
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖
  • 知乎

    知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。

    10 引用 • 66 回帖
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    5 引用 • 18 回帖 • 184 关注
  • SMTP

    SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。

    4 引用 • 18 回帖 • 625 关注
  • CSS

    CSS(Cascading Style Sheet)“层叠样式表”是用于控制网页样式并允许将样式信息与网页内容分离的一种标记性语言。

    197 引用 • 541 回帖 • 2 关注