核显 DirectML 深度学习环境

本贴最后更新于 808 天前,其中的信息可能已经沧海桑田

参考文档:

  tensorflow-directml 官方文档

  Enable TensorFlow with DirectML in WSL

  ‍

  环境: win10 + wsl2-ubuntu20.04

  安装显卡驱动(确保型号匹配,我是 amd 的 r5 核显):

  1. py36 环境安装

    截至 2022 年 10 月 5 日, tensorflow-directml==1.15.8 最高支持 py37,但是其依赖 gast 0.2.2 并不支持 pep517 的方式安装,推荐用 py36 版本。
    若已有 py3.6 或者用 conda 安装可以跳过这一步。

    cd $HOME
    curl -Lo https://www.python.org/ftp/python/3.6.14/Python-3.6.14.tar.xz
    tar xJvf Python-3.6.14.tar.xz 
    cd Python-3.6.14
    install -dv $HOME/.local/lib/python3.6
    ./configure --prefix=$HOME/.local/lib/python3.6
    make && make install
    
    # 添加环境变量
    install -dv $HOME/.local/bin/
    ln -s $HOME/.local/lib/python3.6/bin/python3.6 $HOME/.local/bin/python36
    # 检测是否成功
    python36 -V
    # Python 3.6.14
    
    # 安装成功后移除安装包
    rm -rf Python-3.6.14/ Python-3.6.14.tar.xz
    
  2. pdm 配置

    仍推荐直接用 conda,用 pdm 多半是为了节省硬盘。pdm 安装和使用可以参考 pdm 简易使用说明pdm 官方手册

    自行添加需要的依赖。注意,因为使用 py3.6,所以 py 模块的编译使用的是 flit_core, 而非 pdm 默认的 pdm.pep517.api

    install -dv PDM-Project/tensorflow-gpu
    cd PDM-Project/tensorflow-gpu
    # 生成PDM配置文件
    cat <<'EOF' | tee pyproject.toml
    [project]
    name = ""
    version = ""
    description = ""
    authors = [
        {name = "your_name", email = "your_email"},
    ]
    dependencies = [
        "tensorflow-directml==1.15.8",
        "matplotlib==3.3.4",
        "jupyter==1.0.0",
        "scipy==1.5.4",
    ]
    license = {text = "MIT"}
    requires-python = ">=3.6.2"
    
    [tool.pdm]
    
    [tool.pdm.dev-dependencies]
    lint = [
        "flake8",
        "black"
    ]
    
    [[tool.pdm.source]]
    url = "https://mirrors.aliyun.com/pypi/simple/"
    verify_ssl = true
    name = "pypi"
    
    [build-system]
    requires = ["flit_core >=3.2,<4"]
    build-backend = "flit_core.buildapi"
    'EOF'
    

    然后选择 py 版本,并下载依赖包。

    # 选择对应的python36版本
    ➜ pdm use
    Please enter the Python interpreter to use
    0. /home/bingo/.local/pipx/venvs/pdm/bin/python (3.8)
    1. /usr/bin/python3.8 (3.8)
    2. /home/bingo/.local/bin/python37 (3.7)
    3. /home/bingo/.local/bin/python36 (3.6)
    Please select (0): 3
    Using Python interpreter: /home/bingo/.local/bin/python36 (3.6)
    # 下载依赖
    ➜ pdm update --save-compatible
    
  3. 结合 vscode python 工作区使用

    vscode python 插件从 2022.10.0 开始不再支持 py36debug,要回滚至 v2022.8.1

    1. 创建 python 工作区,添加 python 相关开发的插件。vscode 配置、调试 python 的已经有很多教程了,自行百度。

    2. 将 PDM-Project 添加至工作区,方便后面复制 Path

    3. 将需要写的项目添加至工作区

    4. 在项目 .vscode 目录下添加 settings.json 文件(第一步的配置应该在工作区,这一步的配置只对项目生效),添加 pylance 的 extra 路径配置。(如果不配置,pylance 插件会提示缺少模块文件,以及没有对应的代码补全)

      // settings.json
      // 根据自己的PDM-Project/tensorflow-gpu库和py36路径调整
      {
          "python.autoComplete.extraPaths": [
              "your_path/PDM-Project/tensorflow-gpu/__pypackages__/3.6/lib"
          ],
          "python.analysis.extraPaths": [
              "your_path/PDM-Project/tensorflow-gpu/__pypackages__/3.6/lib"
          ],
          "python.analysis.autoSearchPaths": true,
          "python.defaultInterpreterPath": "your_py36Path",
          "python.envFile": "${workspaceFolder}/.env",
      }
      
    5. 在项目 .vscode 目录下添加 .env 文件,这样子 launchF5 的时候可以关联 python.analysis.extraPaths 声明的目录到 PYTHONPATH 变量。根据实际路径调整

      PYTHONPATH=your_path/PDM-Project/tensorflow-gpu/__pypackages__/3.6/lib
      

      不推荐在 .vsocode/launch.json 中添加 env,因为对 vscode-jupyter 不生效。

    6. 测试是否使用显卡(请务必用 vscode 的 luanch 运行,不然是无法链接到 python.analysis.extraPaths

      import tensorflow as tf
      
      tf.test.is_gpu_available()
      print(tf.test.is_gpu_available(cuda_only=False))
      
      # output
      DirectML device enumeration: found 1 compatible adapters.
      DirectML: creating device on adapter 0 (AMD Radeon(TM) Graphics
      True
      

  性能就不测试了,只能说比用 cpu 快那么一丢丢。

  ‍

注意事项

  1. 安装 amd 显卡驱动后,待机时 cpu 负载异常

    86c37d7d3fa5747ff790abd5db0644b.jpg
    在 WMI 错误事件中锁定 pid 号

    2491dfcd6d6c7e6feeddb3730aef2f2.jpg

    5cd3cec5e597f70217fbd5ff01228d5.jpg这是因为勾选了 amd 的匿名信息收集(AMD User Experience Program),在 amd 的驱动程序中关闭收集就好了。

  ‍

为什么使用 pdm?

  1. 节约空间,因为经常要从网上下载库,总会需要添加环境。如果是用 conda 的环境管理,每创建一个虚拟环境就会多拷贝一份 python 二进制文件、标准库。以及在多数项目中存在相同依赖包,在虚拟环境中,都是存在冗余的。

    pdm 并不创建虚拟环境(除了 pdm 运行本身会创建虚拟环境),并且模块库是通过 PEP582 本地链接的方式,可以极大节省硬盘空间(需要开启配置 install.cache = True install.cache_method = symlink)。(主要是我的 wsl2 装在固态硬盘上,能省则省)

    # 可以看到下载的模块文件基本都是软连接
    ➜ ls -al your_path/PDM-Project/tensorflow-gpu/__pypackages__/3.6/lib
    
    # 使用pdm后,依赖包的总空间占用大小
    ➜ du -sh ~/codeEnv/pyCache/packages/
    1.4G    /home/bingo/codeEnv/pyCache/packages/
    
  2. 有没有好方法复用当前配置好的项目开发环境?

    pdm2.0 推出了虚拟环境(本质上还是基于 virtualenv/venv/conda),我并不是很推荐这个。如果没有更改依赖的话,推荐将配置好的 .vscode 目录和 .env 目录拷贝到 PDM-Project 对应的项目目录下。后续要复用直接将这两个 copy 到新的项目目录下即可。

  image.png

  ‍

  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    545 引用 • 672 回帖
  • DirectML
    1 引用
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    53 引用 • 40 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Ruby

    Ruby 是一种开源的面向对象程序设计的服务器端脚本语言,在 20 世纪 90 年代中期由日本的松本行弘(まつもとゆきひろ/Yukihiro Matsumoto)设计并开发。在 Ruby 社区,松本也被称为马茨(Matz)。

    7 引用 • 31 回帖 • 216 关注
  • 以太坊

    以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。

    34 引用 • 367 回帖 • 1 关注
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖 • 1 关注
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖 • 5 关注
  • CodeMirror
    1 引用 • 2 回帖 • 129 关注
  • Swagger

    Swagger 是一款非常流行的 API 开发工具,它遵循 OpenAPI Specification(这是一种通用的、和编程语言无关的 API 描述规范)。Swagger 贯穿整个 API 生命周期,如 API 的设计、编写文档、测试和部署。

    26 引用 • 35 回帖 • 5 关注
  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 591 关注
  • 旅游

    希望你我能在旅途中找到人生的下一站。

    93 引用 • 899 回帖 • 3 关注
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用
  • Mac

    Mac 是苹果公司自 1984 年起以“Macintosh”开始开发的个人消费型计算机,如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro 等计算机。

    166 引用 • 595 回帖
  • 博客

    记录并分享人生的经历。

    273 引用 • 2388 回帖 • 1 关注
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 536 关注
  • QQ

    1999 年 2 月腾讯正式推出“腾讯 QQ”,在线用户由 1999 年的 2 人(马化腾和张志东)到现在已经发展到上亿用户了,在线人数超过一亿,是目前使用最广泛的聊天软件之一。

    45 引用 • 557 回帖 • 44 关注
  • Markdown

    Markdown 是一种轻量级标记语言,用户可使用纯文本编辑器来排版文档,最终通过 Markdown 引擎将文档转换为所需格式(比如 HTML、PDF 等)。

    167 引用 • 1520 回帖 • 1 关注
  • 黑曜石

    黑曜石是一款强大的知识库工具,支持本地 Markdown 文件编辑,支持双向链接和关系图。

    A second brain, for you, forever.

    16 引用 • 130 回帖
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    76 引用 • 1737 回帖
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    343 引用 • 723 回帖
  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    21 引用 • 37 回帖 • 548 关注
  • LeetCode

    LeetCode(力扣)是一个全球极客挚爱的高质量技术成长平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer!

    209 引用 • 72 回帖
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 6 关注
  • 阿里巴巴

    阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的 18 人,于 1999 年在中国杭州创立,他们相信互联网能够创造公平的竞争环境,让小企业通过创新与科技扩展业务,并在参与国内或全球市场竞争时处于更有利的位置。

    43 引用 • 221 回帖 • 106 关注
  • Spring

    Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。

    943 引用 • 1460 回帖 • 3 关注
  • 微信

    腾讯公司 2011 年 1 月 21 日推出的一款手机通讯软件。用户可以通过摇一摇、搜索号码、扫描二维码等添加好友和关注公众平台,同时可以将自己看到的精彩内容分享到微信朋友圈。

    132 引用 • 795 回帖
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖 • 5 关注
  • App

    App(应用程序,Application 的缩写)一般指手机软件。

    91 引用 • 384 回帖 • 2 关注
  • Node.js

    Node.js 是一个基于 Chrome JavaScript 运行时建立的平台, 用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞 I/O 模型而得以轻量和高效。

    139 引用 • 269 回帖 • 28 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 7 关注