改动 - 链滴

1.数据处理

整理好数据集按照要求：

先运行


import os
import tarfile

TRAIN_SRC_DIR = '/root/autodl-pub/ImageNet/ILSVRC2012/ILSVRC2012_img_train.tar'
TRAIN_DEST_DIR = '/root/autodl-tmp/imagenet/train'
VAL_SRC_DIR = '/root/autodl-pub/ImageNet/ILSVRC2012/ILSVRC2012_img_val.tar'
VAL_DEST_DIR = '/root/autodl-tmp/imagenet/val'


def extract_train():
    with open(TRAIN_SRC_DIR, 'rb') as f:
        tar = tarfile.open(fileobj=f, mode='r:')
        for i, item in enumerate(tar):
            cls_name = item.name.strip(".tar")
            a = tar.extractfile(item)
            b = tarfile.open(fileobj=a, mode="r:")
            e_path = "{}/{}/".format(TRAIN_DEST_DIR, cls_name)
            if not os.path.isdir(e_path):
                os.makedirs(e_path)
            print("#", i, "extract train dateset to >>>", e_path)
            names = b.getnames()
            for name in names:
                b.extract(name, e_path)


def extract_val():
    with open(VAL_SRC_DIR, 'rb') as f:
        tar = tarfile.open(fileobj=f, mode='r:')
        if not os.path.isdir(VAL_DEST_DIR):
            os.makedirs(VAL_DEST_DIR)
        print("extract val dateset to >>>", VAL_DEST_DIR)
        names = tar.getnames()
        for name in names:
            tar.extract(name, VAL_DEST_DIR)


if __name__ == '__main__':
    extract_train()
    extract_val()

再运行


import os
import tarfile

# TRAIN_SRC_DIR = '/root/autodl-pub/ImageNet/ILSVRC2012/ILSVRC2012_img_train.tar'
# TRAIN_DEST_DIR = '/root/autodl-tmp/imagenet/train'
VAL_SRC_DIR = '/root/autodl-pub/ImageNet/ILSVRC2012/ILSVRC2012_img_test.tar'
VAL_DEST_DIR = '/root/autodl-tmp/imagenet/test'


# def extract_train():
#     with open(TRAIN_SRC_DIR, 'rb') as f:
#         tar = tarfile.open(fileobj=f, mode='r:')
#         for i, item in enumerate(tar):
#             cls_name = item.name.strip(".tar")
#             a = tar.extractfile(item)
#             b = tarfile.open(fileobj=a, mode="r:")
#             e_path = "{}/{}/".format(TRAIN_DEST_DIR, cls_name)
#             if not os.path.isdir(e_path):
#                 os.makedirs(e_path)
#             print("#", i, "extract train dateset to >>>", e_path)
#             names = b.getnames()
#             for name in names:
#                 b.extract(name, e_path)


def extract_val():
    with open(VAL_SRC_DIR, 'rb') as f:
        tar = tarfile.open(fileobj=f, mode='r:')
        if not os.path.isdir(VAL_DEST_DIR):
            os.makedirs(VAL_DEST_DIR)
        print("extract val dateset to >>>", VAL_DEST_DIR)
        names = tar.getnames()
        for name in names:
            tar.extract(name, VAL_DEST_DIR)


if __name__ == '__main__':
    # extract_train()
    extract_val()

处理好数据差一个 label 文件

‍

我帮你处理好了处理过程就不说了比较繁琐

2.使用这个生成 extra 文件夹用于训练


from dinov2.data.datasets import ImageNet

for split in ImageNet.Split:
    dataset = ImageNet(split=split, root="/root/autodl-tmp/imagenet", extra="/root/autodl-tmp/extra")
    dataset.dump_extra()

过程中会报错 label

‍

在报错位置

class_id, class_name = row

修改为

class_id, class_name,*_ = row

‍

3.OK 环境已经配好

如果需要重新配

输入

conda env create -f conda.yaml
conda activate dinov2

即可

‍

运行过程中会报字符串错误将报错位置为止修改为：

def remove_suffix(s, suffix):
if s.endswith(suffix):
return s[:-len(suffix)]
return s

args.arch = remove_suffix(args.arch, "_memeff")

‍

4.运行

‍

github 给出的运行代码是在集群运行我们没法用

下面是单卡运行

配置我写好了：

首先

cd /root/dinov2

python setup.py install （已经做过了不用重复做）

然后 cd 到/root/dinov2/dinov2/train

source activte base

python main.py

直接跑起来了就

‍

5.配置

vitl16_short.yaml 修改为


train:
  dataset_path: ImageNet:split=TRAIN:root=/root/autodl-tmp/imagenet:extra=/root/autodl-tmp/extra
  batch_size_per_gpu: 8
student:
  block_chunks: 1

train.py 修改为

‍


parser.add_argument("--config-file", default="/root/dinov2/dinov2/configs/train/vitl16_short.yaml", metavar="FILE", help="path to config file")`  
parser.add_argument(
        "--output-dir",
        "--output_dir",
        default="~/output",
        type=str,
        help="Output directory to save logs and checkpoints",
    )

‍

函数

函数就像「代码的魔法工具箱」，把常用的功能打包起来，随用随取。让我们用做奶茶的比喻来理解它~ ‍ 一、函数是什么？想象你开奶茶店：原料（水果、牛奶）→ 输入参数制作流程 → 函数内部的代码成品奶茶 → 返回值代码示例： # 定义「做奶茶」函数 def make_milk_tea(tea_base, toppi ..

控制流

控制流就像「程序的交通指挥官」，它决定代码该走哪条路、重复做什么事。让我们用最生活化的方式理解它~ ‍ 一、控制流是什么？想象你每天出门前：如果下雨 → 带伞（条件判断）重复刷牙 1 分钟 → 直到刷干净（循环）这就是生活中的控制流！编程中也一样 ‍ 二、条件判断：如果...就... 1️⃣ 最简单的 i ..

常用数据结构

数据结构就像「收纳数据的各种容器」️，不同的容器适合存放不同类型的数据。让我们用最生活化的方式认识它们吧~ ‍ 一、列表（List）→ 购物车特点：有顺序的容器可以随时增删改用方括号 [] 表示 # 创建购物车 cart = ['苹果', '笔记本', '️铅笔'] # 常用操作 cart.append('咖啡 ..

变量与数据类型

一、变量：就像贴标签的小盒子比喻：想象你有一个小盒子，上面贴着「零食盒」的标签，里面装了饼干。在编程中：变量名 = 盒子的标签（比如 my_snack）数据 = 盒子里的东西（比如 '饼干'）代码例子： # 把'饼干'放进叫my_snack的盒子里 my_snack = '饼干' # 查看盒子里有什么 prin ..

配置虚拟环境

虚拟环境管理（venv/pipenv/virtualenv/conda）为什么需要虚拟环境？隔离项目依赖：不同项目可能需要不同版本的 Python 或第三方库避免全局污染：防止系统 Python 环境被意外修改依赖可重现：方便团队协作和部署 1. venv（Python 内置，一般使用这个就够了，其他的知道有就 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

改动

2.使用这个生成 extra 文件夹用于训练

3.OK 环境已经配好

4.运行

5.配置

相关帖子

打包工具 -Pex

函数

控制流

常用数据结构

变量与数据类型

配置虚拟环境

认识开发工具

欢迎来到这里！

改动

2.使用这个 生成 extra 文件夹用于训练

3.OK 环境已经配好

4.运行

5.配置

相关帖子

打包工具 -Pex

函数

控制流

常用数据结构

变量与数据类型

配置虚拟环境

认识开发工具

欢迎来到这里！

2.使用这个生成 extra 文件夹用于训练