关于使用 ExifTool 批量修复照片、视频的媒体创建时间,使其在相册正确排序,学习参考代码

本贴最后更新于 1111 天前,其中的信息可能已经时移俗易

如果一个照片、视频的的元数据中没有媒体创建时间的记录,那在相册中时,相册会默认以文件的创建时间、修改时间排序。

从网上下载来的照片、手机的截图、录屏视频,通常是没有媒体创建时间的。

假如你创建了一个此图片、视频的副本、修改版、压缩版,新文件的创建时间就会很新,本来一个拍摄日期很久远的照片,在相册中就会排到很靠前。

因此,有必要为视频、图片添加上正确的创建时间。

众所周知,视频、照片、截图、录屏的自动命名,都会用到创建时的时间戳,所以我们就可以以两个线索,对媒体文件的媒体创建时间元数据进行纠正:

  • 如果文件名中有正确的时间戳,就以文件名为线索纠正,写入到元数据
  • 如果文件名中没有正确的时间戳,就以文件的创建时间为线索,写入到元数据

ExifTool 可以对多种格式(包括视频、图片)读写元数据,用它来修复再合适不过了。

考虑到可能有许多文件需要批处理,还要判断原文件是否有正确的时间元数据,因此一般几行命令行无法满足需求,因此我写了个 Python 脚本,可以

  • 对文件、文件夹自动判断,如果是文件夹,就进行递归操作
  • 判断有没有正确的时间元数据
  • 根据上述两条线索修复时间元数据
  • 利用 ExifTool 的 -stay_open 参数,在一个实例中操作所有图片,而不是每一个图片都要打开一个 ExifTool 实例,因此操作速度飞起!

另外也学习到,原来文件名中加入时间戳这么重要!

实现效果:

image.png

image.png

代码链接: 拖入处理文件/修复照片视频创建时间.py · 淳帅二代/我的 Python 脚本

代码:

'''
脚本作用:

使用 exiftool 根据文件名、新建时间,纠正文件元数据中的媒体创建时间。
使用前要先确保 exiftool 可执行文件路径已添加到环境变量

使用方法:

python 本脚本名字.py 文件或文件夹路径 其它文件或文件夹路径

(如果是文件夹路径,会递归修复。如果检测到有媒体创建时间,则不会改动原文件)



'''

import sys, time, os
from os import path
import subprocess, shlex, re
import locale
from pprint import pprint
from datetime import datetime

# 合法图片后缀,一行一个
图片后缀 = '''
.jpg
.jpeg
.png
.webp
.heic
'''.strip()

# 合法视频后缀,一行一个
视频后缀 = '''
.mp4
.webm
.flv
.mkv
'''.strip()

def 处理文件(process, 文件路径):
  
    def 开始执行():
        process.stdin.write(f'-execute\n')
        process.stdin.flush()
        fd = process.stdout.fileno()
        output = b''
        while not output.decode(locale.getpreferredencoding()).strip().endswith(r'{ready}'):
            output += os.read(fd, 4096)
        output = output.decode().strip()[:-len(r'{ready}')].strip()
        return output
  
    # 时区用于调整视频 UTC 时间
    时区 = time.strftime("%z", time.gmtime())
    时区小时, 时区分钟 = 时区[1:3], 时区[3:5]
  
    # 先看下有没有媒体创建时间
    process.stdin.write(f'-s\n') 
    process.stdin.write(f'-s\n') 
    process.stdin.write(f'-s\n') 
    process.stdin.write(f'-createdate\n')
    process.stdin.write(f'{文件路径}\n')
    output = 开始执行()
    # 对于图片文件,只要有 createdate,就是有
    # 对于视频文件,如果没有 createdate,读出来的就全是 0000:00:00 00:00:00
    # 这时,如果都是 0,也应当纠正下时间
    output_num = ''.join(re.findall(r'\d+', output))
  
  
    if output and int(output_num):
        print(f'    文件已有媒体创建时间:{output}')
    else:
        print(f'    文件缺失媒体创建时间')
        文件名 = path.basename(文件路径)
        文件名时间 = 从文件名得到时间(文件名)
        if 文件名时间:
            print(f'    使用文件名纠正媒体创建时间')
            process.stdin.write(f'-alldates={文件名时间}\n')
        else:
            print(f'    使用文件创建时间纠正媒体创建时间')
            process.stdin.write(f'-alldates<FileCreateDate\n')
  
        process.stdin.write(f'-overwrite_original\n')
        process.stdin.write(f'{文件路径}\n')
        开始执行()
  
        if path.splitext(文件路径)[1] in 视频后缀.splitlines():
            print(f'    对视频文件元数据纠正 UTC 偏差:{时区小时}:{时区分钟}:00')
            process.stdin.write(f'-alldates-={时区小时}:{时区分钟}:00\n')
            process.stdin.write(f'-overwrite_original\n')
            process.stdin.write(f'{文件路径}\n')
            开始执行()
    print('\n')

def 获得文件夹内所有媒体文件(文件夹路径):
    文件列表 = []
    for root, dirs, files in os.walk(文件夹路径):
        for file in files:
            文件路径 = path.join(root, file)
            if path.splitext(文件路径)[1].lower() in 图片后缀.splitlines() + 视频后缀.splitlines():
                文件列表.append(文件路径)
    return 文件列表


def 从文件名得到时间(文件名):
    全数字 = ''.join(re.findall(r'\d+', 文件名))
    当前时间 = datetime.now()

    try:
        # 类似 IMG_20170606_192311.jpg
        数字转时间 = datetime.fromisoformat(
            f'{全数字[0:4]}-{全数字[4:6]}-{全数字[6:8]} {全数字[8:10]}:{全数字[10:12]}:{全数字[12:14]}'
        )
        if 数字转时间 < 当前时间:
            return 数字转时间
    except:
        ...

    try:
        # 类似 mmexport1111467816512.jpg
        数字转时间 = datetime.fromtimestamp(
            int(全数字[0:13]) / 1000
        )
        if 数字转时间 < 当前时间:
            return 数字转时间
    except:
        ...

    try:
        # 类似 121301190818c8f0c7010755.mp4
        数字转时间 = datetime.fromisoformat(
            f'20{全数字[10:12]}-{全数字[8:10]}-{全数字[6:8]} {全数字[4:6]}:{全数字[2:4]}:{全数字[0:2]}').timestamp()
        if 数字转时间 < 当前时间:
            return 数字转时间
    except:
        ...

    return False

def main():
    process = subprocess.Popen(
        shlex.split(
            f'exiftool -stay_open True -@ -'
        ), 
        stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.DEVNULL, 
        encoding=locale.getpreferredencoding()
    )
  
    总文件列表 = []
    for 路径 in sys.argv[1:]:
        if path.isfile(路径):
            if path.splitext(路径)[1].lower() in 图片后缀.splitlines() + 视频后缀.splitlines():
                总文件列表.append(路径)
        elif path.isdir(路径):
            总文件列表 += 获得文件夹内所有媒体文件(路径)
  
    for index, 文件 in enumerate(总文件列表):
        print(f'正在处理第 {index + 1} 个,总共有 {len(总文件列表)} 个')
        print(f'    文件路径:{文件}')
        处理文件(process, 文件)

    process.communicate('-stay_open\nFalse\n')
    input('处理结束,回车结束\n')

if __name__ == '__main__':
    main()


  • Exif
    4 引用 • 13 回帖
  • 工具

    子曰:“工欲善其事,必先利其器。”

    285 引用 • 728 回帖
2 操作
HaujetZhao 在 2021-10-22 01:08:13 更新了该帖
HaujetZhao 在 2021-10-22 01:06:49 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    77 引用 • 429 回帖
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖 • 1 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 15 关注
  • 分享

    有什么新发现就分享给大家吧!

    247 引用 • 1792 回帖 • 7 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 6 关注
  • 强迫症

    强迫症(OCD)属于焦虑障碍的一种类型,是一组以强迫思维和强迫行为为主要临床表现的神经精神疾病,其特点为有意识的强迫和反强迫并存,一些毫无意义、甚至违背自己意愿的想法或冲动反反复复侵入患者的日常生活。

    15 引用 • 161 回帖 • 1 关注
  • 负能量

    上帝为你关上了一扇门,然后就去睡觉了....努力不一定能成功,但不努力一定很轻松 (° ー °〃)

    88 引用 • 1235 回帖 • 406 关注
  • sts
    2 引用 • 2 回帖 • 193 关注
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    124 引用 • 169 回帖
  • MongoDB

    MongoDB(来自于英文单词“Humongous”,中文含义为“庞大”)是一个基于分布式文件存储的数据库,由 C++ 语言编写。旨在为应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似 JSON 的 BSON 格式,因此可以存储比较复杂的数据类型。

    90 引用 • 59 回帖 • 5 关注
  • Hprose

    Hprose 是一款先进的轻量级、跨语言、跨平台、无侵入式、高性能动态远程对象调用引擎库。它不仅简单易用,而且功能强大。你无需专门学习,只需看上几眼,就能用它轻松构建分布式应用系统。

    9 引用 • 17 回帖 • 615 关注
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    41 引用 • 130 回帖 • 260 关注
  • IPFS

    IPFS(InterPlanetary File System,星际文件系统)是永久的、去中心化保存和共享文件的方法,这是一种内容可寻址、版本化、点对点超媒体的分布式协议。请浏览 IPFS 入门笔记了解更多细节。

    21 引用 • 245 回帖 • 248 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    70 引用 • 193 回帖 • 436 关注
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    8 引用 • 26 回帖 • 1 关注
  • Ngui

    Ngui 是一个 GUI 的排版显示引擎和跨平台的 GUI 应用程序开发框架,基于
    Node.js / OpenGL。目标是在此基础上开发 GUI 应用程序可拥有开发 WEB 应用般简单与速度同时兼顾 Native 应用程序的性能与体验。

    7 引用 • 9 回帖 • 388 关注
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 652 关注
  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 586 关注
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3186 引用 • 8212 回帖 • 1 关注
  • GitHub

    GitHub 于 2008 年上线,目前,除了 Git 代码仓库托管及基本的 Web 管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。正因为这些功能所提供的便利,又经过长期的积累,GitHub 的用户活跃度很高,在开源世界里享有深远的声望,并形成了社交化编程文化(Social Coding)。

    209 引用 • 2031 回帖
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 347 关注
  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 97 关注
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用 • 1 关注
  • Docker

    Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的操作系统上。容器完全使用沙箱机制,几乎没有性能开销,可以很容易地在机器和数据中心中运行。

    490 引用 • 916 回帖 • 1 关注
  • FFmpeg

    FFmpeg 是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。

    23 引用 • 32 回帖 • 3 关注
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    58 引用 • 22 回帖 • 5 关注