表格数据提取

#!/usr/bin/python
# -*- coding: utf-8 -*-
# @Time  : 2020/12/14 13:07
# @Author : cuijianzhe
# @File  : xlwt.py
# @Software: PyCharm

import openpyxl
import requests
import os
import random
name = input('请输入表格名称:')
path = name + '.xlsx'
wb = openpyxl.load_workbook(path)

sheetnames = wb.sheetnames #获取文件中所有的sheet
sheetData = wb[sheetnames[0]]  #第一个sheet的内容

rows_max = sheetData.max_row  #最大行数
cols_max = sheetData.max_column  #最大列数

ApprovalNumber = sheetData.cell(row = 1,column = 4).value
def get_case(): #获取所有表头功能
    case_list = []
    for cols in range(1,cols_max):  #列数
        cases = sheetData.cell(row=1,column=cols).value
        case_list.append(cases.replace('\n\n','\n'))
    return case_list

def generate_code(char):
    all_char = '0123456789qazwsxedcrfvtgbyhnujmikolpQAZWSXEDCRFVTGBYHNUJIKOLP'
    index = len(all_char) - 1
    code = ''
    for _ in range(int(char)):
        num = random.randint(0,index)
        code += all_char[num]
        res = ''.join(code)
    return res

def get_carNum():
    '''    提取并添加站点名称    '''
    # 第一个方法使用列表
    cars_list = [] #存储车牌号
    try:
        for cols in range(1,cols_max):
            carNum = sheetData.cell(row = 1,column = cols).value #每列的值
            if carNum == '车牌号':
                for rows in range(2,rows_max+1):  #遍历最大行数
                    carnumName = sheetData.cell(row = rows,column=cols).value
                    if carnumName != "":
                        cars_list.append(carnumName)
                    else:
                        cars_list.append("空车牌号在第%s行"%(rows))
    except Exception as error:
        print('get车牌号错误', 'error:{}'.format(error))
    return cars_list

def get_url(case_list):
    url_list = []

    for cols in range(1, cols_max):  # 列数
        datas = sheetData.cell(row=1, column=cols).value
        if datas == case_list:
            for rows in range(2,rows_max+1):
                images_url = sheetData.cell(row=rows, column=cols).value
                if images_url != "":
                    url_list.append(images_url.replace('\n\n','\n'))
                else:  #如果此单元格可能为空的话，添加自定义链接占位
                    url_list.append('https://file.cjzshilong.cn/pictures_file/guohui-e67e7b3b.png\n')
        else:
            continue
    return url_list

def Download(url,car_name):
    for num in range(len(car_name)):
        ApprovalNumber = sheetData.cell(row=num+2, column=1).value  # 订单编号
        name = car_name[num] #车牌目录
        name_dir = car_name[num] + '_' + ApprovalNumber #同车牌 不同订单 创建目录
        list_files = os.listdir('./')
        if name not in list_files:
            os.mkdir(name)
            os.chdir(name)
            os.mkdir(name_dir)
            os.chdir(name_dir)
            file_list = url[num].split('\n')
            with open('./统计' + name_dir + '_' + generate_code(4)  + '的图片url_共计' + str(len(file_list)) + '条.txt', 'w', encoding='utf-8') as f:
                f.write(url[num])

            for url_car in file_list:
                if url_car != '':
                    response = requests.get(url_car)
                    with open(name +'_'+ generate_code(15) + '.jpg', 'wb') as car:
                         car.write(response.content)
                    print('%s下载完毕' %name_dir)

            os.chdir('../../')
        else:
            namedir_list = os.listdir('./' + name)
            os.chdir(name)
            if name_dir not in namedir_list:
                os.mkdir(name_dir)
                os.chdir(name_dir)
                file_list = url[num].split('\n')
                with open('./统计' + name_dir + '_' + generate_code(4)  + '的图片url_共计' + str(len(file_list)) + '条.txt', 'w', encoding='utf-8') as f:
                    f.write(url[num])

                for url_car in file_list:
                    if url_car != '':
                        response = requests.get(url_car)
                        with open(name +'_'+ generate_code(15) + '.jpg', 'wb') as car:
                             car.write(response.content)
                        print('%s下载完毕' %name_dir)
                os.chdir('../../')
            else:
                os.chdir(name_dir)
                file_list = url[num].split('\n')
                with open('./统计' + name_dir + '_' + generate_code(4) + '的图片url_共计' + str(len(file_list)) +  '条.txt', 'w', encoding='utf-8') as f:
                    f.write(url[num])

                for url_car in file_list:
                    if url_car != '':
                        response = requests.get(url_car)
                        with open(name + '_' + generate_code(15) + '.jpg', 'wb') as car:
                            car.write(response.content)
                        print('%s下载完毕' % name_dir)
                os.chdir('../../')

if __name__ == '__main__':
    case_list = ['车辆正面照&车辆安全检查照','司机安全照','起始用车仪盘公里数','结束用车仪盘公里数','路桥费照片','停车费照片']
    car_name = get_carNum()
    for func in case_list:
        url_img = get_url(func)
        Download(url_img, car_name)

Python 的内置函数列表

函数名详细简介 abs [链接] 计算绝对值 aiter [链接] 获取异步可迭代对象的迭代器 all [链接] 判断可迭代对象内容是否全部为真值 anext [链接] 获取异步迭代器的下一数据项 any [链接] 判断可迭代对象内容是否存在真值 ascii [链接] 转换为字符串，非 ASCII 字符将被转义 b ..

微信 / 支付宝账单整理二合一

每周/月手动整理账单比较麻烦，索性用 ai 写一个小工具，懒人党的福音~~ 效果如下： [图片] 使用方法双击账单整理工具.exe 运行程序选择导入微信账单.xlsx 选择导入支付宝账单.csv 提示选择保存的位置一会就生成好了整理后的二合一账单文件 [图片] 【可选项】可以配合 ledger.xlsx 复式记 ..

Dify 插件开发入门指南：在现有插件上改造出一个自己的插件

Dify 插件开发的官方文档非常详细，但对于初学者来说，可能会觉得有些复杂，不知道从何入手。本文将通过一个实战案例，带你一步步了解如何在现有插件仓库的基础上进行修改，开发出属于自己的插件。一、开发包准备首先参考官方文档中《获取 Dify Plugin 开发包》部分，安装好开发包即可。暂时不需要运行，安装到环境里就 ..

Python 包与环境管理简史：从混乱到优雅

Python 诞生三十余年，但在它的生态里，如何优雅地管理依赖和环境始终是一条漫长的探索之路。从 2004 年 easy_install 的横空出世，到今天集大成的 uv，无数开发者在“依赖地狱”与“环境隔离”之间寻找平衡。这篇文章想和你一起回顾过去二十年里 Python 依赖与环境管理工具的迭代，也分享我个人在这 ..

PyPI 包名的命名规则与 pip 的兼容性机制——为什么 pip install sCIKit.-_LEarN 也能成功

前言最近我在使用 pip install 命令安装包时，偶然发现在包名中使用下划线和使用连字符都可以成功安装，而且安装的确实是同一个包。这就激发了我的好奇心，难道 pip install 命令中下划线和连字符是等效的？于是我就去网上搜索了一下，并整理了相关资料写成这篇博文。 PyPI 包名规则 PyPA 编写的 [链 ..

人工智能生成合成内容标识方法解析：文件隐式标识的 Python 实践

前言 2025 年 9 月 1 日起，《人工智能生成合成内容标识办法》正式实行，AI 生成合成内容必须添加标识。与之相应的国家标准《网络安全技术人工智能生成合成内容标识方法》（GB45438—2025）也已经版本，其中说明了不同文件格式应当添加什么标识。具体来说，人工智能生成合成内容标识包含显式标识和隐式标识二种方式 ..

第四章二维数组

创建二维数组一、直接从列表/元组创建使用 np.array() 将嵌套列表或元组转换为二维数组（最基础方式）。 import numpy as np # 嵌套列表 → 二维数组 arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) print(arr) # 输出： # ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

表格数据提取

相关帖子

Python 的内置函数列表

微信 / 支付宝账单整理二合一

Dify 插件开发入门指南：在现有插件上改造出一个自己的插件

Python 包与环境管理简史：从混乱到优雅

PyPI 包名的命名规则与 pip 的兼容性机制——为什么 pip install sCIKit.-_LEarN 也能成功

人工智能生成合成内容标识方法解析：文件隐式标识的 Python 实践

第四章二维数组

欢迎来到这里！

近期热议

推荐标签标签

最新标签

表格数据提取

相关帖子

Python 的内置函数列表

微信 / 支付宝账单整理二合一

Dify 插件开发入门指南：在现有插件上改造出一个自己的插件

Python 包与环境管理简史：从混乱到优雅

PyPI 包名的命名规则与 pip 的兼容性机制——为什么 pip install sCIKit.-_LEarN 也能成功

人工智能生成合成内容标识方法解析：文件隐式标识的 Python 实践

第四章 二维数组

欢迎来到这里！

近期热议

推荐标签 标签

最新标签

第四章二维数组

推荐标签标签