Python 操作 Word 文档


from zipfile import ZipFile
from urllib.request import urlopen
from io import BytesIO
from bs4 import BeautifulSoup

wordFile = urlopen("http://pythonscraping.com/pages/AWordDocument.docx").read()
wordFile = BytesIO(wordFile)
document = ZipFile(wordFile)
xml_content = document.read('word/document.xml')

# print(xml_content.decode('utf-8'))

wordObj = BeautifulSoup(xml_content.decode('utf-8'))
textStrings = wordObj.findAll("w:t")

for textElem in textStrings:
    closeTag = ""
  try:
        style = textElem.parent.previousSibling.find("w:pstyle")
        if style is not None and style["w:val"] == "Title":
            print("")
            closeTag = ""
  except AttributeError:
        #不打印标签
  pass
  print(textElem.text)
    print(closeTag)

# 参考：《Python网络数据采集》


import docx

# 加载Word文档
doc = docx.Document('test.docx')

# 统计段落数
print(len(doc.paragraphs))

# 段落
print(doc.paragraphs[0].text)
print(doc.paragraphs[0].style)

# 加入段落
doc.add_paragraph('Hello')

# Run对象
print(len(doc.paragraphs[0].runs))
print(doc.paragraphs[0].runs[0].text)
print(doc.paragraphs[0].runs[0].style)
doc.paragraphs[0].runs[0].underline = True

# 加入Run对象
doc.add_paragraph('Word').add_run(' hahaha')

doc.save('test.docx')

函数

函数就像「代码的魔法工具箱」，把常用的功能打包起来，随用随取。让我们用做奶茶的比喻来理解它~ ‍ 一、函数是什么？想象你开奶茶店：原料（水果、牛奶）→ 输入参数制作流程 → 函数内部的代码成品奶茶 → 返回值代码示例： # 定义「做奶茶」函数 def make_milk_tea(tea_base, toppi ..

控制流

控制流就像「程序的交通指挥官」，它决定代码该走哪条路、重复做什么事。让我们用最生活化的方式理解它~ ‍ 一、控制流是什么？想象你每天出门前：如果下雨 → 带伞（条件判断）重复刷牙 1 分钟 → 直到刷干净（循环）这就是生活中的控制流！编程中也一样 ‍ 二、条件判断：如果...就... 1️⃣ 最简单的 i ..

常用数据结构

数据结构就像「收纳数据的各种容器」️，不同的容器适合存放不同类型的数据。让我们用最生活化的方式认识它们吧~ ‍ 一、列表（List）→ 购物车特点：有顺序的容器可以随时增删改用方括号 [] 表示 # 创建购物车 cart = ['苹果', '笔记本', '️铅笔'] # 常用操作 cart.append('咖啡 ..

变量与数据类型

一、变量：就像贴标签的小盒子比喻：想象你有一个小盒子，上面贴着「零食盒」的标签，里面装了饼干。在编程中：变量名 = 盒子的标签（比如 my_snack）数据 = 盒子里的东西（比如 '饼干'）代码例子： # 把'饼干'放进叫my_snack的盒子里 my_snack = '饼干' # 查看盒子里有什么 prin ..

配置虚拟环境

虚拟环境管理（venv/pipenv/virtualenv/conda）为什么需要虚拟环境？隔离项目依赖：不同项目可能需要不同版本的 Python 或第三方库避免全局污染：防止系统 Python 环境被意外修改依赖可重现：方便团队协作和部署 1. venv（Python 内置，一般使用这个就够了，其他的知道有就 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

Python 操作 Word 文档

相关帖子

打包工具 -Pex

函数

控制流

常用数据结构

变量与数据类型

配置虚拟环境

认识开发工具

欢迎来到这里！

近期热议

推荐标签标签

最新标签

Python 操作 Word 文档

相关帖子

打包工具 -Pex

函数

控制流

常用数据结构

变量与数据类型

配置虚拟环境

认识开发工具

欢迎来到这里！

近期热议

推荐标签 标签

最新标签

推荐标签标签