从事法律相关的行业,在收集的一些法律法规,自己起草的一些文件中,经常遇到一些有中文特点的文档结构,我自己此前在一些文档工具中通过使用宏命令 + 正则表达式的方式进行过简单处理,实现了这些功能:
- 中文段首、段尾、中间的空格删除
- 中文中“第 x 章、第 x 节、第 x 条、(一)、1.” 类似的中文文档序号,通过正则表达式标记 markdown 标识成二级标题、三级标题、第 x 条加粗显示后面通过空格连接正文、并且自动排序,更智能的是应该第一次出现时标记,后面出现的可能只是对前面的引用
- 加中文文档中的英文标点符号自动替换成中文,如()应该是()
其实也用 ChatGPT 实现过类似的功能,效果也是比较好的。
感谢开发者的关注
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于