段落开头的空格怎么正则匹配?

本贴最后更新于 542 天前,其中的信息可能已经事过境迁

image.png

很明显比一般的空格要宽,所以两个正好占了两个字符的位置,我也不知道怎么来的,从 epub 转 txt 后导入进思源就是这个样子,看着挺碍眼的想全给删除就不会了,不是 /s

  • 正则表达式

    正则表达式(Regular Expression)使用单个字符串来描述、匹配一系列遵循某个句法规则的字符串。

    31 引用 • 94 回帖
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    9589 引用 • 43610 回帖 • 97 关注

相关帖子

被采纳的回答
  • JeffreyChen 1 1 赞同

    「 」这个全角空格确实在思源里匹配不到,关键字、SQL、正则([\u3000])都不行,下面这个方法我拿一个文档试了试可以,但我不担保在你那里一定行:

    1. 首先在这个文档内不要引用其他文档的内容(不然导出的时候会把关联的文档全部一起导出)
    2. 在文档树把这个文档导出.sy.zip(并多复制一份以免出问题)
    3. 找到压缩包里对应的.sy 文件,单独解压出来,用记事本打开
    4. 在里面选一个全角空格复制,打开「替换」,粘贴查找、全部替换(「替换为」那里不用填东西),替换后的效果应该是去掉了所有的全角空格
    5. 然后保存文件,把这个.sy 文件再压缩进之前那个.sy.zip 压缩包(覆盖掉旧的.sy 文件)
    6. 再把这个.sy.zip 压缩包导入思源(随便在哪一个笔记本导入)

    如果还有问题你可以再问,如果问题解决了可以采纳一下回答

    image.png

    image.png

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • JeffreyChen 1 1 赞同 5 评论

    「 」这个全角空格确实在思源里匹配不到,关键字、SQL、正则([\u3000])都不行,下面这个方法我拿一个文档试了试可以,但我不担保在你那里一定行:

    1. 首先在这个文档内不要引用其他文档的内容(不然导出的时候会把关联的文档全部一起导出)
    2. 在文档树把这个文档导出.sy.zip(并多复制一份以免出问题)
    3. 找到压缩包里对应的.sy 文件,单独解压出来,用记事本打开
    4. 在里面选一个全角空格复制,打开「替换」,粘贴查找、全部替换(「替换为」那里不用填东西),替换后的效果应该是去掉了所有的全角空格
    5. 然后保存文件,把这个.sy 文件再压缩进之前那个.sy.zip 压缩包(覆盖掉旧的.sy 文件)
    6. 再把这个.sy.zip 压缩包导入思源(随便在哪一个笔记本导入)

    如果还有问题你可以再问,如果问题解决了可以采纳一下回答

    image.png

    image.png

    @88250 对了,为啥会匹配不了全角空格?
    JeffreyChen
    @a2930610542 输入会被 trim,所以只搜索空格的话输入就变成空字符串了。
    88250
    @88250 那正则为什么也匹配不了呢?是不是我正则用错了?
    JeffreyChen
    @a2930610542 \x{3000}
    88250
    @88250 这个确实可以了,就是只能匹配到前后都有文字的全角空格,前面没文字的还是不行
    JeffreyChen
  • 其他回帖
  • 你这个看起来不是直接匹配了所有段落嘛

    p.s.测试正则可以用这个在线工具:正则表达式在线测试 - 菜鸟工具

  • ^[^\w]+

    这个行吗,先用这个测试一下,这个没有排除标点符号之类的,若需排除可以往[]里面加。

    1 回复

推荐标签 标签

  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    173 引用 • 414 回帖 • 367 关注
  • OpenResty

    OpenResty 是一个基于 NGINX 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

    17 引用 • 56 关注
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    58 引用 • 22 回帖 • 10 关注
  • V2Ray
    1 引用 • 15 回帖
  • 倾城之链
    23 引用 • 66 回帖 • 164 关注
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    143 引用 • 442 回帖
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    211 引用 • 358 回帖
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 295 关注
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖
  • TensorFlow

    TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。

    20 引用 • 19 回帖 • 1 关注
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    127 引用 • 169 回帖
  • CodeMirror
    2 引用 • 17 回帖 • 159 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    25125 引用 • 103584 回帖
  • Gzip

    gzip (GNU zip)是 GNU 自由软件的文件压缩程序。我们在 Linux 中经常会用到后缀为 .gz 的文件,它们就是 Gzip 格式的。现今已经成为互联网上使用非常普遍的一种数据压缩格式,或者说一种文件格式。

    9 引用 • 12 回帖 • 165 关注
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 459 关注
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖 • 1 关注
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    17 引用 • 53 回帖 • 146 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    28 引用 • 197 回帖 • 33 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    28 引用 • 226 回帖 • 134 关注
  • uTools

    uTools 是一个极简、插件化、跨平台的现代桌面软件。通过自由选配丰富的插件,打造你得心应手的工具集合。

    7 引用 • 27 回帖
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 4 关注
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    12 引用 • 5 回帖 • 636 关注
  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 642 关注
  • GraphQL

    GraphQL 是一个用于 API 的查询语言,是一个使用基于类型系统来执行查询的服务端运行时(类型系统由你的数据定义)。GraphQL 并没有和任何特定数据库或者存储引擎绑定,而是依靠你现有的代码和数据支撑。

    4 引用 • 3 回帖 • 5 关注
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    42 引用 • 130 回帖 • 248 关注
  • Shell

    Shell 脚本与 Windows/Dos 下的批处理相似,也就是用各类命令预先放入到一个文件中,方便一次性执行的一个程序文件,主要是方便管理员进行设置或者管理用的。但是它比 Windows 下的批处理更强大,比用其他编程程序编辑的程序效率更高,因为它使用了 Linux/Unix 下的命令。

    124 引用 • 74 回帖
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 644 关注