段落开头的空格怎么正则匹配?

本贴最后更新于 305 天前,其中的信息可能已经事过境迁

image.png

很明显比一般的空格要宽,所以两个正好占了两个字符的位置,我也不知道怎么来的,从 epub 转 txt 后导入进思源就是这个样子,看着挺碍眼的想全给删除就不会了,不是 /s

  • 正则表达式

    正则表达式(Regular Expression)使用单个字符串来描述、匹配一系列遵循某个句法规则的字符串。

    31 引用 • 94 回帖 • 1 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    7271 引用 • 33153 回帖 • 203 关注

相关帖子

被采纳的回答
  • JeffreyChen 1 1 赞同

    「 」这个全角空格确实在思源里匹配不到,关键字、SQL、正则([\u3000])都不行,下面这个方法我拿一个文档试了试可以,但我不担保在你那里一定行:

    1. 首先在这个文档内不要引用其他文档的内容(不然导出的时候会把关联的文档全部一起导出)
    2. 在文档树把这个文档导出.sy.zip(并多复制一份以免出问题)
    3. 找到压缩包里对应的.sy 文件,单独解压出来,用记事本打开
    4. 在里面选一个全角空格复制,打开「替换」,粘贴查找、全部替换(「替换为」那里不用填东西),替换后的效果应该是去掉了所有的全角空格
    5. 然后保存文件,把这个.sy 文件再压缩进之前那个.sy.zip 压缩包(覆盖掉旧的.sy 文件)
    6. 再把这个.sy.zip 压缩包导入思源(随便在哪一个笔记本导入)

    如果还有问题你可以再问,如果问题解决了可以采纳一下回答

    image.png

    image.png

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • JeffreyChen 1 1 赞同 5 评论

    「 」这个全角空格确实在思源里匹配不到,关键字、SQL、正则([\u3000])都不行,下面这个方法我拿一个文档试了试可以,但我不担保在你那里一定行:

    1. 首先在这个文档内不要引用其他文档的内容(不然导出的时候会把关联的文档全部一起导出)
    2. 在文档树把这个文档导出.sy.zip(并多复制一份以免出问题)
    3. 找到压缩包里对应的.sy 文件,单独解压出来,用记事本打开
    4. 在里面选一个全角空格复制,打开「替换」,粘贴查找、全部替换(「替换为」那里不用填东西),替换后的效果应该是去掉了所有的全角空格
    5. 然后保存文件,把这个.sy 文件再压缩进之前那个.sy.zip 压缩包(覆盖掉旧的.sy 文件)
    6. 再把这个.sy.zip 压缩包导入思源(随便在哪一个笔记本导入)

    如果还有问题你可以再问,如果问题解决了可以采纳一下回答

    image.png

    image.png

    @88250 对了,为啥会匹配不了全角空格?
    JeffreyChen
    @a2930610542 输入会被 trim,所以只搜索空格的话输入就变成空字符串了。
    88250
    @88250 那正则为什么也匹配不了呢?是不是我正则用错了?
    JeffreyChen
    @a2930610542 \x{3000}
    88250
    @88250 这个确实可以了,就是只能匹配到前后都有文字的全角空格,前面没文字的还是不行
    JeffreyChen
  • ^[^\w]+

    这个行吗,先用这个测试一下,这个没有排除标点符号之类的,若需排除可以往[]里面加。

    1 回复
  • 你这个看起来不是直接匹配了所有段落嘛

    p.s.测试正则可以用这个在线工具:正则表达式在线测试 - 菜鸟工具

推荐标签 标签

  • SQLServer

    SQL Server 是由 [微软] 开发和推广的关系数据库管理系统(DBMS),它最初是由 微软、Sybase 和 Ashton-Tate 三家公司共同开发的,并于 1988 年推出了第一个 OS/2 版本。

    19 引用 • 31 回帖
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 641 关注
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    394 引用 • 1246 回帖 • 592 关注
  • Scala

    Scala 是一门多范式的编程语言,集成面向对象编程和函数式编程的各种特性。

    13 引用 • 11 回帖 • 114 关注
  • TensorFlow

    TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。

    20 引用 • 19 回帖 • 3 关注
  • 音乐

    你听到信仰的声音了么?

    60 引用 • 510 回帖 • 1 关注
  • Facebook

    Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。

    4 引用 • 15 回帖 • 460 关注
  • IPFS

    IPFS(InterPlanetary File System,星际文件系统)是永久的、去中心化保存和共享文件的方法,这是一种内容可寻址、版本化、点对点超媒体的分布式协议。请浏览 IPFS 入门笔记了解更多细节。

    20 引用 • 245 回帖 • 249 关注
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    334 引用 • 622 回帖
  • CodeMirror
    1 引用 • 2 回帖 • 127 关注
  • 安全

    安全永远都不是一个小问题。

    195 引用 • 813 回帖
  • 正则表达式

    正则表达式(Regular Expression)使用单个字符串来描述、匹配一系列遵循某个句法规则的字符串。

    31 引用 • 94 回帖 • 1 关注
  • Gzip

    gzip (GNU zip)是 GNU 自由软件的文件压缩程序。我们在 Linux 中经常会用到后缀为 .gz 的文件,它们就是 Gzip 格式的。现今已经成为互联网上使用非常普遍的一种数据压缩格式,或者说一种文件格式。

    9 引用 • 12 回帖 • 129 关注
  • 域名

    域名(Domain Name),简称域名、网域,是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。

    43 引用 • 208 回帖
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    175 引用 • 407 回帖 • 497 关注
  • GAE

    Google App Engine(GAE)是 Google 管理的数据中心中用于 WEB 应用程序的开发和托管的平台。2008 年 4 月 发布第一个测试版本。目前支持 Python、Java 和 Go 开发部署。全球已有数十万的开发者在其上开发了众多的应用。

    14 引用 • 42 回帖 • 714 关注
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    96 引用 • 155 回帖
  • jsDelivr

    jsDelivr 是一个开源的 CDN 服务,可为 npm 包、GitHub 仓库提供免费、快速并且可靠的全球 CDN 加速服务。

    5 引用 • 31 回帖 • 46 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 24 关注
  • Vditor

    Vditor 是一款浏览器端的 Markdown 编辑器,支持所见即所得、即时渲染(类似 Typora)和分屏预览模式。它使用 TypeScript 实现,支持原生 JavaScript、Vue、React 和 Angular。

    337 引用 • 1751 回帖 • 1 关注
  • PostgreSQL

    PostgreSQL 是一款功能强大的企业级数据库系统,在 BSD 开源许可证下发布。

    22 引用 • 22 回帖 • 1 关注
  • HHKB

    HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。

    5 引用 • 74 回帖 • 445 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    26 引用 • 222 回帖 • 173 关注
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    334 引用 • 323 回帖 • 12 关注
  • Kotlin

    Kotlin 是一种在 Java 虚拟机上运行的静态类型编程语言,由 JetBrains 设计开发并开源。Kotlin 可以编译成 Java 字节码,也可以编译成 JavaScript,方便在没有 JVM 的设备上运行。在 Google I/O 2017 中,Google 宣布 Kotlin 成为 Android 官方开发语言。

    19 引用 • 33 回帖 • 54 关注
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 704 关注
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    5 引用 • 26 回帖