有什么办法可以让复制的文本自动分块吗?

我从 txt 文件里复制了全篇文章,但复制到思源里,就变成了全篇文章都在一个块里,但上万的字一段一段分,不太现实,请问有解决办法吗?

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    25923 引用 • 107436 回帖 • 1 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    9951 引用 • 45204 回帖 • 77 关注

相关帖子

被采纳的回答

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 在文本编辑器里搜索替换,把一个换行替换为两个换行。然后复制粘贴到思源就会分块了

    1 回复
  • nightstars

    大佬,我一个文档里的块太多了,使用有点卡,我将其中没有内容的块删除,会流畅一点吗?

    1 回复
  • 是哪种卡?描述一下

    1 回复
  • nightstars

    加载这个文件时,界面会出现加载圈,等几秒才进去,进入后,上下滑动有点不流畅,输入也有点卡,不过,我现在手动将一些空白块删除后好很多了,

    1 回复
  • 听起来有点怪。

    1. 文档中有很多公式或者代码块吗?
    2. 设置里的动态加载块数是多大?
    3. 关掉所有插件、代码片段、主题,然后重启思源,会缓解吗?
    1 回复
  • nightstars

    image.png删减到这些,就不卡了。没有公式和代码块,纯文本,可能是某个块中字数太多了,后来,我把它分块了,插件那个没试过,我删除空白块,就不再卡了。重启可以缓解。

    1 回复
  • PearlLin

    写小说的话,要不要考虑拆成文档管理?
    用恐龙工具箱插件按标题拆分;
    对于章节(场景)的管理可以用动态数据库一次性加入到数据库,列表查看;每章字数统计和汇总字数统计的话,可以考虑这个基于 Query&View 挂件实现的文档字数统计可视化功能(新增折线图、柱状图) - 链滴
    对于上下文或上下章节的快速跳转,我使用文档上下文插件,直接快捷键探出面板查看路径、父级同级和子级文档。
    ——
    拆分开来管理的话,我体感性能会好很多。(在阅读书籍导入 epub 的时候,会有这种一文档几十万字的情况,大纲跳转是真的会卡)

    1 回复
  • nightstars

    我是分成了不同的卷,然后每卷在一个文档里,每章节用标题分开,直接按大纲跳转更快点。至于每章节的字数统计就用的我之前用 ai 生成的代码,

    每当文档时候卡时候,我就新开一个,这样倒也不错。

    至于代码,我不会用,所以就这样了,能用就行

  • suxiang999 1 评论

    image.png

    image.png

    如果是导小说

    让 ai 写 python 脚本,给你分块,并且把每一章的标题设置成大纲列表

    {前提是小说本身是校准过的,每一章有明确的标题}

    这是给 ai 看的提示词,你参考下吧

    写个脚本,用来处理长篇小说
    一,用正则表达式:第\d+ 章,搜索到所有的章节标题,章节标题所在的行的最前边加一个换行,最后边加一个换行,添加的是硬换行 enter 键
    二,每个章节标题设为二级标题,章节标题的{第}字和{章}字,还有空格去掉
    三,原文件路径,‪D:\各种备份\小说\小说 1\星空职业者.txt
    输出路径为,D:\各种备份\小说\小说 2\星空职业者.txt

    其中,原文件路径,和用脚本更改之后的文件路径,你需要自己设置下

    1 回复
    python 脚本不会用的话,让 ai 教你吧
    suxiang999
  • nightstars

    好的,感谢,我去学学

  • 有个现成的方法。渐进学习插件可以按照回车,或者标点符号进行拆分。把单个块拆分为多个块。还可以方向合并多个块为一个块。

请输入回帖内容 ...

推荐标签 标签

  • Kubernetes

    Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。

    118 引用 • 54 回帖 • 2 关注
  • sts
    2 引用 • 2 回帖 • 239 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 4 关注
  • 以太坊

    以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。

    34 引用 • 367 回帖
  • Caddy

    Caddy 是一款默认自动启用 HTTPS 的 HTTP/2 Web 服务器。

    10 引用 • 54 回帖 • 177 关注
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    172 引用 • 534 回帖
  • 微信

    腾讯公司 2011 年 1 月 21 日推出的一款手机通讯软件。用户可以通过摇一摇、搜索号码、扫描二维码等添加好友和关注公众平台,同时可以将自己看到的精彩内容分享到微信朋友圈。

    133 引用 • 796 回帖
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 676 关注
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    79 引用 • 431 回帖
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    36 引用 • 200 回帖 • 30 关注
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    59 引用 • 29 回帖 • 7 关注
  • Word
    13 引用 • 41 回帖
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖 • 1 关注
  • JSON

    JSON (JavaScript Object Notation)是一种轻量级的数据交换格式。易于人类阅读和编写。同时也易于机器解析和生成。

    52 引用 • 190 回帖
  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 640 关注
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 661 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    70 引用 • 193 回帖 • 415 关注
  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖 • 1 关注
  • Firefox

    Mozilla Firefox 中文俗称“火狐”(正式缩写为 Fx 或 fx,非正式缩写为 FF),是一个开源的网页浏览器,使用 Gecko 排版引擎,支持多种操作系统,如 Windows、OSX 及 Linux 等。

    7 引用 • 30 回帖 • 385 关注
  • GitLab

    GitLab 是利用 Ruby 一个开源的版本管理系统,实现一个自托管的 Git 项目仓库,可通过 Web 界面操作公开或私有项目。

    46 引用 • 72 回帖 • 1 关注
  • 前端

    前端技术一般分为前端设计和前端开发,前端设计可以理解为网站的视觉设计,前端开发则是网站的前台代码实现,包括 HTML、CSS 以及 JavaScript 等。

    246 引用 • 1338 回帖 • 2 关注
  • 锤子科技

    锤子科技(Smartisan)成立于 2012 年 5 月,是一家制造移动互联网终端设备的公司,公司的使命是用完美主义的工匠精神,打造用户体验一流的数码消费类产品(智能手机为主),改善人们的生活质量。

    4 引用 • 31 回帖 • 2 关注
  • Ruby

    Ruby 是一种开源的面向对象程序设计的服务器端脚本语言,在 20 世纪 90 年代中期由日本的松本行弘(まつもとゆきひろ/Yukihiro Matsumoto)设计并开发。在 Ruby 社区,松本也被称为马茨(Matz)。

    7 引用 • 31 回帖 • 257 关注
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    76 引用 • 1742 回帖 • 5 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    29 引用 • 230 回帖 • 128 关注
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    554 引用 • 675 回帖
  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    54 引用 • 37 回帖 • 4 关注