长文本处理需求 - 百万字小说

本贴最后更新于 401 天前,其中的信息可能已经时异事殊

嗯,我尝试提一下需求吧,告诉一下各位有这个需求,以及理由,并尝试探讨如何解决。

我发现思源其实按理来说比较适合看书,但是,一直没啥机会用,最近尝试导入 txt 文本看书,然后就发现需求了。

  1. 首先就是章节,我不太可能一个个去设置为一级标题,这样看目录就不太方便。
  2. 其次,有点卡(当然只是导入,以及大幅度翻页的时候会容易卡,但还可以接受。)
  3. 双页阅读,我这人比较喜欢双页,这样更适合大屏,以及眼睛活动,还能减少操作幅度。(不过这样可能就不太适合上下滚动翻页,就比较需要翻页。)
  4. 其实按理说,如果我在各类正版网站看是没问题的,我也经常看,花了不少钱,但是我总觉得,那些书,我看了,仍然不是我的,书籍以本地形式存储更有一种安心的感觉,类似放在家里书房,闲着没事就来看看。
  5. 书页宽度,我知道能改,但难道每次看书我都要改,不看又要改回来吗,这也是我说要双页阅读的原因,这样不管怎么样起码不会看着看着丢行。
  6. 其实按理来说,如果接入开源阅读会是个比较好的选择,可惜那个无 pc 版,而且如果以浏览器访问,效果不太好。
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23014 引用 • 92567 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 你这些需求不太建议用思源实现,还是看看有没有其他替代品吧

    1 回复
  • 纯 txt 的直接用专门的 APP 看就行了,阅读啥的。如果要导入思源看,就要先在外面预处理一下,这种也很多教程,批量替换啥的,加上标题、分开章节甚至分开文档。

    1 回复
  • 5Z4Uo6oGvKPB7o 2 赞同

    你的需求内容是一款阅读器的功能。思源是笔记软件,可能不太适合。

    可以考虑 txt 导入微信读书,移动端 + 网页端阅读体验都挺好的,而且可以自动同步阅读进度(这一点思源笔记也做不到)。读完后结合思源笔记集市的【微信读书】插件,可以同步划线笔记等内容。

    1 回复
  • 😄 我之前想这样看,结果发现太弱了。后来还是在 word 里面看

    替换格式把带章节的替换成标题格式、也支持双页

    1 回复
  • 我曾经处理过,用替换功能,将章节名替换为 思源的标题,这样思源的大纲就是书的目录了,然后导出 epub…剩下的就是阅读器的事了。

    1 回复
  • 各个地方下载的 txt 都不太一样,如何识别标题都不一定。我都是看情况改改自己之前的 py 脚本。做成 md,然后决定导入 sy 或者制作为 epub。

    1 回复
  • abbj 1 赞同

    我在 chatgpt 的帮助下写了一个类似的脚本

  • yunlunnnn

    是的,我现在就是使用微信读书,以及起点,其实问题也在这,微信读书不存在 pc 端,网页端也存在使用不太方便的问题(比如只能设置字体大小,起点也是类似,导致我只想在手机看,大屏单页阅读实在过于难受),能用,但不好用的那种,我也尝试过模拟器,但是实在是模拟器启动过慢,并且很臃肿。

    1 回复
  • yunlunnnn

    我用过开源阅读,貌似标题方面每本书都存在不同,所以就存在问题,pc 端有些阅读器貌似识别的很好,但是总有某方面不太尽人意,比如同步等

  • yunlunnnn

    这似乎也是个好方法,但是如果看的时候突然想到什么,应该就会比较难处理,可能就会存在哪一天没打开思源,只能随便找个地方记,然后后期还需要转移笔记的情况,或者需要提前在思源创建该书籍的文档,但是这样可能会在某次忘记创建,然后就想到一些灵感,然后因为创建文档空隙,然后不小心忘记灵感

    1 回复
  • yunlunnnn

    所以只是尝试询问,不太好解决的话其实也不太影响,只是我觉得这是一个可能的思路。

  • yunlunnnn

    是的,的确是,主要是没太找到比较好的 pc 端阅读器,有些比较小众的,pc 和 pe 方面的同步存在一定问题,所以也在找

  • yunlunnnn

    主要是现在网页端的阅读网站都总有一种 pc 与狗不得入内的感觉,不好用。

  • 用微信读书即可

  • 可以试试油猴脚本 微信读书 (greasyfork.org)

    image.png

    1 回复
  • 我是这样使用的,思源作为一个笔记整理结果的汇集地,其他零散的记录在别的地方,比如浏览器剪藏、备忘录、word、pdf 等等。

    这种长文本的我个人习惯是在 word 中处理,可以加背景、调顺序、变颜色、写批注(这个批注用来记疑惑、灵感等),整个常文本都读完之后再根据标记的这些内容读一遍,然后没啥问题了往思源整理,这个时候疑惑、灵感都有了回答

    1 回复
  • calibre + koreader. 这套组合的唯一缺点是没有覆盖 ios

    1 回复
  • yunlunnnn

    好的,感谢

  • yunlunnnn 1 赞同

    主要是觉得分散在各个软件处理太多麻烦,不太喜欢做太多无意义的事,并且很多时候会存在很大局限性,所以宁愿接受一点功能降级,也想尝试一站式解决问题,现在看来确实要求有些高了,不过我觉得未来会有的。

    1 回复
  • yunlunnnn

    好的,我会尝试一下的。

  • 看到思源集市这个插件预览图,好像可以实现双页浏览,可以试试。

    关于 txt 内容章节设置标题,我的方法是在 sublime 中使用正则表达式批量替换的。比如有的书籍是“第一章”“第一节”,那就替换成“# 第一章”“## 第一节”,另存为 md 格式,导入思源笔记就可以。

    image.png

    这是以前替换标题时常用的几组正则表达式

    image.png

  • 一站式很难,而且即便出来了一站式的软件 成本上 普通用户也接受不了,属于富人不愿意买 穷人买不起的情况。这样还不如自己开发

  • sky2023

    看书建议用看书软件

请输入回帖内容 ...

推荐标签 标签

  • 996
    13 引用 • 200 回帖 • 11 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    8447 引用 • 38477 回帖 • 154 关注
  • danl
    146 关注
  • 笔记

    好记性不如烂笔头。

    308 引用 • 793 回帖
  • 禅道

    禅道是一款国产的开源项目管理软件,她的核心管理思想基于敏捷方法 scrum,内置了产品管理和项目管理,同时又根据国内研发现状补充了测试管理、计划管理、发布管理、文档管理、事务管理等功能,在一个软件中就可以将软件研发中的需求、任务、bug、用例、计划、发布等要素有序的跟踪管理起来,完整地覆盖了项目管理的核心流程。

    5 引用 • 15 回帖 • 102 关注
  • V2Ray
    1 引用 • 15 回帖 • 1 关注
  • SpaceVim

    SpaceVim 是一个社区驱动的模块化 vim/neovim 配置集合,以模块的方式组织管理插件以
    及相关配置,为不同的语言开发量身定制了相关的开发模块,该模块提供代码自动补全,
    语法检查、格式化、调试、REPL 等特性。用户仅需载入相关语言的模块即可得到一个开箱
    即用的 Vim-IDE。

    3 引用 • 31 回帖 • 105 关注
  • 安装

    你若安好,便是晴天。

    132 引用 • 1184 回帖 • 1 关注
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    209 引用 • 358 回帖 • 1 关注
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖 • 1 关注
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    409 引用 • 1246 回帖 • 587 关注
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    126 引用 • 169 回帖
  • JavaScript

    JavaScript 一种动态类型、弱类型、基于原型的直译式脚本语言,内置支持类型。它的解释器被称为 JavaScript 引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在 HTML 网页上使用,用来给 HTML 网页增加动态功能。

    728 引用 • 1273 回帖 • 1 关注
  • 面试

    面试造航母,上班拧螺丝。多面试,少加班。

    325 引用 • 1395 回帖 • 1 关注
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    7 引用 • 40 回帖
  • TensorFlow

    TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。

    20 引用 • 19 回帖 • 1 关注
  • 创造

    你创造的作品可能会帮助到很多人,如果是开源项目的话就更赞了!

    178 引用 • 997 回帖
  • Latke

    Latke 是一款以 JSON 为主的 Java Web 框架。

    71 引用 • 535 回帖 • 789 关注
  • 酷鸟浏览器

    安全 · 稳定 · 快速
    为跨境从业人员提供专业的跨境浏览器

    3 引用 • 59 回帖 • 26 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    27 引用 • 225 回帖 • 163 关注
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    52 引用 • 228 回帖
  • Markdown

    Markdown 是一种轻量级标记语言,用户可使用纯文本编辑器来排版文档,最终通过 Markdown 引擎将文档转换为所需格式(比如 HTML、PDF 等)。

    167 引用 • 1520 回帖
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    59 引用 • 29 回帖 • 14 关注
  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 637 关注
  • Sillot

    Insights(注意当前设置 master 为默认分支)

    汐洛彖夲肜矩阵(Sillot T☳Converbenk Matrix),致力于服务智慧新彖乄,具有彖乄驱动、极致优雅、开发者友好的特点。其中汐洛绞架(Sillot-Gibbet)基于自思源笔记(siyuan-note),前身是思源笔记汐洛版(更早是思源笔记汐洛分支),是智慧新录乄终端(多端融合,移动端优先)。

    主仓库地址:Hi-Windom/Sillot

    文档地址:sillot.db.sc.cn

    注意事项:

    1. ⚠️ 汐洛仍在早期开发阶段,尚不稳定
    2. ⚠️ 汐洛并非面向普通用户设计,使用前请了解风险
    3. ⚠️ 汐洛绞架基于思源笔记,开发者尽最大努力与思源笔记保持兼容,但无法实现 100% 兼容
    29 引用 • 25 回帖 • 86 关注
  • InfluxDB

    InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。

    2 引用 • 76 关注
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖