ocr-texts.json 中所有的图片都没有结果

自己手动使用命令是有 ocr 结果输出的

是出现了错误,还是对于 ocr 文本过长的不予采用呢?
ocr-texts.json 中所有的图片都没有结果

自己手动使用命令是有 ocr 结果输出的

是出现了错误,还是对于 ocr 文本过长的不予采用呢?
img.7z
上面的所有图片都识别超时,但在日志里并不会全部打印,只有部分图片会打印 timeout。
日志里记录的部分图片 timeout,大概是 15s 往上的时间才能识别出结果。
大部分图片,都可以在 3 秒内识别出结果,但结果并没有填充到 ocr-texts.json 中。
总体来看有两个 BUG
我知道 ocr-texts.json 不是实时写入的,但这不是关键问题。问题是 ocr-texts.json 在刷新写入之后,ocr 结果依旧为空,而日志中显示 timeout 的就几张图片,其中没有超时的图片的 ocr 结果也没有正常写入。
之前的评论是慢慢发现问题,所以可能比较混乱。
现在我确定 BUG 是,在 ocr 扫描的过程中出现了某种错误,导致 ocr entry 没有正常的写入 ocr-texts.json(这会导致下一次启动 siyuan 再次 ocr 扫描这些图片,因为没有记录);如果由于用户手动设置 ocr 结果触发 ocr-texts.json 的写入的话,写入的图片 ocr 结果全部为空。
下面是一次完整的复现步骤,由于时间跨度过长不太好录视频,但我也尽量记录详细了。可以使用评论中的 50 多张图片 复现。
可以看这个 systemlog.zip(同时也是下面步骤的日志)
23:35:05,启动空工作空间,将评论中的 50 多张图片拖入到文档中,此时开始 ocr
在 23:40 左右,50 多张图片的 ocr 已经完成(状态栏并没有显示工作中)

但在日志中,只有 6 张图片出现了 ocr timeout;其余的 40 多张图片没有出现 timeout,但也没有将结果写入到 ocr-texts.json 中
之后内核便没有日志了(打包的日志也只到这里)

然后 ocr-texts.json 的文件内容并没有被更新
此时 ocr-texts.json 的内容为 {}

此时这种状态,只有用户手动去设置一个图片的 ocr 文本,ocr-texts.json 才会被更新。23:48 手动设置图片 ocr 文本

ocr-texts.json 内容才更新(显示更新时间是 23:48,用户手动添加 ocr 结果文本的时间)。从 23:40~23:48,siyuan 并没有定时写入 ocr-texts.json

在日志中只有几个图片报错 timeout。但是此时所有的图片 ocr 结果全部为空

如果没有执行步骤 4,而是重启,则下次重启,由于 ocr-texts.json 内容为空,siyuan 依旧会扫描所有图片。
Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。
Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。
这是一个不能说的秘密。
MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。
微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。
JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。
WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。
汐洛彖夲肜矩阵(Sillot T☳Converbenk Matrix),致力于服务智慧新彖乄,具有彖乄驱动、极致优雅、开发者友好的特点。其中汐洛绞架(Sillot-Gibbet)基于自思源笔记(siyuan-note),前身是思源笔记汐洛版(更早是思源笔记汐洛分支),是智慧新录乄终端(多端融合,移动端优先)。
主仓库地址:Hi-Windom/Sillot
文档地址:sillot.db.sc.cn
注意事项:
Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。
开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。
百度应用引擎(Baidu App Engine)提供了 PHP、Java、Python 的执行环境,以及云存储、消息服务、云数据库等全面的云服务。它可以让开发者实现自动地部署和管理应用,并且提供动态扩容和负载均衡的运行环境,让开发者不用考虑高成本的运维工作,只需专注于业务逻辑,大大降低了开发者学习和迁移的成本。
千千块(自定义块 css 和 js)
可以用 ai 提示词来无限创作思源笔记
Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。
记录并分享人生的经历。
PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。
Typecho 是一款博客程序,它在 GPLv2 许可证下发行,基于 PHP 构建,可以运行在各种平台上,支持多种数据库(MySQL、PostgreSQL、SQLite)。
互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。
又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。
百度(Nasdaq:BIDU)是全球最大的中文搜索引擎、最大的中文网站。2000 年 1 月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。
昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。
Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。
Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。
SQLite 是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。SQLite 是全世界使用最为广泛的数据库引擎。
小薇是一个用 Java 写的 QQ 聊天机器人 Web 服务,可以用于社群互动。
由于 Smart QQ 从 2019 年 1 月 1 日起停止服务,所以该项目也已经停止维护了!
脑图又叫思维导图,是表达发散性思维的有效图形思维工具 ,它简单却又很有效,是一种实用性的思维工具。
Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于