-
-
Notifications
You must be signed in to change notification settings - Fork 2k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
桌面端支持搜索图片 OCR 文本 #3470
Comments
你好,OCR 短期内无法支持,目前只能考虑手动设置图片标题来进行搜索 #3427 |
不能立为长期计划吗,我想了解下难点在哪里? |
@linglongyoudoufu 需要一个支持跨平台、能够打包整合进思源的开源方案,有推荐不? |
感觉ocr功能没必要一定跨平台,PC端能够实现图片ocr,并把ocr识别到的内容保存到图片的“提示文本”中就可以了,这样跨平台也能搜索。相信提出ocr功能需要的人都是为了搜索需求的。需要注意的是,如果在android端添加了图片,或以前就在思源笔记中存在的图片,ocr功能能够将这些未进行ocr的图片识别到,并自动对其ocr识别,保存到各自图片的“提示文本”中。这样就能满足图片文字搜索的需求了,感觉ocr功能很实用,提出该问题的人也很多,希望能够添加,谢谢! |
仅支持桌面端的话至少也要考虑支持 Windows/Linux/macOS,目前似乎只有联网调用其他平台 API 比较现实,或者让用户自行安装 tesseract? |
联网调用其他平台 API 也可以啊,让确实有需要使用ocr功能的用户自己去申请接口。Windows端的用户,也可以调用win10自带ocr功能。确实感觉ocr功能对于搜索功能来说帮助很大,尤其是笔记较多的用户和喜欢截图保存数据的用户。 |
确实,调API就行,然后限定为订阅用户权益 |
解决方案:
|
能和pandoc一样直接内置在软件里吗 |
感谢!赞! |
话说这个支持百度腾讯那些ocr接口吗?实现难度? |
@mozhux 不支持,仅支持本地的 Tesseract,后续版本可能会考虑改为配置命令,这样可以用其他程序实现。 |
中文识别能力较差,建议能够对接百度图片识别的API |
在macos上,homebrew安装的tesseract输出如下,使用‘tesseract v’判定是否存在不正确。
|
@ericma15 使用的是 |
是我看错版本了。我再看看为啥没成功 |
macOS 端 Tesseract 有问题的话请关注 #7107 |
是仅支持本地图片吗?图床上的图片我这里好像没有效果呢,搜索不到里面的文字。 |
仅支持本地图片。 |
把 tesseract 繁体字的语言包删掉看看,chi_tra* |
可以了,谢谢D大 |
请问有教程吗 |
自己把中文语言包安装错了,Tesseract对中文的识别还是很好的。 |
Windows用户如果安装后,重启思源还是没有ocr功能的话,可以尝试:
用了一下太香了,感谢D大! |
@88250 这个ocr的文本没有存储在sy文件中嘛 |
@2234839 要启用 OCR 才会存储,你看下是否启用了 |
@2234839 期待!支持! |
不要直接读写文件,要走内核的文件 API |
@88250 我会将这个功能添加到OceanPress 插件中,这个插件是支持将挂件转化成图片的,所以刚刚我在想,OCR文本搜索这个功能可以在通用一些嘛,使得用户可以搜索到各个挂件,iframre之类的,也许以后还可以搜索歌曲,视频。 也就是对于非文本块,拥有一个内容描述的文本字段,这个字段参与搜索,对于图片而言,就是OCR |
@88250 这个会不会又太杂了,因为很多插件可能都是依赖自定义属性的,将这些程序用的数据也搜索出来给用户看就太乱了,或许我应该直接使用备注字段 |
我觉得怕是先稍微调查一下用户需求比较好 😂 |
嗯,我去社区发个帖问问 |
@88250 刚发现一个问题,图片没有id和属性.... |
哦,对,刚刚说的是块属性,图片是行级元素。
…---原始邮件---
发件人: ***@***.***>
发送时间: 2024年5月29日(周三) 中午11:55
收件人: ***@***.***>;
抄送: ***@***.******@***.***>;
主题: Re: [siyuan-note/siyuan] 桌面端支持搜索图片 OCR 文本 (Issue #3470)
@88250 刚发现一个问题,图片没有id和属性....
所以如果想要通过属性来使用户搜索到该图片似乎不现实
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you were mentioned.Message ID: ***@***.***>
|
@88250 可以提供返回ocr识别带文字坐标的api嘛,下面是我使用在线api实现的效果,我想用户也可以选择使用tesseract 来获得这样的体验 |
@2234839 请单独提 issue 记录 |
是不是理论上只要兼容tesseractocr的接口输出和参数输入,做个中间件来中转的插件或者外部程序,就能替换成各种服务了,如果不懂siyuan的主工程 不过没太理解tsv输出的各列含义 |
笔记里面有很多是直接截图记录的,希望能像onenote一样,支持OCR,这样可以通过文字搜索到
The text was updated successfully, but these errors were encountered: