New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
桌面端支持搜索图片 OCR 文本 #3470
Comments
你好,OCR 短期内无法支持,目前只能考虑手动设置图片标题来进行搜索 #3427 |
不能立为长期计划吗,我想了解下难点在哪里? |
@linglongyoudoufu 需要一个支持跨平台、能够打包整合进思源的开源方案,有推荐不? |
感觉ocr功能没必要一定跨平台,PC端能够实现图片ocr,并把ocr识别到的内容保存到图片的“提示文本”中就可以了,这样跨平台也能搜索。相信提出ocr功能需要的人都是为了搜索需求的。需要注意的是,如果在android端添加了图片,或以前就在思源笔记中存在的图片,ocr功能能够将这些未进行ocr的图片识别到,并自动对其ocr识别,保存到各自图片的“提示文本”中。这样就能满足图片文字搜索的需求了,感觉ocr功能很实用,提出该问题的人也很多,希望能够添加,谢谢! |
仅支持桌面端的话至少也要考虑支持 Windows/Linux/macOS,目前似乎只有联网调用其他平台 API 比较现实,或者让用户自行安装 tesseract? |
联网调用其他平台 API 也可以啊,让确实有需要使用ocr功能的用户自己去申请接口。Windows端的用户,也可以调用win10自带ocr功能。确实感觉ocr功能对于搜索功能来说帮助很大,尤其是笔记较多的用户和喜欢截图保存数据的用户。 |
确实,调API就行,然后限定为订阅用户权益 |
解决方案:
|
能和pandoc一样直接内置在软件里吗 |
感谢!赞! |
话说这个支持百度腾讯那些ocr接口吗?实现难度? |
@mozhux 不支持,仅支持本地的 Tesseract,后续版本可能会考虑改为配置命令,这样可以用其他程序实现。 |
中文识别能力较差,建议能够对接百度图片识别的API |
在macos上,homebrew安装的tesseract输出如下,使用‘tesseract v’判定是否存在不正确。
|
@ericma15 使用的是 |
是我看错版本了。我再看看为啥没成功 |
macOS 端 Tesseract 有问题的话请关注 #7107 |
是仅支持本地图片吗?图床上的图片我这里好像没有效果呢,搜索不到里面的文字。 |
仅支持本地图片。 |
把 tesseract 繁体字的语言包删掉看看,chi_tra* |
可以了,谢谢D大 |
请问有教程吗 |
自己把中文语言包安装错了,Tesseract对中文的识别还是很好的。 |
Windows用户如果安装后,重启思源还是没有ocr功能的话,可以尝试:
用了一下太香了,感谢D大! |
笔记里面有很多是直接截图记录的,希望能像onenote一样,支持OCR,这样可以通过文字搜索到
The text was updated successfully, but these errors were encountered: