最近逛 b 站发现有个好东西
doc2x
怎么说呢,主要做的是文档类的识别,比较复杂的这种双栏排版,能够正确识别。用过 WPS 和福昕的 pdf 转 word,双栏的支持都有点惨不忍睹,是看着像双栏实际是单栏的那种,一行从一栏到另一栏。也支持多级标题。
Latex 公式的识别也不错,准确率还可以,支持导出 md,word,Tex。
每天有五百次免费识别的额度,会员会到 1000 次(但 500 次已经够用了),还会出沉浸式翻译的功能(会员),识别后变成中文。会员定价在群里窥屏似乎说打算订十来块钱一个月 cover 成本,开发者说主要做 2b,因为用的计算资源都是自己的卡自己的服务器,实际成本比较低。
除了网页端复制,最近也出了 quicker 的动作,可以直接截屏识别,桌面端什么还在开发,quicker 暂时是使用 token,三天要刷新一次,未来会有 API。
最近使用这个动作去识别课件或者摘录数学课本(要复习 😭 ),大多数都没什么问题,支持识别为插图而且保存到图床还是挺不错的。
不过导入到思源似乎网络图片没法导入,会直接显示为 html 的源码,没懂,如果是没编译 html 的原因,还需要再去改改 quicker。
不过有点的麻的是,他们经常搞更新,所以有时候不太稳定,这时候可以用 SimpleTex 替一下(躺),同样 quicker 有动作。
最后发个我的邀请链接喵:https://doc2x.noedgeai.com/login?invite_code=YMV2WX
补:混排识别效果图
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于