pdf 识别后导入思源,公式表格怎么比较好的处理

不知道有没有更舒服的操作

我将扫描用 doc2x 识别后导出 markdown,识别效果还是挺不错的

image.png

导入思源后表格显示有问题,怎么处理呢。表格是用 html 块,公式也没显示出来

image.png

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    25428 引用 • 105168 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 请发一下导出后的 HTML 代码。

    1 回复
  • 必须是 Markdown 表格才支持导入为表格,如果是 HTML 表格的话就会变成 HTML 块

    1 回复
  • coco2

    这是 doc2x 导出 markdown 后的内容

    <table><tr><td>车辆种类</td><td>试验区*</td><td>可见光透射比</td></tr><tr><td>${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$</td><td>${\mathrm{B}}^{\mathrm{b}}$</td><td rowspan="3">≥70%</td></tr><tr><td>$\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外</td><td>I</td></tr><tr><td>L 类、O 类和 农业和林业专用车</td><td>${\mathrm{I}}^{\prime }$</td></tr><tr><td colspan="3">${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。</td></tr></table>
    车辆种类试验区*可见光透射比
    ${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$${\mathrm{B}}^{\mathrm{b}}$≥70%
    $\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外I
    L 类、O 类和 农业和林业专用车${\mathrm{I}}^{\prime }$
    ${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。

    这个是导入思源笔记后的 html 代码块

    <div> <table><tr><td>车辆种类</td><td>试验区*</td><td>可见光透射比</td></tr><tr><td>${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$</td><td>${\mathrm{B}}^{\mathrm{b}}$</td><td rowspan="3">≥70%</td></tr><tr><td>$\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外</td><td>I</td></tr><tr><td>L 类、O 类和 农业和林业专用车</td><td>${\mathrm{I}}^{\prime }$</td></tr><tr><td colspan="3">${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。</td></tr></table> </div>
    车辆种类试验区*可见光透射比
    ${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$${\mathrm{B}}^{\mathrm{b}}$≥70%
    $\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外I
    L 类、O 类和 农业和林业专用车${\mathrm{I}}^{\prime }$
    ${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。
  • coco2

    html 里面的公式思源是识别不了的嘛

    2 回复
  • 只有在网页上复制 HTML 渲染后的表格粘贴到思源里才会转换为表格。

    如果是导入 HTML 纯文本的话会转换为 HTML 块以保持原样,HTML 纯文本中的公式自然也是纯文本了。

    1 回复
  • 当然可以,导入 MathJax 包即可,我帮你改好了:

    <div> <iframe sandbox="allow-scripts" width="300" height="400" style="border: none;" srcdoc=' <!DOCTYPE html> <html lang="zh-CN"> <head> <meta charset="utf-8"> <script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.7/MathJax.js?config=TeX-MML-AM_CHTML"> </script> <style> body { margin:0; padding:10px; font-family: sans-serif; } table { border-collapse: collapse; width:100%; } td { border:1px solid #333; padding:8px; text-align:center; } </style> </head> <body> <table> <tr> <td>车辆种类</td> <td>试验区*</td> <td>可见光透射比</td> </tr> <tr> <td>\(M_1\) 和 \(N_1\)</td> <td>\(B^b\)</td> <td rowspan="3">≥70%</td> </tr> <tr> <td>\(N\) 类和 \(M\) 类中 \(M_1\) 以外</td> <td>I</td> </tr> <tr> <td>L 类、O 类和农业和林业专用车</td> <td>I′</td> </tr> <tr> <td colspan="3"> \(^{a}\) 试验区的确定见附录 A,对于 \(N_1\) 类车辆,由供需双方商定采用试验区 I 或试验区 B。 \(^{b}\) 黑边区域除外。 </td> </tr> </table> </body> </html> '></iframe> </div>
  • 主楼明显知道这些,他有将代码放在 HTML 块中,只是没有引入需要的公式包才没有正确渲染。

    1 回复
  • 我认为楼主是不知道的,因为表格是工具导出的而不是自己写的

    1 回复
    那就很尴尬了
    ShawElA
  • EmptyLight

    或许可以通过工具将 HTML 表格转 md 表格,这是我通过搜索“HTML 表格转 md”关键词找到的网页工具,可以尝试:HTML 表格 转换为 Markdown 表格 - 在线表格转换工具

    转换之后将 md 表格粘贴进去然后删掉 HTML 块就可以替换了,不过具体效果未测试

    1 回复
  • coco2

    哈哈哈哈,我是小白,不会 😂 我想有一个简单快捷的方法把 pdf 文件变成文字放到思源笔记里去学习。

    后面那位大哥提供的在线把 html 表格转为 markdown 表格挺不错,就是{}^{a}这种东西要手动用行级公式写进入有点费事

  • coco2

    好用,就是公式不能自动转

  • coco2 1 评论

    我又用 doc2x 导出 word,然后用导入插件导入到思源里,狠好用,表格都导入进去了,但是公式怎么有些可以正常显示有些就报错呢

    这个是通过 doc2x 导出的 word

    image.png

    这是通过导入插件导入到思源笔记后

    image.png

    1 回复
    后面的报错是因为没有定义这个 \mspace{} 序列,不知道是什么东西
    EmptyLight
  • coco2

    11GB96562021.zip

    有大佬帮我测试一下么

  • 这是一个 KaTeX 不支持的命令,LaTeX 中用来调间距,遇到只能删除。

    1 回复
  • coco2 1

    AI 了一下,解决了,😄

    image.png

    然后我配置了一个 katex 宏定义

    {"\\mspace" : "\\mkern" }
    1 回复
  • 可以让 ai 写个 python 脚本直接转换 md 文档里的 html 表格为 md 表格语法,并注意合并单元格的处理

请输入回帖内容 ...

推荐标签 标签

  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    108 引用 • 295 回帖
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    6 引用 • 26 回帖 • 544 关注
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    5 引用 • 18 回帖 • 181 关注
  • 自由行
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 29 关注
  • NetBeans

    NetBeans 是一个始于 1997 年的 Xelfi 计划,本身是捷克布拉格查理大学的数学及物理学院的学生计划。此计划延伸而成立了一家公司进而发展这个商用版本的 NetBeans IDE,直到 1999 年 Sun 买下此公司。Sun 于次年(2000 年)六月将 NetBeans IDE 开源,直到现在 NetBeans 的社群依然持续增长。

    78 引用 • 102 回帖 • 704 关注
  • ZeroNet

    ZeroNet 是一个基于比特币加密技术和 BT 网络技术的去中心化的、开放开源的网络和交流系统。

    1 引用 • 21 回帖 • 648 关注
  • Ngui

    Ngui 是一个 GUI 的排版显示引擎和跨平台的 GUI 应用程序开发框架,基于
    Node.js / OpenGL。目标是在此基础上开发 GUI 应用程序可拥有开发 WEB 应用般简单与速度同时兼顾 Native 应用程序的性能与体验。

    7 引用 • 9 回帖 • 397 关注
  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    20 引用 • 37 回帖 • 574 关注
  • 印象笔记
    3 引用 • 16 回帖
  • Excel
    31 引用 • 28 回帖
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖 • 1 关注
  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖
  • BookxNote

    BookxNote 是一款全新的电子书学习工具,助力您的学习与思考,让您的大脑更高效的记忆。

    笔记整理交给我,一心只读圣贤书。

    1 引用 • 1 回帖
  • IDEA

    IDEA 全称 IntelliJ IDEA,是一款 Java 语言开发的集成环境,在业界被公认为最好的 Java 开发工具之一。IDEA 是 JetBrains 公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨著称的东欧程序员为主。

    181 引用 • 400 回帖 • 1 关注
  • SQLServer

    SQL Server 是由 [微软] 开发和推广的关系数据库管理系统(DBMS),它最初是由 微软、Sybase 和 Ashton-Tate 三家公司共同开发的,并于 1988 年推出了第一个 OS/2 版本。

    21 引用 • 31 回帖
  • 单点登录

    单点登录(Single Sign On)是目前比较流行的企业业务整合的解决方案之一。SSO 的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。

    9 引用 • 25 回帖 • 1 关注
  • 代码片段

    代码片段分为 CSS 与 JS 两种代码,添加在 [设置 - 外观 - 代码片段] 中,这些代码会在思源笔记加载时自动执行,用于改善笔记的样式或功能。

    用户在该标签下分享代码片段时需在帖子标题前添加 [css] [js] 用于区分代码片段类型。

    164 引用 • 1120 回帖 • 1 关注
  • Love2D

    Love2D 是一个开源的, 跨平台的 2D 游戏引擎。使用纯 Lua 脚本来进行游戏开发。目前支持的平台有 Windows, Mac OS X, Linux, Android 和 iOS。

    14 引用 • 53 回帖 • 555 关注
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    79 引用 • 431 回帖
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 468 关注
  • Eclipse

    Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。

    76 引用 • 258 回帖 • 628 关注
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    167 引用 • 314 回帖
  • iOS

    iOS 是由苹果公司开发的移动操作系统,最早于 2007 年 1 月 9 日的 Macworld 大会上公布这个系统,最初是设计给 iPhone 使用的,后来陆续套用到 iPod touch、iPad 以及 Apple TV 等产品上。iOS 与苹果的 Mac OS X 操作系统一样,属于类 Unix 的商业操作系统。

    89 引用 • 150 回帖
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    143 引用 • 442 回帖
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用 • 1 关注
  • CodeMirror
    2 引用 • 17 回帖 • 162 关注