pdf 识别后导入思源,公式表格怎么比较好的处理

不知道有没有更舒服的操作

我将扫描用 doc2x 识别后导出 markdown,识别效果还是挺不错的

image.png

导入思源后表格显示有问题,怎么处理呢。表格是用 html 块,公式也没显示出来

image.png

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    25500 引用 • 105447 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 请发一下导出后的 HTML 代码。

    1 回复
  • 必须是 Markdown 表格才支持导入为表格,如果是 HTML 表格的话就会变成 HTML 块

    1 回复
  • coco2

    这是 doc2x 导出 markdown 后的内容

    <table><tr><td>车辆种类</td><td>试验区*</td><td>可见光透射比</td></tr><tr><td>${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$</td><td>${\mathrm{B}}^{\mathrm{b}}$</td><td rowspan="3">≥70%</td></tr><tr><td>$\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外</td><td>I</td></tr><tr><td>L 类、O 类和 农业和林业专用车</td><td>${\mathrm{I}}^{\prime }$</td></tr><tr><td colspan="3">${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。</td></tr></table>
    
    车辆种类试验区*可见光透射比
    ${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$${\mathrm{B}}^{\mathrm{b}}$≥70%
    $\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外I
    L 类、O 类和 农业和林业专用车${\mathrm{I}}^{\prime }$
    ${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。

    这个是导入思源笔记后的 html 代码块

    <div>
    <table><tr><td>车辆种类</td><td>试验区*</td><td>可见光透射比</td></tr><tr><td>${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$</td><td>${\mathrm{B}}^{\mathrm{b}}$</td><td rowspan="3">≥70%</td></tr><tr><td>$\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外</td><td>I</td></tr><tr><td>L 类、O 类和 农业和林业专用车</td><td>${\mathrm{I}}^{\prime }$</td></tr><tr><td colspan="3">${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。</td></tr></table>
    </div>
    
    车辆种类试验区*可见光透射比
    ${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$${\mathrm{B}}^{\mathrm{b}}$≥70%
    $\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外I
    L 类、O 类和 农业和林业专用车${\mathrm{I}}^{\prime }$
    ${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。
  • coco2

    html 里面的公式思源是识别不了的嘛

    2 回复
  • 只有在网页上复制 HTML 渲染后的表格粘贴到思源里才会转换为表格。

    如果是导入 HTML 纯文本的话会转换为 HTML 块以保持原样,HTML 纯文本中的公式自然也是纯文本了。

    1 回复
  • 当然可以,导入 MathJax 包即可,我帮你改好了:

    <div>
    <iframe
      sandbox="allow-scripts"
      width="300"
      height="400"
      style="border: none;"
      srcdoc='
    <!DOCTYPE html>
    <html lang="zh-CN">
    <head>
      <meta charset="utf-8">
      <script
        src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.7/MathJax.js?config=TeX-MML-AM_CHTML">
      </script>
      <style>
        body { margin:0; padding:10px; font-family: sans-serif; }
        table { border-collapse: collapse; width:100%; }
        td { border:1px solid #333; padding:8px; text-align:center; }
      </style>
    </head>
    <body>
      <table>
        <tr>
          <td>车辆种类</td>
          <td>试验区*</td>
          <td>可见光透射比</td>
        </tr>
        <tr>
          <td>\(M_1\) 和 \(N_1\)</td>
          <td>\(B^b\)</td>
          <td rowspan="3">≥70%</td>
        </tr>
        <tr>
          <td>\(N\) 类和 \(M\) 类中 \(M_1\) 以外</td>
          <td>I</td>
        </tr>
        <tr>
          <td>L 类、O 类和农业和林业专用车</td>
          <td>I′</td>
        </tr>
        <tr>
          <td colspan="3">
            \(^{a}\) 试验区的确定见附录 A,对于 \(N_1\) 类车辆,由供需双方商定采用试验区 I 或试验区 B。
            \(^{b}\) 黑边区域除外。
          </td>
        </tr>
      </table>
    </body>
    </html>
    '></iframe>
    </div>
    
  • 主楼明显知道这些,他有将代码放在 HTML 块中,只是没有引入需要的公式包才没有正确渲染。

    1 回复
  • 我认为楼主是不知道的,因为表格是工具导出的而不是自己写的

    1 回复
    那就很尴尬了
    ShawElA
  • EmptyLight

    或许可以通过工具将 HTML 表格转 md 表格,这是我通过搜索“HTML 表格转 md”关键词找到的网页工具,可以尝试:HTML 表格 转换为 Markdown 表格 - 在线表格转换工具

    转换之后将 md 表格粘贴进去然后删掉 HTML 块就可以替换了,不过具体效果未测试

    1 回复
  • coco2

    哈哈哈哈,我是小白,不会 😂 我想有一个简单快捷的方法把 pdf 文件变成文字放到思源笔记里去学习。

    后面那位大哥提供的在线把 html 表格转为 markdown 表格挺不错,就是{}^{a}这种东西要手动用行级公式写进入有点费事

  • coco2

    好用,就是公式不能自动转

  • coco2 1 评论

    我又用 doc2x 导出 word,然后用导入插件导入到思源里,狠好用,表格都导入进去了,但是公式怎么有些可以正常显示有些就报错呢

    这个是通过 doc2x 导出的 word

    image.png

    这是通过导入插件导入到思源笔记后

    image.png

    1 回复
    后面的报错是因为没有定义这个 \mspace{} 序列,不知道是什么东西
    EmptyLight
  • coco2

    11GB96562021.zip

    有大佬帮我测试一下么

  • 这是一个 KaTeX 不支持的命令,LaTeX 中用来调间距,遇到只能删除。

    1 回复
  • coco2 1

    AI 了一下,解决了,😄

    image.png

    然后我配置了一个 katex 宏定义

    {"\\mspace" : "\\mkern" }
    
    1 回复
  • 可以让 ai 写个 python 脚本直接转换 md 文档里的 html 表格为 md 表格语法,并注意合并单元格的处理

请输入回帖内容 ...

推荐标签 标签

  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3201 引用 • 8216 回帖
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 8 关注
  • 小说

    小说是以刻画人物形象为中心,通过完整的故事情节和环境描写来反映社会生活的文学体裁。

    32 引用 • 108 回帖 • 1 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    6 引用 • 26 回帖 • 543 关注
  • Maven

    Maven 是基于项目对象模型(POM)、通过一小段描述信息来管理项目的构建、报告和文档的软件项目管理工具。

    188 引用 • 319 回帖 • 252 关注
  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    117 引用 • 99 回帖 • 201 关注
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 591 关注
  • CongSec

    本标签主要用于分享网络空间安全专业的学习笔记

    1 引用 • 1 回帖 • 31 关注
  • 笔记

    好记性不如烂笔头。

    310 引用 • 794 回帖
  • 书籍

    宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”

    78 引用 • 396 回帖
  • BND

    BND(Baidu Netdisk Downloader)是一款图形界面的百度网盘不限速下载器,支持 Windows、Linux 和 Mac,详细介绍请看这里

    107 引用 • 1281 回帖 • 35 关注
  • HHKB

    HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。

    5 引用 • 74 回帖 • 504 关注
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    96 引用 • 155 回帖 • 4 关注
  • LeetCode

    LeetCode(力扣)是一个全球极客挚爱的高质量技术成长平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer!

    209 引用 • 72 回帖
  • CentOS

    CentOS(Community Enterprise Operating System)是 Linux 发行版之一,它是来自于 Red Hat Enterprise Linux 依照开放源代码规定释出的源代码所编译而成。由于出自同样的源代码,因此有些要求高度稳定的服务器以 CentOS 替代商业版的 Red Hat Enterprise Linux 使用。两者的不同在于 CentOS 并不包含封闭源代码软件。

    239 引用 • 224 回帖
  • golang

    Go 语言是 Google 推出的一种全新的编程语言,可以在不损失应用程序性能的情况下降低代码的复杂性。谷歌首席软件工程师罗布派克(Rob Pike)说:我们之所以开发 Go,是因为过去 10 多年间软件开发的难度令人沮丧。Go 是谷歌 2009 发布的第二款编程语言。

    499 引用 • 1395 回帖 • 246 关注
  • 代码片段

    代码片段分为 CSS 与 JS 两种代码,添加在 [设置 - 外观 - 代码片段] 中,这些代码会在思源笔记加载时自动执行,用于改善笔记的样式或功能。

    用户在该标签下分享代码片段时需在帖子标题前添加 [css] [js] 用于区分代码片段类型。

    170 引用 • 1150 回帖
  • Mac

    Mac 是苹果公司自 1984 年起以“Macintosh”开始开发的个人消费型计算机,如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro 等计算机。

    168 引用 • 597 回帖
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    10 引用 • 77 回帖
  • WebClipper

    Web Clipper 是一款浏览器剪藏扩展,它可以帮助你把网页内容剪藏到本地。

    3 引用 • 9 回帖 • 1 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖 • 3 关注
  • 京东

    京东是中国最大的自营式电商企业,2015 年第一季度在中国自营式 B2C 电商市场的占有率为 56.3%。2014 年 5 月,京东在美国纳斯达克证券交易所正式挂牌上市(股票代码:JD),是中国第一个成功赴美上市的大型综合型电商平台,与腾讯、百度等中国互联网巨头共同跻身全球前十大互联网公司排行榜。

    14 引用 • 102 回帖 • 317 关注
  • sts
    2 引用 • 2 回帖 • 229 关注
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    12 引用 • 5 回帖 • 631 关注
  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖 • 3 关注
  • 域名

    域名(Domain Name),简称域名、网域,是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。

    43 引用 • 208 回帖 • 1 关注
  • Redis

    Redis 是一个开源的使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API。从 2010 年 3 月 15 日起,Redis 的开发工作由 VMware 主持。从 2013 年 5 月开始,Redis 的开发由 Pivotal 赞助。

    286 引用 • 248 回帖