pdf 识别后导入思源,公式表格怎么比较好的处理

不知道有没有更舒服的操作

我将扫描用 doc2x 识别后导出 markdown,识别效果还是挺不错的

image.png

导入思源后表格显示有问题,怎么处理呢。表格是用 html 块,公式也没显示出来

image.png

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    25713 引用 • 106381 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 请发一下导出后的 HTML 代码。

    1 回复
  • 必须是 Markdown 表格才支持导入为表格,如果是 HTML 表格的话就会变成 HTML 块

    1 回复
  • coco2

    这是 doc2x 导出 markdown 后的内容

    <table><tr><td>车辆种类</td><td>试验区*</td><td>可见光透射比</td></tr><tr><td>${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$</td><td>${\mathrm{B}}^{\mathrm{b}}$</td><td rowspan="3">≥70%</td></tr><tr><td>$\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外</td><td>I</td></tr><tr><td>L 类、O 类和 农业和林业专用车</td><td>${\mathrm{I}}^{\prime }$</td></tr><tr><td colspan="3">${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。</td></tr></table>
    车辆种类试验区*可见光透射比
    ${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$${\mathrm{B}}^{\mathrm{b}}$≥70%
    $\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外I
    L 类、O 类和 农业和林业专用车${\mathrm{I}}^{\prime }$
    ${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。

    这个是导入思源笔记后的 html 代码块

    <div> <table><tr><td>车辆种类</td><td>试验区*</td><td>可见光透射比</td></tr><tr><td>${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$</td><td>${\mathrm{B}}^{\mathrm{b}}$</td><td rowspan="3">≥70%</td></tr><tr><td>$\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外</td><td>I</td></tr><tr><td>L 类、O 类和 农业和林业专用车</td><td>${\mathrm{I}}^{\prime }$</td></tr><tr><td colspan="3">${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。</td></tr></table> </div>
    车辆种类试验区*可见光透射比
    ${\mathrm{M}}_{1}$ 和 ${\mathrm{N}}_{1}$${\mathrm{B}}^{\mathrm{b}}$≥70%
    $\mathrm{N}$ 类和 $\mathrm{M}$ 类中 ${\mathrm{M}}_{1}$ 以外I
    L 类、O 类和 农业和林业专用车${\mathrm{I}}^{\prime }$
    ${}^{a}$ 试验区的确定见附录 $\mathrm{A}$ ,对于 ${\mathrm{N}}_{1}$ 类车辆,由供需双方商定采用试验区 $\mathrm{I}$ 或试验区 $\mathrm{B}$ 。 ${}^{\mathrm{b}}$ 黑边区域除外。
  • coco2

    html 里面的公式思源是识别不了的嘛

    2 回复
  • 只有在网页上复制 HTML 渲染后的表格粘贴到思源里才会转换为表格。

    如果是导入 HTML 纯文本的话会转换为 HTML 块以保持原样,HTML 纯文本中的公式自然也是纯文本了。

    1 回复
  • 当然可以,导入 MathJax 包即可,我帮你改好了:

    <div> <iframe sandbox="allow-scripts" width="300" height="400" style="border: none;" srcdoc=' <!DOCTYPE html> <html lang="zh-CN"> <head> <meta charset="utf-8"> <script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.7/MathJax.js?config=TeX-MML-AM_CHTML"> </script> <style> body { margin:0; padding:10px; font-family: sans-serif; } table { border-collapse: collapse; width:100%; } td { border:1px solid #333; padding:8px; text-align:center; } </style> </head> <body> <table> <tr> <td>车辆种类</td> <td>试验区*</td> <td>可见光透射比</td> </tr> <tr> <td>\(M_1\) 和 \(N_1\)</td> <td>\(B^b\)</td> <td rowspan="3">≥70%</td> </tr> <tr> <td>\(N\) 类和 \(M\) 类中 \(M_1\) 以外</td> <td>I</td> </tr> <tr> <td>L 类、O 类和农业和林业专用车</td> <td>I′</td> </tr> <tr> <td colspan="3"> \(^{a}\) 试验区的确定见附录 A,对于 \(N_1\) 类车辆,由供需双方商定采用试验区 I 或试验区 B。 \(^{b}\) 黑边区域除外。 </td> </tr> </table> </body> </html> '></iframe> </div>
  • 主楼明显知道这些,他有将代码放在 HTML 块中,只是没有引入需要的公式包才没有正确渲染。

    1 回复
  • 我认为楼主是不知道的,因为表格是工具导出的而不是自己写的

    1 回复
    那就很尴尬了
    ShawElA
  • EmptyLight

    或许可以通过工具将 HTML 表格转 md 表格,这是我通过搜索“HTML 表格转 md”关键词找到的网页工具,可以尝试:HTML 表格 转换为 Markdown 表格 - 在线表格转换工具

    转换之后将 md 表格粘贴进去然后删掉 HTML 块就可以替换了,不过具体效果未测试

    1 回复
  • coco2

    哈哈哈哈,我是小白,不会 😂 我想有一个简单快捷的方法把 pdf 文件变成文字放到思源笔记里去学习。

    后面那位大哥提供的在线把 html 表格转为 markdown 表格挺不错,就是{}^{a}这种东西要手动用行级公式写进入有点费事

  • coco2

    好用,就是公式不能自动转

  • coco2 1 评论

    我又用 doc2x 导出 word,然后用导入插件导入到思源里,狠好用,表格都导入进去了,但是公式怎么有些可以正常显示有些就报错呢

    这个是通过 doc2x 导出的 word

    image.png

    这是通过导入插件导入到思源笔记后

    image.png

    1 回复
    后面的报错是因为没有定义这个 \mspace{} 序列,不知道是什么东西
    EmptyLight
  • coco2

    11GB96562021.zip

    有大佬帮我测试一下么

  • ShawElA via Android

    这是一个 KaTeX 不支持的命令,LaTeX 中用来调间距,遇到只能删除。

    1 回复
  • coco2 1

    AI 了一下,解决了,😄

    image.png

    然后我配置了一个 katex 宏定义

    {"\\mspace" : "\\mkern" }
    1 回复
  • 可以让 ai 写个 python 脚本直接转换 md 文档里的 html 表格为 md 表格语法,并注意合并单元格的处理

请输入回帖内容 ...

推荐标签 标签

  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 637 关注
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 555 关注
  • SendCloud

    SendCloud 由搜狐武汉研发中心孵化的项目,是致力于为开发者提供高质量的触发邮件服务的云端邮件发送平台,为开发者提供便利的 API 接口来调用服务,让邮件准确迅速到达用户收件箱并获得强大的追踪数据。

    2 引用 • 8 回帖 • 502 关注
  • 微软

    微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

    8 引用 • 44 回帖 • 1 关注
  • OneDrive
    2 引用 • 1 关注
  • 音乐

    你听到信仰的声音了么?

    62 引用 • 512 回帖 • 3 关注
  • 前端

    前端技术一般分为前端设计和前端开发,前端设计可以理解为网站的视觉设计,前端开发则是网站的前台代码实现,包括 HTML、CSS 以及 JavaScript 等。

    246 引用 • 1338 回帖
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 76 关注
  • QQ

    1999 年 2 月腾讯正式推出“腾讯 QQ”,在线用户由 1999 年的 2 人(马化腾和张志东)到现在已经发展到上亿用户了,在线人数超过一亿,是目前使用最广泛的聊天软件之一。

    45 引用 • 557 回帖
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖 • 5 关注
  • 电影

    这是一个不能说的秘密。

    122 引用 • 608 回帖
  • PWA

    PWA(Progressive Web App)是 Google 在 2015 年提出、2016 年 6 月开始推广的项目。它结合了一系列现代 Web 技术,在网页应用中实现和原生应用相近的用户体验。

    14 引用 • 69 回帖 • 180 关注
  • Swift

    Swift 是苹果于 2014 年 WWDC(苹果开发者大会)发布的开发语言,可与 Objective-C 共同运行于 Mac OS 和 iOS 平台,用于搭建基于苹果平台的应用程序。

    36 引用 • 37 回帖 • 551 关注
  • 笔记

    好记性不如烂笔头。

    310 引用 • 794 回帖
  • 大疆创新

    深圳市大疆创新科技有限公司(DJI-Innovations,简称 DJI),成立于 2006 年,是全球领先的无人飞行器控制系统及无人机解决方案的研发和生产商,客户遍布全球 100 多个国家。通过持续的创新,大疆致力于为无人机工业、行业用户以及专业航拍应用提供性能最强、体验最佳的革命性智能飞控产品和解决方案。

    2 引用 • 14 回帖
  • Gzip

    gzip (GNU zip)是 GNU 自由软件的文件压缩程序。我们在 Linux 中经常会用到后缀为 .gz 的文件,它们就是 Gzip 格式的。现今已经成为互联网上使用非常普遍的一种数据压缩格式,或者说一种文件格式。

    9 引用 • 12 回帖 • 171 关注
  • RYMCU

    RYMCU 致力于打造一个即严谨又活泼、专业又不失有趣,为数百万人服务的开源嵌入式知识学习交流平台。

    4 引用 • 6 回帖 • 57 关注
  • jQuery

    jQuery 是一套跨浏览器的 JavaScript 库,强化 HTML 与 JavaScript 之间的操作。由 John Resig 在 2006 年 1 月的 BarCamp NYC 上释出第一个版本。全球约有 28% 的网站使用 jQuery,是非常受欢迎的 JavaScript 库。

    64 引用 • 134 回帖 • 734 关注
  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3455 回帖 • 154 关注
  • Access
    1 引用 • 3 回帖 • 1 关注
  • Sillot

    Insights(注意当前设置 master 为默认分支)

    汐洛彖夲肜矩阵(Sillot T☳Converbenk Matrix),致力于服务智慧新彖乄,具有彖乄驱动、极致优雅、开发者友好的特点。其中汐洛绞架(Sillot-Gibbet)基于自思源笔记(siyuan-note),前身是思源笔记汐洛版(更早是思源笔记汐洛分支),是智慧新录乄终端(多端融合,移动端优先)。

    主仓库地址:Hi-Windom/Sillot

    文档地址:sillot.db.sc.cn

    注意事项:

    1. ⚠️ 汐洛仍在早期开发阶段,尚不稳定
    2. ⚠️ 汐洛并非面向普通用户设计,使用前请了解风险
    3. ⚠️ 汐洛绞架基于思源笔记,开发者尽最大努力与思源笔记保持兼容,但无法实现 100% 兼容
    29 引用 • 25 回帖 • 116 关注
  • 单点登录

    单点登录(Single Sign On)是目前比较流行的企业业务整合的解决方案之一。SSO 的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。

    9 引用 • 25 回帖 • 5 关注
  • Sphinx

    Sphinx 是一个基于 SQL 的全文检索引擎,可以结合 MySQL、PostgreSQL 做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。

    1 引用 • 222 关注
  • Netty

    Netty 是一个基于 NIO 的客户端-服务器编程框架,使用 Netty 可以让你快速、简单地开发出一个可维护、高性能的网络应用,例如实现了某种协议的客户、服务端应用。

    49 引用 • 33 回帖 • 36 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 566 关注
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    336 引用 • 324 回帖
  • wolai

    我来 wolai:不仅仅是未来的云端笔记!

    2 引用 • 14 回帖 • 6 关注