希望支持 Ollama 本地模型的流式输出

目前要等待 AI 输出完再显示,阻塞太久了体验很差。下面是简单的流式输出答案的代码(真实可用,仅供参考),我没开发过思源插件,也不知道官方 API 是否支持对接 AI 输出,但我觉得这个可能由官方支持比较靠谱,衷心希望官方考虑下...

async function main() { // 定义可用模型列表 const modelList = [ 'deepseek-r1:14b', 'qwen2.5' ]; // 创建 petite-vue 应用 createApp({ model: modelList[0], question: 'strawberry里有几个r', // 默认问题 output: null, // 输出内容,初始为 null history: [], // 聊天记录 // 定义异步聊天函数 async chat(question, container) { // 如果输入为空,则不执行操作 if (question === '') return // 清空输入框内容 this.question = '' // 将新问题和空的答案添加到聊天记录中 this.history.push({ question, answer: '' }) let action = this.history[this.history.length - 1] // Ollama 的 API 地址 const apiUrl = "http://localhost:11434/api/generate" // 选定的模型名称 const modelName = this.model // 发送请求到 API const resp = await fetch(apiUrl, { method: "POST", // 请求方法为 POST headers: { "Content-Type": "application/json" // 请求头内容类型为 JSON }, body: JSON.stringify({ model: modelName, // 指定使用的模型 prompt: question // 发送的问题内容 }) }) // 获取响应体的读取器,用于逐步读取流式内容 const reader = resp.body.getReader() // 创建文本解码器,将二进制数据解码为文本 const textDecoder = new TextDecoder("utf-8") // 配置 Showdown 转换器的选项 const options = { parseImgDimensions: true, /* 支持定义图片尺寸 */ tables: true, /* 启用表格语法 */ strikethrough: true, /* 启用删除线 */ tasklists: true, /* 启用待办列表 */ emoji: true, /* 启用 emoji 表情 */ splitAdjacentBlockquotes: true, /* 分离相邻的引用块 */ moreStyling: true, /* 启用更多样式支持 */ } // 使用 Showdown 转换器将答案从 Markdown 转为 HTML const converter = new showdown.Converter(options) // 循环读取 API 返回的流式内容 while (1) { const { done, value } = await reader.read() // 读取一段内容 if (done) { // 针对deepseek的思考部分 if (action.answer.includes('</think>')) { const arr = action.answer.split('</think>') const think = arr[0] + '</think>' const answer = arr[1] action.answer = think + converter.makeHtml(answer) } else { action.answer = converter.makeHtml(action.answer) } log(action.answer) log('=== END ===') // 打印结束标志 break // 退出循环 } // 解码流式内容为字符串 const answer = textDecoder.decode(value).trim() // 将流式内容按行分割并逐行处理 const arr = answer.split('\n').map(item => { log(item) // 打印每行内容 try { // 尝试将 JSON 字符串解析为对象,并返回响应内容 const obj = JSON.parse(item.trim()) return obj.response } catch (err) { // 如果解析失败,返回空字符串 return '' } }) // 将解析的内容添加到当前问题的答案中 action.answer += arr.join('') } } }).mount('#app') // 将应用挂载到页面上的 #app 容器中 }
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    24920 引用 • 102633 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • zxkmm 1 赞同

    难点不是流式输出本身,是让编辑器上有流式输出。

    另外这个并不是阻塞,只是简单的屏蔽用户操作。即使实现了流式输出也需要屏蔽用户操作,只是视觉上更好看。

    2 回复
  • 其他回帖
  • WaveF via macOS

    明白了,我是做 UI 设计的,目前这种屏蔽用户操作在设计实际上有强弱之分,直接用一个进度条遮挡整个编辑器实际上属于强打断,它表现的并不只是视觉上好不好看,而是会强制打断用户思路,就好比在影院看电影时突然中途插入全屏广告。不管怎样,我也只是提个建议或者探讨,如果不希望在流式输出期间用户在编辑器本体操作,那是否可以用单独的窗口/webworker 来处理,编辑器本体只是有一个占位符块,等独立窗口完成流式输出后再把内容填充到主编辑器,这样是不是更可行?不过如果没有 AI 相关的 API 那也只能等官方了

    1 回复
    2 操作
    WaveF 在 2025-02-13 10:49:20 更新了该回帖
    WaveF 在 2025-02-13 10:48:39 更新了该回帖
  • 如果你愿意的话,插件也可以实现,单独做一套,不用官方的就行。不需要 API

  • 那恐怕有点难哦,vscode 有块级 diff 和冲突解决。思源连同步冲突 diff 和解决都没有很完善。

  • 查看全部回帖

推荐标签 标签

  • OnlyOffice
    4 引用 • 21 关注
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 347 关注
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 298 关注
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 593 关注
  • Eclipse

    Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。

    76 引用 • 258 回帖 • 632 关注
  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖 • 3 关注
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    8 引用 • 26 回帖
  • Tomcat

    Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。

    162 引用 • 529 回帖 • 4 关注
  • Facebook

    Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。

    4 引用 • 15 回帖 • 445 关注
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    172 引用 • 516 回帖 • 2 关注
  • 音乐

    你听到信仰的声音了么?

    62 引用 • 512 回帖
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    52 引用 • 228 回帖
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 7 关注
  • PostgreSQL

    PostgreSQL 是一款功能强大的企业级数据库系统,在 BSD 开源许可证下发布。

    22 引用 • 22 回帖 • 1 关注
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    76 引用 • 1742 回帖
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    173 引用 • 414 回帖 • 369 关注
  • SQLite

    SQLite 是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。SQLite 是全世界使用最为广泛的数据库引擎。

    5 引用 • 7 回帖
  • InfluxDB

    InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。

    2 引用 • 86 关注
  • PWA

    PWA(Progressive Web App)是 Google 在 2015 年提出、2016 年 6 月开始推广的项目。它结合了一系列现代 Web 技术,在网页应用中实现和原生应用相近的用户体验。

    14 引用 • 69 回帖 • 177 关注
  • SpaceVim

    SpaceVim 是一个社区驱动的模块化 vim/neovim 配置集合,以模块的方式组织管理插件以
    及相关配置,为不同的语言开发量身定制了相关的开发模块,该模块提供代码自动补全,
    语法检查、格式化、调试、REPL 等特性。用户仅需载入相关语言的模块即可得到一个开箱
    即用的 Vim-IDE。

    3 引用 • 31 回帖 • 118 关注
  • OAuth

    OAuth 协议为用户资源的授权提供了一个安全的、开放而又简易的标准。与以往的授权方式不同之处是 oAuth 的授权不会使第三方触及到用户的帐号信息(如用户名与密码),即第三方无需使用用户的用户名与密码就可以申请获得该用户资源的授权,因此 oAuth 是安全的。oAuth 是 Open Authorization 的简写。

    36 引用 • 103 回帖 • 28 关注
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 2 关注
  • 前端

    前端技术一般分为前端设计和前端开发,前端设计可以理解为网站的视觉设计,前端开发则是网站的前台代码实现,包括 HTML、CSS 以及 JavaScript 等。

    245 引用 • 1338 回帖 • 1 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 644 关注
  • 脑图

    脑图又叫思维导图,是表达发散性思维的有效图形思维工具 ,它简单却又很有效,是一种实用性的思维工具。

    31 引用 • 97 回帖
  • IPFS

    IPFS(InterPlanetary File System,星际文件系统)是永久的、去中心化保存和共享文件的方法,这是一种内容可寻址、版本化、点对点超媒体的分布式协议。请浏览 IPFS 入门笔记了解更多细节。

    21 引用 • 245 回帖 • 230 关注
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖