希望支持 Ollama 本地模型的流式输出

目前要等待 AI 输出完再显示,阻塞太久了体验很差。下面是简单的流式输出答案的代码(真实可用,仅供参考),我没开发过思源插件,也不知道官方 API 是否支持对接 AI 输出,但我觉得这个可能由官方支持比较靠谱,衷心希望官方考虑下...

async function main() { // 定义可用模型列表 const modelList = [ 'deepseek-r1:14b', 'qwen2.5' ]; // 创建 petite-vue 应用 createApp({ model: modelList[0], question: 'strawberry里有几个r', // 默认问题 output: null, // 输出内容,初始为 null history: [], // 聊天记录 // 定义异步聊天函数 async chat(question, container) { // 如果输入为空,则不执行操作 if (question === '') return // 清空输入框内容 this.question = '' // 将新问题和空的答案添加到聊天记录中 this.history.push({ question, answer: '' }) let action = this.history[this.history.length - 1] // Ollama 的 API 地址 const apiUrl = "http://localhost:11434/api/generate" // 选定的模型名称 const modelName = this.model // 发送请求到 API const resp = await fetch(apiUrl, { method: "POST", // 请求方法为 POST headers: { "Content-Type": "application/json" // 请求头内容类型为 JSON }, body: JSON.stringify({ model: modelName, // 指定使用的模型 prompt: question // 发送的问题内容 }) }) // 获取响应体的读取器,用于逐步读取流式内容 const reader = resp.body.getReader() // 创建文本解码器,将二进制数据解码为文本 const textDecoder = new TextDecoder("utf-8") // 配置 Showdown 转换器的选项 const options = { parseImgDimensions: true, /* 支持定义图片尺寸 */ tables: true, /* 启用表格语法 */ strikethrough: true, /* 启用删除线 */ tasklists: true, /* 启用待办列表 */ emoji: true, /* 启用 emoji 表情 */ splitAdjacentBlockquotes: true, /* 分离相邻的引用块 */ moreStyling: true, /* 启用更多样式支持 */ } // 使用 Showdown 转换器将答案从 Markdown 转为 HTML const converter = new showdown.Converter(options) // 循环读取 API 返回的流式内容 while (1) { const { done, value } = await reader.read() // 读取一段内容 if (done) { // 针对deepseek的思考部分 if (action.answer.includes('</think>')) { const arr = action.answer.split('</think>') const think = arr[0] + '</think>' const answer = arr[1] action.answer = think + converter.makeHtml(answer) } else { action.answer = converter.makeHtml(action.answer) } log(action.answer) log('=== END ===') // 打印结束标志 break // 退出循环 } // 解码流式内容为字符串 const answer = textDecoder.decode(value).trim() // 将流式内容按行分割并逐行处理 const arr = answer.split('\n').map(item => { log(item) // 打印每行内容 try { // 尝试将 JSON 字符串解析为对象,并返回响应内容 const obj = JSON.parse(item.trim()) return obj.response } catch (err) { // 如果解析失败,返回空字符串 return '' } }) // 将解析的内容添加到当前问题的答案中 action.answer += arr.join('') } } }).mount('#app') // 将应用挂载到页面上的 #app 容器中 }
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    24703 引用 • 101394 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • zxkmm 1 赞同

    难点不是流式输出本身,是让编辑器上有流式输出。

    另外这个并不是阻塞,只是简单的屏蔽用户操作。即使实现了流式输出也需要屏蔽用户操作,只是视觉上更好看。

    2 回复
  • 另外关于你的问题,app 暴露给插件的 API 据我所知没有和 AI 相关的。

  • WaveF via macOS

    明白了,我是做 UI 设计的,目前这种屏蔽用户操作在设计实际上有强弱之分,直接用一个进度条遮挡整个编辑器实际上属于强打断,它表现的并不只是视觉上好不好看,而是会强制打断用户思路,就好比在影院看电影时突然中途插入全屏广告。不管怎样,我也只是提个建议或者探讨,如果不希望在流式输出期间用户在编辑器本体操作,那是否可以用单独的窗口/webworker 来处理,编辑器本体只是有一个占位符块,等独立窗口完成流式输出后再把内容填充到主编辑器,这样是不是更可行?不过如果没有 AI 相关的 API 那也只能等官方了

    1 回复
    2 操作
    WaveF 在 2025-02-13 10:49:20 更新了该回帖
    WaveF 在 2025-02-13 10:48:39 更新了该回帖
  • 如果你愿意的话,插件也可以实现,单独做一套,不用官方的就行。不需要 API

  • 如何自己喂数据训练?

  • 其实可以参考 vscode 中 copilot 的方案,单独开一个侧边栏或者聊天框流式输出,然后做好跟编辑器的交互(聊天记录一键导入到思源)就行。这种阻塞体验是很差的

    1 回复
  • 那恐怕有点难哦,vscode 有块级 diff 和冲突解决。思源连同步冲突 diff 和解决都没有很完善。

请输入回帖内容 ...

推荐标签 标签

  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖 • 2 关注
  • 脑图

    脑图又叫思维导图,是表达发散性思维的有效图形思维工具 ,它简单却又很有效,是一种实用性的思维工具。

    31 引用 • 96 回帖
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    56 引用 • 85 回帖
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 461 关注
  • GitHub

    GitHub 于 2008 年上线,目前,除了 Git 代码仓库托管及基本的 Web 管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。正因为这些功能所提供的便利,又经过长期的积累,GitHub 的用户活跃度很高,在开源世界里享有深远的声望,并形成了社交化编程文化(Social Coding)。

    210 引用 • 2040 回帖
  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 604 关注
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 22 关注
  • 书籍

    宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”

    76 引用 • 389 回帖
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    556 引用 • 674 回帖
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖
  • 安全

    安全永远都不是一个小问题。

    203 引用 • 818 回帖
  • QQ

    1999 年 2 月腾讯正式推出“腾讯 QQ”,在线用户由 1999 年的 2 人(马化腾和张志东)到现在已经发展到上亿用户了,在线人数超过一亿,是目前使用最广泛的聊天软件之一。

    45 引用 • 557 回帖 • 1 关注
  • OpenResty

    OpenResty 是一个基于 NGINX 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

    17 引用 • 54 关注
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    52 引用 • 228 回帖
  • Flutter

    Flutter 是谷歌的移动 UI 框架,可以快速在 iOS 和 Android 上构建高质量的原生用户界面。 Flutter 可以与现有的代码一起工作,它正在被越来越多的开发者和组织使用,并且 Flutter 是完全免费、开源的。

    39 引用 • 92 回帖
  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 384 回帖 • 5 关注
  • App

    App(应用程序,Application 的缩写)一般指手机软件。

    91 引用 • 384 回帖
  • DevOps

    DevOps(Development 和 Operations 的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    57 引用 • 25 回帖 • 7 关注
  • Laravel

    Laravel 是一套简洁、优雅的 PHP Web 开发框架。它采用 MVC 设计,是一款崇尚开发效率的全栈框架。

    20 引用 • 23 回帖 • 735 关注
  • 创造

    你创造的作品可能会帮助到很多人,如果是开源项目的话就更赞了!

    182 引用 • 1010 回帖
  • SMTP

    SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。

    4 引用 • 18 回帖 • 636 关注
  • 笔记

    好记性不如烂笔头。

    311 引用 • 796 回帖
  • CSS

    CSS(Cascading Style Sheet)“层叠样式表”是用于控制网页样式并允许将样式信息与网页内容分离的一种标记性语言。

    198 引用 • 541 回帖
  • 百度

    百度(Nasdaq:BIDU)是全球最大的中文搜索引擎、最大的中文网站。2000 年 1 月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

    63 引用 • 785 回帖 • 113 关注
  • SendCloud

    SendCloud 由搜狐武汉研发中心孵化的项目,是致力于为开发者提供高质量的触发邮件服务的云端邮件发送平台,为开发者提供便利的 API 接口来调用服务,让邮件准确迅速到达用户收件箱并获得强大的追踪数据。

    2 引用 • 8 回帖 • 487 关注
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖 • 1 关注
  • 一些有用的避坑指南。

    69 引用 • 93 回帖