链滴
社区愿景和功能特性
优雅的 Markdown 所见即所得编辑
快捷键交互
随时自由编辑分享内容
支持注销账号来去自由
分布式社区网络
开放 API
产品
Symphony 社区系统(Java)
Solo 博客系统(Java)
Vditor 编辑器(TypeScript)
思源笔记(Electron、Go)
Pipe 博客平台(Vue、Go)
发展计划表
发展简史
榜单
GitHub 仓库排行
帖子打赏排行
Solo 博客端排行
积分排行
活跃度排行
贡献排行
本站基于开源项目 Sym
编程代码问答
登录
注册
首页
>
标签
LLM
7
引用 •
5
回帖 •
52
浏览
参与讨论
关注
关注
分享
Transformer
1
引用
vLLM
1
引用
fmisc
5
引用 •
26
回帖
GPT
8
引用 •
17
回帖
人工智能
人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
140
引用 •
407
回帖
工具
子曰:“工欲善其事,必先利其器。”
308
引用 •
773
回帖
默认
热议
好评
优选
最近回帖
关注者
查看所有标签
思源笔记 v3.5.0 发布,提示块
概述 提示块现已发布! 请注意: 更新后不支持回退:使用新版创建了包含提示块的文档,用旧版打开会导致提示块丢失 该版本会批量更新所有文档数据的版本号,数据同步可能需要较长时间,请耐心等待 变更记录 以下是此版本中的详细变更。 引入特性 [链接] 改进功能 [链接] [链接] [链接] [链接] [链接] [链接] 旧版 ..
2.1K
6 天前
llms.txt:为大模型打造的“网站说明书”
一、什么是 llms.txt? llms.txt 是由 Jeremy Howard 于 2024 年 9 月 3 日提出的一项开放性提案,旨在为网站提供一个标准的、机器可读的入口,专门用于帮助大语言模型在推理(inference)阶段更有效地理解网站内容。 简要介绍一下 Jeremy Howard,他目前是 answe ..
32
2 个月前
全面梳理大模型部署工具:从硬件到平台
引言:大模型部署工具的百花齐放 让一个大模型跑起来,远不止 pip install 和 model.generate() 那么简单。从底层计算框架到上层服务接口,整个技术栈错综复杂,包含各种各样百花齐放的工具。笔者在刚开始学习这方面的知识时被各种五花八门的工具搞的眼花缭乱,为此,特意进行了整理并写成了本文章。 本文将带 ..
47
3 个月前
AI 编程翻车?你的 Cursor 总在“瞎忙”?问题在你不会写“说明书”!
以'上下文管理'为核心,实现精准可控的 AI 驱动开发 近期参与 cursor 官方主办的线下交流会,多位专家分享了使用经验。其中大铭老师提出的观点和实操经验,对探索 AI 与人类职责边界有深刻启发,本文整理如下。 最近在技术圈里,有个现象特别有意思:博主们用 AI 工具一两句话就能做出一个应用,而我们真正开发时却处处 ..
184
5 个月前
MCP 开发新范式:mcp-framework 让 TypeScript MCP Server 开发效率翻倍
朋友们,今天想和大家聊聊一个提升 MCP 应用开发效率的利器! 在大语言模型(LLM)应用开发领域,Model Context Protocol(MCP) 已成为连接 AI 模型与现实世界的关键桥梁。而最近,基于 TypeScript 的 MCP 开发迎来了一次显著的效率提升——那就是 mcp-framework 框架 ..
204
5 个月前
用 SPCT 给奖励模型来次“升级”:能自省、会点评,还能越算越准
开篇:奖励模型挺重要,但不好搞啊! 为啥要聊奖励模型? 现在大语言模型(LLM)是越来越火,能力也越来越强。但光能打还不行,还得听话,得知道啥是对的、啥是好的,不能瞎来。这就是所谓的“对齐”(Alignment)。要让 LLM 听话,强化学习(RL),特别是有人在旁边指点的强化学习(RLHF),就成了关键技术。在这个过 ..
223
8 个月前
DeepSeek-V3-0324 推荐温度为 0.3,以及奇葩的温度缩放机制
DeepSeek-V3-0324 发布之后我注意到这个模型显然比原本的 V3 更加发散(据说是用 R1 辅助训练的,可能是学到了 R1 的坏毛病)。 看了一眼官方文档,有两个重点: 推荐的默认温度是 0.3 重点:Deepseek 官方为了适配大家常用的习惯,实现了一个奇葩的温度缩放机制,见 https://huggi ..
470
8 个月前
llm 原理
Introduction source:https://stanford-cs324.github.io/winter2022/lectures/introduction/ - CS324 是这门课程 lecture note 的摘抄和部分“用自己的语言表述” 基本原理 语言模型 (LM) 的经典定义是标记序列的概率分 ..
54
1 年前