登录注册

LLM

5 引用 • 5 回帖 • 46 浏览

参与讨论

关注

关注分享

fmisc

4 引用 • 21 回帖
GPT

8 引用 • 17 回帖

默认热议好评优选最近回帖关注者查看所有标签

AI 编程翻车？你的 Cursor 总在“瞎忙”？问题在你不会写“说明书”！
以'上下文管理'为核心，实现精准可控的 AI 驱动开发近期参与 cursor 官方主办的线下交流会，多位专家分享了使用经验。其中大铭老师提出的观点和实操经验，对探索 AI 与人类职责边界有深刻启发，本文整理如下。最近在技术圈里，有个现象特别有意思：博主们用 AI 工具一两句话就能做出一个应用，而我们真正开发时却处处 ..

174 3 周前
MCP 开发新范式：mcp-framework 让 TypeScript MCP Server 开发效率翻倍
朋友们，今天想和大家聊聊一个提升 MCP 应用开发效率的利器！在大语言模型（LLM）应用开发领域，Model Context Protocol（MCP）已成为连接 AI 模型与现实世界的关键桥梁。而最近，基于 TypeScript 的 MCP 开发迎来了一次显著的效率提升——那就是 mcp-framework 框架 ..

177 1 个月前
用 SPCT 给奖励模型来次“升级”：能自省、会点评，还能越算越准
开篇：奖励模型挺重要，但不好搞啊！为啥要聊奖励模型？现在大语言模型（LLM）是越来越火，能力也越来越强。但光能打还不行，还得听话，得知道啥是对的、啥是好的，不能瞎来。这就是所谓的“对齐”（Alignment）。要让 LLM 听话，强化学习（RL），特别是有人在旁边指点的强化学习（RLHF），就成了关键技术。在这个过 ..

221 3 个月前
DeepSeek-V3-0324 推荐温度为 0.3，以及奇葩的温度缩放机制
DeepSeek-V3-0324 发布之后我注意到这个模型显然比原本的 V3 更加发散（据说是用 R1 辅助训练的，可能是学到了 R1 的坏毛病）。看了一眼官方文档，有两个重点：推荐的默认温度是 0.3 重点：Deepseek 官方为了适配大家常用的习惯，实现了一个奇葩的温度缩放机制，见 https://huggi ..

408 3 个月前
llm 原理
Introduction source:https://stanford-cs324.github.io/winter2022/lectures/introduction/ - CS324 是这门课程 lecture note 的摘抄和部分“用自己的语言表述” 基本原理语言模型（LM）的经典定义是标记序列的概率分 ..

43 1 年前