现在流行的 deepseek,各种多模态大模型与传统的机器学习和深度学习(sklearn 和 pytorch)是一回事吗?

人工智能大行其道对我们编程人员有哪些影响,有了人工智能我们还需要掌握、理解和记忆编程的知识和技能吗?

  • DeepSeek
    18 引用 • 61 回帖 • 1 关注
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    43 引用 • 44 回帖
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    115 引用 • 319 回帖
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    10160 引用 • 46160 回帖 • 63 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • EvilCodes
    作者

    谢谢,明白了

  • 其他回帖
  • ✅ 对的

    1. 技术定位的本质差异

    • PyTorch/TensorFlow/scikit-learn 是「工业级工具链」
      → 相当于汽车制造厂的机床和生产线
      → 提供基础算法模块和计算框架
      → 需要开发者自行设计模型架构和训练流程
    • DeepSeek/GPT/Claude 是「工业化产品」
      → 相当于已经组装好的智能汽车
      → 提供开箱即用的推理能力
      → 内部封装了数十亿参数的预训练模型

    或者

    • PyTorch 和 sklearn :类似于厨房里的刀具、锅碗瓢盆等工具,你可以用它们做出任何菜肴。
    • DeepSeek :类似于已经做好的一道菜(比如红烧肉),你只需要加热或直接食用即可,不需要了解它是如何制作的。

    2. 技术栈的层次关系

    应用层:DeepSeek等成品模型(可直接调用的API服务)
           ↓
    框架层:PyTorch/TensorFlow(模型研发工具包)
           ↓
    数学层:CUDA/BLAS(底层计算加速)
    

    这种技术分层正是 AI 工业化进程的体现:就像普通人不需要懂得内燃机原理也能开车,但汽车工程师必须精通机械设计。未来技术生态会持续向「使用层」和「研发层」两极分化发展。

    以上摘自 deepseek-r1

    1 回复
    1 操作
    wilsons 在 2025-04-27 18:20:51 更新了该回帖
  • EvilCodes
    作者

    那我请教下,deepseek 相当于只是个开发的成品,deepseek 是不能和 pytorch 和 sk-learn 这种工具等效的,对不对。

    1 回复
  • 结论:

    不是一回事,Deepseek 和多模态大模型代表了当前人工智能的前沿方向,而传统机器学习和深度学习是其发展的基础。


    关系与联系

    (1) 继承与发展

    • 传统机器学习 → 深度学习:深度学习是传统机器学习的延伸和发展,解决了传统方法在特征提取和复杂任务上的局限性。
    • 深度学习 → 多模态大模型:多模态大模型是深度学习的进一步发展,特别是在模型规模、训练方式和多模态处理能力上的突破。

    (2) 工具层面

    • sklearn 和 PyTorch
      • sklearn 主要用于传统机器学习任务。
      • PyTorch 是深度学习框架,可以用来构建和训练深度学习模型,包括多模态大模型。
      • 多模态大模型(如 Deepseek)通常基于深度学习框架(如 PyTorch 或 TensorFlow)开发。

    (3) 思维模式

    • 传统机器学习:以“小而精”为目标,注重模型的可解释性和效率。
    • 深度学习:以“大而强”为目标,注重模型的性能和泛化能力。
    • 多模态大模型:以“通用智能”为目标,注重模型的跨模态能力和多任务适应性。

    总结

    维度 传统机器学习 (sklearn) 深度学习 (PyTorch) 多模态大模型 (Deepseek)
    模型规模 小型模型 中大型模型 超大规模模型
    数据需求 少量标注数据 大量标注数据 海量无标注数据
    特征提取 人工设计特征 自动提取特征 跨模态特征融合
    计算资源 普通 CPU GPU/TPU 分布式计算集群
    应用场景 结构化数据任务 非结构化数据任务 跨模态复杂任务
    • 不是一回事:Deepseek 和多模态大模型代表了当前人工智能的前沿方向,而传统机器学习和深度学习是其发展的基础。
    • 相辅相成:尽管它们在技术和应用上有显著差异,但在实际项目中可以根据需求选择合适的工具和技术。

    以上摘自 Qwen

    是否还需要学习

    没有变成强人工智能那天,还需要学,人工智能的理解力,目前还仅相当于几岁孩子。

    参考 https://pipe.b3log.org/blogs/wilsons/articles/2025/04/13/1744521917686

    1 回复
    1 操作
    wilsons 在 2025-04-21 20:03:06 更新了该回帖
EvilCodes
我的世界,我的代码,我的逻辑。

推荐标签 标签

  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3202 引用 • 8217 回帖 • 1 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    29 引用 • 202 回帖 • 31 关注
  • SendCloud

    SendCloud 由搜狐武汉研发中心孵化的项目,是致力于为开发者提供高质量的触发邮件服务的云端邮件发送平台,为开发者提供便利的 API 接口来调用服务,让邮件准确迅速到达用户收件箱并获得强大的追踪数据。

    2 引用 • 8 回帖 • 505 关注
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    415 引用 • 3598 回帖 • 1 关注
  • jQuery

    jQuery 是一套跨浏览器的 JavaScript 库,强化 HTML 与 JavaScript 之间的操作。由 John Resig 在 2006 年 1 月的 BarCamp NYC 上释出第一个版本。全球约有 28% 的网站使用 jQuery,是非常受欢迎的 JavaScript 库。

    63 引用 • 134 回帖 • 734 关注
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 27 关注
  • 禅道

    禅道是一款国产的开源项目管理软件,她的核心管理思想基于敏捷方法 scrum,内置了产品管理和项目管理,同时又根据国内研发现状补充了测试管理、计划管理、发布管理、文档管理、事务管理等功能,在一个软件中就可以将软件研发中的需求、任务、bug、用例、计划、发布等要素有序的跟踪管理起来,完整地覆盖了项目管理的核心流程。

    10 引用 • 15 回帖
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    268 引用 • 666 回帖 • 1 关注
  • Sillot

    Insights(注意当前设置 master 为默认分支)

    汐洛彖夲肜矩阵(Sillot T☳Converbenk Matrix),致力于服务智慧新彖乄,具有彖乄驱动、极致优雅、开发者友好的特点。其中汐洛绞架(Sillot-Gibbet)基于自思源笔记(siyuan-note),前身是思源笔记汐洛版(更早是思源笔记汐洛分支),是智慧新录乄终端(多端融合,移动端优先)。

    主仓库地址:Hi-Windom/Sillot

    文档地址:sillot.db.sc.cn

    注意事项:

    1. ⚠️ 汐洛仍在早期开发阶段,尚不稳定
    2. ⚠️ 汐洛并非面向普通用户设计,使用前请了解风险
    3. ⚠️ 汐洛绞架基于思源笔记,开发者尽最大努力与思源笔记保持兼容,但无法实现 100% 兼容
    29 引用 • 25 回帖 • 134 关注
  • C

    C 语言是一门通用计算机编程语言,应用广泛。C 语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。

    86 引用 • 165 回帖
  • 外包

    有空闲时间是接外包好呢还是学习好呢?

    26 引用 • 233 回帖 • 1 关注
  • Access
    1 引用 • 3 回帖
  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖
  • 导航

    各种网址链接、内容导航。

    45 引用 • 177 回帖 • 1 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖
  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 384 回帖 • 3 关注
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    108 引用 • 153 回帖
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    17 引用 • 53 回帖 • 143 关注
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    10 引用 • 77 回帖
  • Office

    Office 现已更名为 Microsoft 365. Microsoft 365 将高级 Office 应用(如 Word、Excel 和 PowerPoint)与 1 TB 的 OneDrive 云存储空间、高级安全性等结合在一起,可帮助你在任何设备上完成操作。

    5 引用 • 34 回帖
  • OneNote
    1 引用 • 3 回帖
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 2 关注
  • 书籍

    宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”

    84 引用 • 414 回帖
  • DNSPod

    DNSPod 建立于 2006 年 3 月份,是一款免费智能 DNS 产品。 DNSPod 可以为同时有电信、网通、教育网服务器的网站提供智能的解析,让电信用户访问电信的服务器,网通的用户访问网通的服务器,教育网的用户访问教育网的服务器,达到互联互通的效果。

    6 引用 • 26 回帖 • 532 关注
  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖 • 2 关注
  • Netty

    Netty 是一个基于 NIO 的客户端-服务器编程框架,使用 Netty 可以让你快速、简单地开发出一个可维护、高性能的网络应用,例如实现了某种协议的客户、服务端应用。

    49 引用 • 33 回帖 • 43 关注
  • RIP

    愿逝者安息!

    8 引用 • 92 回帖 • 408 关注