2017 年 GitHub 中 Top 30 开源机器学习项目

本贴最后更新于 2400 天前,其中的信息可能已经时移俗易

转载自_https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7_

Mybridge 精选的 Top 30 项目及源码链接如下:

NO1 **** FastText:快速文本表示和文本分类库

在 Github 已获得 11995 颗星,贡献者 Facebook Research。

源码链接:

NO2 **** ****Deep-photo-styletransfer:“Deep Photo Style Transfer” 论文的源码和数据

在 Github 已获得 9747 颗星,论文来自于康奈尔大学的 Fujun Luan。

源码链接:

NO3 **** ********用 Python 和命令行来实现的最简单的面部识别 API

在 Github 已获得 8672 颗星,贡献者 Adam Geitge。

源码链接:

https://github.com/ageitgey/face_recognition

**NO4 ** **** ****Magenta:利用机器智能生成音乐和美术艺术品

在 Github 已获得 8113 颗星,贡献者 tensorflow。

源码链接:

https://github.com/tensorflow/magenta

NO5 **** ****Sonnet:基于 TensorFlow 的神经网络库

在 Github 已获得 573 颗星,贡献者是 DeepMind 的 Malcolm Reynolds。

源码链接:

https://github.com/deepmind/sonnet

NO6 **** ****deeplearn.js: 一个用于 Web 的硬件加速机器学习库

GitHub 5462 颗星,贡献者是 Google Brain 的 Nikhil Thorat。

源码链接:

https://github.com/PAIR-code/deeplearnjs

NO7 **** ****基于 TensorFlow 的快速风格迁移库

GitHub 4843 颗星,贡献者是 MIT 的 Logan Engstrom。

源码链接:

https://github.com/lengstrom/fast-style-transfer

NO8 **** ****Pysc2: 星际争霸 2 学习环境

GitHub 3684 颗星,贡献者是 DeepMind 的 Timo Ewalds。

源码链接:

https://github.com/deepmind/pysc2

NO9 **** ******AirSim: Microsoft AI & Research 开源的基于虚幻引擎的开源模拟器,**用于自动驾驶

GitHub 3861 颗星,贡献者是 Microsoft 的 Shital Shah。

源码链接:

https://github.com/Microsoft/AirSim

NO10 **** ****acets: 机器学习数据集的可视化工具

GitHub 3371 颗星,由 Google Brain 贡献。

源码链接:

https://github.com/PAIR-code/facets

NO11 **** ****Style2Paints:用 AI 技术为线稿快速上色的工具

GitHub 3310 颗星,贡献者 lllyasviel 。

源码链接:

NO12 **** ****Tensor2Tensor:用于广义序列-序列模型的库—Google Research

GitHub 3087 颗星,贡献者是 Google Brain 的 Ryan Sepassi。

源码链接:

https://github.com/tensorflow/tensor2tensor

NO13 **** ****基于 Pytorch 实现的图片-图片转换

GitHub 2847 颗星,贡献者 Berkeley 的 Jun-Yan Zhu, Ph.D。

源码地址:

https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix

NO14Faiss:用于密集向量的高效相似性搜索库和聚类的库

GitHub 2629 颗星,贡献者 Facebook Research。

源码地址:

https://github.com/facebookresearch/faiss

NO15****Fashion-minist:类似于 MNIST 的时尚产品数据集

GitHub 2780 颗星,贡献者是 Zalando Tech 的 Han Xiao。

源码链接:

https://github.com/zalandoresearch/fashion-mnist

NO16****ParlAI:可用在各种公开可用的对话数据集上训练和评估 AI 模型的框架

GitHub 2578 颗星,贡献者是 Facebook 的 Alexander Miller。

源码链接:

https://github.com/facebookresearch/ParlAI

NO17****Fairseq:Facebook AI Research 的序列—序列工具包

GitHub 2571 颗星,由 facebookresearch 贡献。

源码链接:

https://github.com/facebookresearch/fairseq

NO18****Pyro:基于 Python 和 PyTorch 的深度通用概率编程

GitHub 2387 颗星,贡献者 Uber Engineering。

源码链接:

https://github.com/uber/pyro

NO19****iGAN:基于 GAN 的交互式图像生成

GitHub 2369 颗星,贡献者 junyanz。

源码地址:

https://github.com/junyanz/iGAN

NO20****Deep-image-prior:用神经网络恢复图像

GitHub 2188 颗星,贡献者是 Skoltech 的 Dmitry Ulyanov, Ph.D。

源码地址:

https://github.com/DmitryUlyanov/deep-image-prior

NO21****人脸分类:基于 Keras CNN 模型与 OpenCV,使用 fer2013/imdb 数据集进行实时面部检测和表情/性别分类

GitHub 1967 颗星,由 oarriaga 贡献。

源码地址:

https://github.com/oarriaga/face_classification

NO22****Speech-to-Text-WaveNet:使用 DeepMind 的 WaveNet 和 TensorFlow 进行端到端句级英语语音识别

GitHub 1961 颗星,贡献者是 Kakao Brain 的 Namju Kim。

源码地址:

https://github.com/buriburisuri/speech-to-text-wavenet

NO23****StarGAN: 用于多域图像-图像转化的统一生成对抗网络

GitHub 1954 颗星,贡献者 Korea University 的 Yunjey Choi。

源码地址:

https://github.com/yunjey/StarGAN

NO24****MI-agents:Unity 机器学习代理

GitHub 1658 颗星,贡献者 Unity3D 的 Arthur Juliani。

源码地址:

NO25****DeepVideoAnalytics:一个分布式可视化搜索和数据分析平台

GitHub 1494 颗星,贡献者是 Cornell University 的 Akshay Bhat。

源码地址:

https://github.com/AKSHAYUBHAT/DeepVideoAnalytics

NO26****OpenNMT:Torch 上的开源神经机器翻译工具包

GitHub 1490 颗星,贡献者 OpenNMT。

源码地址:

https://github.com/OpenNMT/OpenNMT

NO27****Pix2pixHD: 用条件 GAN 合成和处理 2048×1024 的图像

GitHub 1283 颗星,贡献者是英伟达科学家 Ming-Yu Liu。

源码地址:

https://github.com/NVIDIA/pix2pixHD

NO28****Horovod:TensorFlow 布式训练框架

GitHub 1188 颗星,贡献者来自 Uber。

源码地址:

https://github.com/uber/horovod

NO29** **** **AI-Blocks:任意用户都可创建机器学习模型

GitHub 899 颗星,贡献者 MrNothing。

源码地址:

https://github.com/MrNothing/AI-Blocks

NO30 **** ****Tensorflow 实现的用于语音风格转换的深度神经网络

GitHub 845 颗星,贡献者是 Kakao Brain AI 团队的 Dabi Ahn。

源码地址:

https://github.com/andabi/deep-voice-conversion

  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    77 引用 • 37 回帖
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    115 引用 • 319 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 强迫症

    强迫症(OCD)属于焦虑障碍的一种类型,是一组以强迫思维和强迫行为为主要临床表现的神经精神疾病,其特点为有意识的强迫和反强迫并存,一些毫无意义、甚至违背自己意愿的想法或冲动反反复复侵入患者的日常生活。

    15 引用 • 161 回帖 • 1 关注
  • 酷鸟浏览器

    安全 · 稳定 · 快速
    为跨境从业人员提供专业的跨境浏览器

    3 引用 • 59 回帖 • 52 关注
  • 996
    13 引用 • 200 回帖 • 1 关注
  • Google

    Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于 1998 年 9 月 7 日以私有股份公司的形式创立,设计并管理一个互联网搜索引擎。Google 公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号。

    49 引用 • 192 回帖 • 2 关注
  • ZeroNet

    ZeroNet 是一个基于比特币加密技术和 BT 网络技术的去中心化的、开放开源的网络和交流系统。

    1 引用 • 21 回帖 • 650 关注
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    98 引用 • 367 回帖
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖
  • Chrome

    Chrome 又称 Google 浏览器,是一个由谷歌公司开发的网页浏览器。该浏览器是基于其他开源软件所编写,包括 WebKit,目标是提升稳定性、速度和安全性,并创造出简单且有效率的使用者界面。

    63 引用 • 289 回帖
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    36 引用 • 35 回帖 • 3 关注
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    346 引用 • 757 回帖 • 1 关注
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 610 关注
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    15 引用 • 7 回帖
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    77 引用 • 37 回帖
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    56 引用 • 85 回帖 • 1 关注
  • 外包

    有空闲时间是接外包好呢还是学习好呢?

    26 引用 • 233 回帖
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 1 关注
  • 设计模式

    设计模式(Design pattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的一般问题的解决方案。这些解决方案是众多软件开发人员经过相当长的一段时间的试验和错误总结出来的。

    201 引用 • 120 回帖
  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 119 关注
  • CSS

    CSS(Cascading Style Sheet)“层叠样式表”是用于控制网页样式并允许将样式信息与网页内容分离的一种标记性语言。

    198 引用 • 543 回帖 • 1 关注
  • Swift

    Swift 是苹果于 2014 年 WWDC(苹果开发者大会)发布的开发语言,可与 Objective-C 共同运行于 Mac OS 和 iOS 平台,用于搭建基于苹果平台的应用程序。

    34 引用 • 37 回帖 • 559 关注
  • Log4j

    Log4j 是 Apache 开源的一款使用广泛的 Java 日志组件。

    20 引用 • 18 回帖 • 36 关注
  • 快应用

    快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。

    15 引用 • 127 回帖 • 2 关注
  • 黑曜石

    黑曜石是一款强大的知识库工具,支持本地 Markdown 文件编辑,支持双向链接和关系图。

    A second brain, for you, forever.

    24 引用 • 246 回帖 • 1 关注
  • 单点登录

    单点登录(Single Sign On)是目前比较流行的企业业务整合的解决方案之一。SSO 的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。

    9 引用 • 25 回帖 • 1 关注
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    142 引用 • 442 回帖
  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    20 引用 • 37 回帖 • 572 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    89 引用 • 113 回帖