当前位置:首页 >热点 >PyTorch实现,GitHub 4000星:这是微软开源的计算机视觉库 该库没有从头开始创建实现

PyTorch实现,GitHub 4000星:这是微软开源的计算机视觉库 该库没有从头开始创建实现

2024-06-30 20:42:12 [百科] 来源:避面尹邢网

PyTorch实现,实算机视觉GitHub 4000星:这是现Gb星微软开源的计算机视觉库

作者:佚名 新闻 开源 本文介绍了微软开源的计算机视觉库,它囊括了计算机视觉领域的微软最佳实践、代码示例和丰富文档。开源库

 

近年来,实算机视觉计算机视觉领域突飞猛进,现Gb星在人脸识别、微软图像理解、开源库搜索、实算机视觉无人机、现Gb星地图、微软半自动和自动驾驶方面得到广泛应用。开源库而这些应用的实算机视觉核心部分是视觉识别任务,如图像分类、现Gb星目标检测和图像相似度。微软

PyTorch实现,GitHub 4000星:这是微软开源的计算机视觉库 该库没有从头开始创建实现

在各种计算机视觉模型和应用层出不穷的当下,如何把握发展脉络,跟进领域前沿发展呢?微软创建了一个库,提供构建计算机视觉系统的大量示例和最佳实践指导原则。

PyTorch实现,GitHub 4000星:这是微软开源的计算机视觉库 该库没有从头开始创建实现

项目地址:https://github.com/microsoft/computervision-recipes

PyTorch实现,GitHub 4000星:这是微软开源的计算机视觉库 该库没有从头开始创建实现

这个库旨在构建一个全面的集合,涵盖利用了计算机视觉算法、神经架构和系统运行方面近期进展的工具和示例。

该库没有从头开始创建实现,而是基于已有的 SOTA 库发展而来,并围绕加载图像数据、优化和评估模型、扩展至云端构建了额外的工具函数。此外,微软团队表示,希望通过该项目回答计算机视觉领域的常见问题、指出频繁出现的缺陷问题,并展示如何利用云进行模型训练和部署。

该库中所有示例以 Jupyter notebooks 和常见工具函数的形式呈现。所有示例均使用 PyTorch 作为底层深度学习库。

  • Jupyter notebooks 地址:https://github.com/microsoft/computervision-recipes/blob/master/scenarios
  • 工具函数地址:https://github.com/microsoft/computervision-recipes/blob/master/utils_cv

目标群体

该库的目标群体是具备一定计算机视觉知识背景的数据科学家和机器学习工程师,因为库的内容以 source-only(仅源代码)的形式呈现,支持自定义机器学习建模。这个库提供的工具函数和示例旨在为现实世界的视觉问题提供解决方案加速器。

示例

该库支持不同的计算机视觉场景,如基于单张图像运行,示例如下:

或基于视频序列的动作识别等场景,示例如下:

场景

该库涵盖常用的计算机视觉场景,包含如下类别:

对于每个主要场景(base),该项目均提供使用户高效构建自己模型的工具。这需要使用者完成一些任务,如基于自己的数据微调模型的简单任务,或者难例挖掘甚至模型部署等更复杂的任务。

1. 图像分类任务

该目录提供了构建图像分类系统的示例和最佳实践,旨在让用户能够在自己的数据集上轻松快速地训练高准确率分类器。

这里提供的示例 notebook 具备预置的默认参数,可以很好地处理多个数据集。该目录还提供了有关常见缺陷和最佳实践的大量文档。

此外,该库还展示了如何使用微软的云计算平台 Azure,加快在大型数据集上的训练速度或将模型部署为 web 服务。

2. 图像相似度

该目录提供了构建图像相似度系统的示例和最佳实践,旨在使用户能够基于自己的数据集方便快捷地训练高精度模型。

下图为图像检索示例,其中左图为查询图像,右面为与之最相似的 6 幅图像:

3. 目标检测

该目录提供了构建目标检测系统的示例和最佳实践,旨在使用户能够基于自己的数据集方便快捷地训练高准确率模型。

该库使用了 torchvision 的 Faster R-CNN 实现,它被证明能够很好地处理多种计算机视觉问题。

项目作者建议使用者在具备 GPU 的机器上运行示例,虽然 GPU 在技术层面上并非必需,但是如果不使用 GPU,即使只用几十个图像,训练过程也会变得非常缓慢。

4. 关键点检测

该目录包含构建关键点检测系统的示例和最佳实践指导原则,并展示了如何使用预训练模型进行人体姿势估计。

该目录使用了 Mask R-CNN 的扩展,可以同时检测物体及其关键点。其底层技术与上述目标检测方法类似,即基于 Torchvision 的 Mask R-CNN。

5. 图像分割

该目录提供了构建图像分割系统的示例和最佳实践,旨在使用户能够基于自己的数据集方便快捷地训练高准确率模型。

这里的实现使用了 fastai 的 UNet 模型,其中 CNN 主干(如 ResNet)在 ImageNet 数据集上经过预训练,因此使用者只需少量标注训练样本就可以对其进行微调。

6. 动作识别

该目录包含构建基于视频的动作识别系统所需要的资源,旨在使用户能够在自定义数据集上轻松快速地训练出高准确率的快速模型。

动作识别(也叫「活动识别」)包括从一系列帧中对多种动作进行分类,例如「阅读」或「饮酒」:

动作识别是一个热门的研究领域,每年都有大量的方法发表。其中一个突出的方法是 R(2+1)D 模型,它能够获得高准确率,且比其他方法快得多。(参见论文《Large-scale weakly-supervised pre-training for video action recognition》)

该目录中的实现和预训练权重均基于这个 GitHub 库(https://github.com/moabitcoin/ig65m-pytorch),并添加了一些功能,以使自定义模型的训练和评估更加用户友好。这里在预训练时使用的是 IG-Kinetics 数据集。

7. 多目标跟踪

该目录提供了构建和推断多目标跟踪系统的示例和最佳实践,旨在使用户能够基于自定义数据集轻松训练高准确率跟踪模型。

该库集成了 FairMOT 跟踪算法,该算法在近期的 MOT 基准测试中表现出了很强的跟踪性能,同时也推理速度也很快。

8. 人群计数

该目录提供了多个人群计数算法的 production-ready 版本,不同算法被统一在一组一致性 API 下。

对多个基于专用数据集的人群计数模型实现进行评估后,该项目将模型范围缩小到两个选项:Multi Column CNN model (MCNN) 和 OpenPose 模型。二者均符合速度要求。

  • 对于高密度人群图像,MCNN 模型取得了良好的效果;
  • 对于低密度场景,OpenPose 表现良好。
  • 而当人群密度未知时,该项目采用启发式方法。在满足以下条件时使用 MCNN 进行预测:OpenPose 预测大于 20,MCNN 大于 50。反之,则使用 OpenPose 预测。模型的阈值可以根据使用者的场景进行更改。

此外,该目录还展示了依赖项、安装过程、测试及性能。

 

责任编辑:张燕妮 来源: 机器之心 微软开源PyTorch

(责任编辑:百科)

    推荐文章
    • 微众银行贷款怎么样 微众银行微业贷申请条件有哪些?

      微众银行贷款怎么样 微众银行微业贷申请条件有哪些?随着社会经济的不断发展,市面上的小贷机构也在不断地涌现。在这样的情况下,微众银行横空而出。很多人都没有听说过微众银行,但一定听说过它旗下的微粒贷。微众银行贷款靠谱吗?微众银行微业贷申请条件有哪些?微众 ...[详细]
    • 一文梳理 RedHat 和 CentOS 运维中的网络知识

      一文梳理 RedHat 和 CentOS 运维中的网络知识一文梳理 RedHat 和 CentOS 运维中的网络知识作者:董志卫 2019-04-17 08:55:45运维 系统运维 运维是一门艺术,也是一门苦差事,每个人对此均有不同的理解,正所谓一千个人眼 ...[详细]
    • 突发!苹果正式关闭iOS 14.8验证系统

      突发!苹果正式关闭iOS 14.8验证系统突发!苹果正式关闭iOS 14.8验证系统作者:明美无限 2021-10-06 14:33:41移动开发 iOS 相信有一直关注明美无限至今的果粉们应该都清楚了,随着iPhone 13系列的发布,全新 ...[详细]
    • 京东11.11首日:迷你主机与学习机销量破记录

      京东11.11首日:迷你主机与学习机销量破记录迷你主机具备小巧的体积、强大的性能和便捷性,能够轻松应对用户日常使用需求,成为了用户办公、学习和娱乐的新宠。在本次京东11.11,迷你主机也是备受消费者关注的明星产品。京东11.11首周,迷你主机成交 ...[详细]
    • 圆满交付!中远海运完成空客第600架次飞机部件全程物流运输

      圆满交付!中远海运完成空客第600架次飞机部件全程物流运输4月25日,由中远海运提供全程物流运输服务的空客亚洲总装线项目第600架次A320飞机大部件,历经欧洲段驳运、海运、天津段全封闭陆路运输,顺利运抵空客公司位于天津港保税区的空客总装厂并圆满交付。空客亚 ...[详细]
    • 如何选择网络服务提供商

      如何选择网络服务提供商如何选择网络服务提供商作者:Harris编译 2023-01-09 16:17:48网络 通信技术 找到合适的服务提供商可能具有挑战性,因此,企业需要了解如何选择网络服务提供商。 找到合适的服务提供商 ...[详细]
    • 预计2024年8英寸代工价格仍保持下降趋势 幅度约5% -

      预计2024年8英寸代工价格仍保持下降趋势 幅度约5% -【CNMO新闻】近日,CNMO注意到,群智咨询发布数据显示,2023年第三季度,全球8英寸晶圆代工厂的平均产能利用率持续下滑,仅为55%-60%左右。在这个背景下,中国大陆的代工厂采取以量换价策略,产 ...[详细]
    • 生活中无处不在的数据分析

      生活中无处不在的数据分析生活中无处不在的数据分析作者:数据人创作者联盟 2022-03-28 09:22:55大数据 数据分析 我与一些身边的同事朋友交流,有些做运营的朋友猜测数据分析师会慢慢变成数据运营,产品的朋友也越发觉 ...[详细]
    • 165.32万元!综保区“提前适用”政策在琼首次落地

      165.32万元!综保区“提前适用”政策在琼首次落地11月29日,海口市空港航空发动机维修工程有限公司向海口海关所属海口美兰机场海关申报入区引射筒自用设备,按照“提前适用”政策享受免征税款165.32万元人民币。这是海口空港综合 ...[详细]
    • 聊聊如何用AWS创建EKS集群

      聊聊如何用AWS创建EKS集群聊聊如何用AWS创建EKS集群作者:吕涵之 2023-04-06 08:00:36云计算 云原生 虚拟私有云 (VPC) 是仅适用于您的 Amazon 账户的虚拟网络。它在逻辑上与 Amazon 云中 ...[详细]
    热点阅读