当前位置:首页 >休闲 >资源受限如何提高模型效率?一文梳理NLP高效方法 但模型的资源问题也越来越多

资源受限如何提高模型效率?一文梳理NLP高效方法 但模型的资源问题也越来越多

2024-07-01 12:15:11 [百科] 来源:避面尹邢网

资源受限如何提高模型效率?一文梳理NLP高效方法

作者:机器之心 人工智能 新闻 如果硬件跟不上需求,资源我们可以尽可能提高算法效率。受限梳理

训练越来越大的何提深度学习模型已经成为过去十年的一个新兴趋势。如下图所示,高模P高模型参数量的型效效方不断增加让神经网络的性能越来越好,也产生了一些新的率文研究方向,但模型的资源问题也越来越多。

图片

资源受限如何提高模型效率?一文梳理NLP高效方法 但模型的资源问题也越来越多

首先,受限梳理这类模型往往有访问限制,何提没有开源,高模P高或者即使开源,型效效方仍然需要大量的率文计算资源来运行。第二,资源这些网络模型的受限梳理参数是不能通用的,因此需要大量的何提资源来进行训练和推导。第三,模型不能无限扩大,因为参数的规模受到硬件的限制。为了解决这些问题,专注于提高效率的方法正在形成一种新的研究趋势。

资源受限如何提高模型效率?一文梳理NLP高效方法 但模型的资源问题也越来越多

近日,来自希伯来大学、华盛顿大学等多所机构的十几位研究者联合撰写了一篇综述,归纳总结了自然语言处理(NLP)领域的高效方法。

资源受限如何提高模型效率?一文梳理NLP高效方法 但模型的资源问题也越来越多

图片

论文地址:https://arxiv.org/pdf/2209.00099.pdf

效率通常是指输入系统的资源与系统产出之间的关系,一个高效的系统能在不浪费资源的情况下产生产出。在 NLP 领域,我们认为效率是一个模型的成本与它产生的结果之间的关系。

图片

方程(1)描述了一个人工智能模型产生某种结果(R)的训练成本(Cost)与三个(不完备的)因素成正比:

(1)在单个样本上执行模型的成本(E);

(2)训练数据集的大小(D);

(3)模型选择或参数调整所需的训练运行次数(H)。

然后,可以从多个维度衡量成本 Cost(·) ,如计算、时间或环境成本中的每一个都可以通过多种方式进一步量化。例如,计算成本可以包括浮点运算(FLOPs)的总数或模型参数的数量。由于使用单一的成本指标可能会产生误导,该研究收集和整理了关于高效 NLP 的多个方面的工作,并讨论了哪些方面对哪些用例有益。

该研究旨在对提高 NLP 效率的广泛方法做一个基本介绍,因此该研究按照典型的 NLP 模型 pipeline(下图 2)来组织这次调查,介绍了使各个阶段更高效的现有方法。

图片

这项工作给 NLP 研究人员提供了一个实用的效率指南,主要面向两类读者:

(1)来自 NLP 各个领域的研究人员,帮助他们在资源有限的环境下工作:根据资源的瓶颈,读者可以直接跳到 NLP pipeline 所涵盖的某个方面。例如,如果主要的限制是推理时间,论文中第 6 章描述了相关的提高效率方法。

(2)对改善 NLP 方法效率现状感兴趣的研究人员。该论文可以作为一个切入点,为新的研究方向寻找机会。

下图 3 概述了该研究归纳整理的高效 NLP 方法。

图片

此外,虽然硬件的选择对模型的效率有很大的影响,但大多数 NLP 研究者并不能直接控制关于硬件的决定,而且大多数硬件优化对于 NLP pipeline 中的所有阶段都有用。因此,该研究将工作重点放在了算法上,但在第 7 章中提供了关于硬件优化的简单介绍。最后,该论文进一步讨论了如何量化效率,在评估过程中应该考虑哪些因素,以及如何决定最适合的模型。

感兴趣的读者可以阅读论文原文,了解更多研究细节。

责任编辑:张燕妮 来源: 机器之心 模型效率

(责任编辑:时尚)

    推荐文章
    • 凯撒文化(002425.SZ)公布消息:一季度净利润预增80%

      凯撒文化(002425.SZ)公布消息:一季度净利润预增80%凯撒文化(002425.SZ)公布,预计2021年度第一季度归属于上市公司股东的净利润14690.2万元-17138.56万元,同比增长80%-110%。与上年同期相比,报告期归属于上市公司股东的净利 ...[详细]
    • 淘气值怎么看

      淘气值怎么看在淘宝软件中有很多的功能可以查看使用的,在使用的过程中有很多的用户比较好奇淘气值怎么看呢?下面就来看一下小编给大家带来的淘气值查看方法吧。1、首先打开淘宝软件进入到首页之后点击右下角的【我的淘宝】;2 ...[详细]
    • 基于GPU的人工智能与机器学习应用

      基于GPU的人工智能与机器学习应用基于GPU的人工智能与机器学习应用译文 作者:李睿 2021-06-15 08:00:00人工智能 机器学习 如今,在一些令人关注的人工智能和机器学习的应用领域,图形处理单元(GPU)发挥着日益重要 ...[详细]
    • 朋友圈一键查看访客足迹

      朋友圈一键查看访客足迹微信软件在使用的时候,有很多的小伙伴想要一键查看朋友圈访客足迹,但是不知道怎么操作,那么现在就来看一下小编带来的朋友圈一键查看访客足迹的方法吧。1、首先打开微信软件进入到首页之后点击右下角的【我的】; ...[详细]
    • 屏下摄像板块下挫 维信诺(002387CN)跌1.58%

      屏下摄像板块下挫  维信诺(002387CN)跌1.58%今日午盘,截至13:15,屏下摄像板块下挫。欧菲光(002456CN)跌5.91%报8.6元,联创电子(002036CN)跌1.97%报9.97元,维信诺(002387CN)跌1.58%报9.95元, ...[详细]
    • 极氪官宣:F1冠军车手基米·莱科宁成为其首席性能顾问 -

      极氪官宣:F1冠军车手基米·莱科宁成为其首席性能顾问 -【智车派新闻】10月23日,智车派了解到,极氪宣布F1冠军车手基米·莱科宁成为其首席性能顾问。据了解,基米·莱科宁是已退役的芬兰赛车手,曾于2007年赛季获得F1车手世界冠军。莱科宁共获得过21场一级 ...[详细]
    • 研究显示 Android 手机会收集传输大量数据

      研究显示 Android 手机会收集传输大量数据研究显示 Android 手机会收集传输大量数据作者:佚名 2021-10-14 10:43:28移动开发 Android 都柏林三一学院的研究人员调查了不同 Android 厂商手机的数据收集情况, ...[详细]
    • 讲述你们不知道Halt关机命令

      讲述你们不知道Halt关机命令讲述你们不知道Halt关机命令作者:佚名 2009-12-23 10:22:29运维 系统运维 Halt关机命令可以说是这六个关机命令中的老大。在这个命令中跟上不同的参数,可以实现不同的目的。在这个关 ...[详细]
    • 分期乐逾期一天有关系吗 主要影响有哪些?

      分期乐逾期一天有关系吗 主要影响有哪些?作为一款口碑还算可以的网贷平台,分期乐的用户还是比较多的。很多人在手头缺钱的时候,就会申请分期乐,不过也有一些用户因为其他原因,不小心就造成了逾期。分期乐逾期一天有关系吗?一起来跟希财君了解一下吧!分 ...[详细]
    • 当心:我们最可能犯下的五大安全失误

      当心:我们最可能犯下的五大安全失误当心:我们最可能犯下的五大安全失误译文 作者:核子可乐/译 2012-03-15 09:37:11新闻 安全 企业又遭遇黑客攻击了?很多人也许认为这只是运气太差。恰恰相反,这一切其实是由对基本安全规 ...[详细]
    热点阅读