当前位置:首页 >娱乐 >Stability AI发布Stable Code 3B模型,没有GPU也能本地运行 专注于辅助代码任务

Stability AI发布Stable Code 3B模型,没有GPU也能本地运行 专注于辅助代码任务

2024-06-29 08:15:59 [百科] 来源:避面尹邢网
Stable Code 3B 的模型没性能优于类似大小的代码模型,并且与 CodeLLaMA 7B 的地运性能相当,尽管其大小只有 CodeLLaMA 7B 的模型没 40%。

在文生图领域大火的地运 Stability AI,今天宣布了其 2024 年的模型没第一个新 AI 模型:Stable Code 3B。顾名思义,地运Stable Code 3B 是模型没一个拥有 30 亿参数的模型,专注于辅助代码任务。地运 

无需专用 GPU 即可在笔记本电脑上本地运行,模型没同时仍可提供与 Meta 的地运 CodeLLaMA 7B 等大型模型具有竞争力的性能。

Stability AI发布Stable Code 3B模型,没有GPU也能本地运行 专注于辅助代码任务

2023 年底,模型没Stability AI 便开始推动更小、地运更紧凑、模型没更强大模型的地运发展,比如用于文本生成的模型没 StableLM Zephyr 3B 模型。

Stability AI发布Stable Code 3B模型,没有GPU也能本地运行 专注于辅助代码任务

随着 2024 年的到来,Stability AI 开年便马不停蹄的发布 2024 年第一个大型语言模型 Stable Code 3B,其实这个模型早在去年八月就发布了预览版 Stable Code Alpha 3B,此后 Stability AI 一直在稳步改进该技术。新版的 Stable Code 3B 专为代码补全而设计,具有多种附加功能。

Stability AI发布Stable Code 3B模型,没有GPU也能本地运行 专注于辅助代码任务

与 CodeLLaMA 7b 相比,Stable Code 3B 大小缩小了 60%,但在编程任务上达到了与前者相媲美的性能。

Stable Code 3B 在 MultiPL-E 基准上实现了 SOTA 性能(与类似大小的模型相比),例如 Stable Code 3B 在 Python、C++、JavaScript、Java、PHP 和 Rust 编程语言上的性能优于 StarCoder。

研究介绍

Stable Code 3B 基于 Stable LM 3B 训练而成,而 Stable LM 3B 训练 token 数达到 4 万亿,更进一步的,Stable Code 使用了软件工程中特定的数据(包括代码)进行训练。

Stable Code 3B 提供了更多的特性,即使跨多种语言也表现良好,还兼具其他优势,比如支持 FIM(Fill in the Middle ,一种新的训练技巧)功能,还能扩展上下文大小。基础 Stable Code 在多达 16,384 个 token 序列上进行训练,遵循与 CodeLlama 类似的方法,即采用旋转嵌入(Rotary Embeddings),这种方法可以选择性的允许修改多达 1,000,000 个旋转基(rotary base),进一步将模型的上下文长度扩展到 100k 个 token。

在模型架构方面,Stable Code 3B 模型是一个纯解码器的 transformer,类似于 LLaMA 架构,并进行了以下修改:

  • 位置嵌入:旋转位置嵌入应用于头嵌入维度的前 25%,以提高吞吐量;

  • Tokenizer:使用 GPTNeoX Tokenizer.NeoX 的修改版本,添加特殊 token 来训练 FIM 功能,例如 < FIM_PREFIX>、等。

训练

训练数据集

Stable Code 3B 的训练数据集由 HuggingFace Hub 上提供的开源大规模数据集过滤混合组成,包括 Falcon RefinedWeb、CommitPackFT、Github Issues、StarCoder,并进一步用数学领域的数据补充训练。

训练基础设施

  • 硬件:Stable Code 3B 在 Stability AI 集群上使用 256 个 NVIDIA A100 40GB GPU 进行训练。

  • 软件:Stable Code 3B 采用 gpt-neox 的分支,使用 ZeRO-1 在 2D 并行性(数据和张量并行)下进行训练,并依赖 flash-attention、SwiGLU、FlashAttention-2 的旋转嵌入内核。

最后,我们看一下 Stable Code 3B 的性能表现:

关于 Stable Code 3B 更详细的技术报告会在之后发布,大家可以期待一下。

参考链接:https://stability.ai/news/stable-code-2024-llm-code-completion-release?continueFlag=ff896a31a2a10ab7986ed14bb65d25ea

(责任编辑:知识)

    推荐文章
    • 信用购怎么变回花呗 操作流程来啦

      信用购怎么变回花呗 操作流程来啦有不少支付宝用户同意花呗服务升级后,发现花呗页面变成了“花呗|信用购”,在原来花呗的基础上还多了一个信用购消费贷款产品,虽说可以和花呗单独使用,可也有的人认为用不着,想知道信用 ...[详细]
    • 关于人工智能的五个常见误解

      关于人工智能的五个常见误解关于人工智能的五个常见误解2023-08-03 09:47:23人工智能 在兴奋和潜力之中,一些关于人工智能的神话和误解也出现了。了解这些神话背后的真相,对于做出有关人工智能实施和开发的明智决策至关重 ...[详细]
    • 饭冢隆:《索尼克:未知边境》与《旷野之息》毫无相似之处

      饭冢隆:《索尼克:未知边境》与《旷野之息》毫无相似之处系列新作《索尼克:未知边境》一经曝光,立即引起了与《塞尔达传说:旷野之息》的比较,但现在,索尼团队的负责人饭冢隆似乎急于将《索尼克:未知边境》与这些比较拉开距离。在接受Shacknews采访时,饭冢隆 ...[详细]
    • 为什么有线以太网连接在今天仍然很有意义

      为什么有线以太网连接在今天仍然很有意义为什么有线以太网连接在今天仍然很有意义2023-06-14 12:05:55网络 有线比无线更快、更可靠、更安全,那么我们为什么不使用它们呢? 以太网比无线互联网更快、更可靠、更安全。如今很少有笔记本 ...[详细]
    • 安逸花还清后还收费吗 取消方法是怎样的?

      安逸花还清后还收费吗 取消方法是怎样的?大家应该都知道,贷款都是要成本的,贷款平台会在借款成功后收取一定的费用,在安逸花借钱也一样。有不少人在安逸花上借的钱还清了想知道还会不会再收费,那么安逸花还清后还收费吗?这个要看具体是什么费用了,一起 ...[详细]
    • 一次DOM曝光封装历程

      一次DOM曝光封装历程一次DOM曝光封装历程作者:开盛 2023-08-02 10:11:00开发 前端 当我以为已经够用时,某次需求需要监听 DOM 在某个 div 内横向滑动的曝光,发现它并不支持!而后面一些曝光策略对 ...[详细]
    • Golang 中的 io 包详解:组合接口

      Golang 中的 io 包详解:组合接口Golang 中的 io 包详解:组合接口作者:路多辛 2023-08-03 08:48:07开发 前端 Golang 中,接口可以通过嵌入多个其他接口组成组合接口。组合接口表示的是子接口的集合,具有 ...[详细]
    • 0代码破解GPT

      0代码破解GPT0代码破解GPT-4大脑!外国网友击穿LLM护栏,诱导AI一步步造出炸弹作者:新智元 2023-08-05 13:02:22人工智能 新闻 无需代码,只要设置一个情境,就可以绕过GPT-4的安全护栏, ...[详细]
    • 借呗怎么变成信用贷了 借呗变成信用贷还能借款吗?

      借呗怎么变成信用贷了 借呗变成信用贷还能借款吗?借呗是大家耳熟能详的消费信用贷款,并且有很多人都在上面借过钱。可是有不少人发现自己的借呗变成了信用贷,就不是很清楚还能不能借款。那么借呗变成信用贷还能借款吗?这里就给大家来简单介绍下。1、借呗怎么变成 ...[详细]
    • 眼科医生服务平台『惟视眼科』获普华投资数千万A轮融资

      眼科医生服务平台『惟视眼科』获普华投资数千万A轮融资“金眼科、银外科”是医疗行业公开的秘密,表明了眼科这个细分领域所具有的巨大市场价值。一般而言,眼科市场大体包括眼病诊疗、医学视光等板块。公开数据显示,眼病诊疗市场规模大约200亿,医学视光市场50亿规 ...[详细]
    热点阅读