当前位置:首页 >百科 >OpenAI联创Karpathy爱上羊驼:纯C代码实现婴儿Llama2,MacBook可运行,已揽1.6k星 用来训练 Llama2 架构的模型

OpenAI联创Karpathy爱上羊驼:纯C代码实现婴儿Llama2,MacBook可运行,已揽1.6k星 用来训练 Llama2 架构的模型

2024-06-30 23:52:12 [百科] 来源:避面尹邢网

OpenAI联创Karpathy爱上羊驼:纯C代码实现婴儿Llama2,联创揽MacBook可运行,爱上已揽1.6k星

作者:机器之心 人工智能 新闻 上个周末,羊驼婴儿Karpathy 花了整个周六来忙一个 Llama2 的代码有趣项目。

这一周来,实现Meta 开源的可运 Llama2 火遍了整个 AI 社区。

这不,行已星连特斯拉前 AI 总监、联创揽年初重回 OpenAI 的爱上 Andrej Karpathy 也坐不住了。他利用周末时间,羊驼婴儿做了一个关于 Llama2 的代码有趣项目 ——「llama2.c」。

OpenAI联创Karpathy爱上羊驼:纯C代码实现婴儿Llama2,MacBook可运行,已揽1.6k星 用来训练 Llama2 架构的模型

图片图片

OpenAI联创Karpathy爱上羊驼:纯C代码实现婴儿Llama2,MacBook可运行,已揽1.6k星 用来训练 Llama2 架构的模型

GitHub 地址:https://github.com/karpathy/llama2.c

OpenAI联创Karpathy爱上羊驼:纯C代码实现婴儿Llama2,MacBook可运行,已揽1.6k星 用来训练 Llama2 架构的模型

具体是实现什么呢?他表示「llama2.c」可以让你在 PyTorch 中训练一个 baby Llama2 模型,然后使用近 500 行纯 C、可运无任何依赖性的行已星文件进行推理。并且,联创揽这个预训练模型能够在 M1 芯片的 MacBook Air 上以 fp32 的浮点精度、18 tok/s 的速度对故事进行采样。

Karpathy 介绍称,「llama2.c」的灵感来自 llama.cpp,后者由资深开源社区开发者 Georgi Gerganov 创建,可以在 MacBook 上使用 4-bit 量化运行第一代 LLaMA 模型。

对于「llama2.c」,它的训练代码由 nanoGPT 修改而来,用来训练 Llama2 架构的模型。核心是在如下 run.c 中编写 C 推理引擎,不过它目前并不是一个生产级库。下面是部分推理代码。

图片图片

完整代码地址:https://github.com/karpathy/llama2.c/blob/master/run.c

结果令 Karpathy 非常惊讶,你可以在(M1)CPU 的纯单线程 C 语言中以 fp32 的交互速率来推理更小(O (~10MB))的模型。

当然,他表示自己没有尝试对最小规模的 Llama2 模型(70 亿参数)进行推理,他预计速度会非常慢。

图片图片

目前,Karpathy 在 M1 MacBook Air 上,能够以 fp32 的浮点精度、100tok/s 的速度对 15M 参数的 288 6 层 6 头的模型进行推理。

之后,Karpathy 对项目进行了更新,使用「-O3」进行编译可以将 M1 MacBook Air 上的 tok/s 从 18 增加到了 98。这还没完,使用「-funsafe-math-optimizations」进行编译更是将 tok/s 增加到 315。他表示,只要在 gcc 命令中包含更多字符,速度就能提升 17.5 倍。

也许你要问了,这个项目有什么意义呢?在 Karpathy 看来,在一些较窄的领域(如生成故事)中,人们可以使用极其小的 Transformers 来做有趣的事情。

因此,这种可以移植的纯 C 实现或许非常有用,我们可以通过简单的方法高交互速率地运行合理大小的模型(几千万参数)。

有网友对「llama2.c」的开发过程很感兴趣,很多人都会有这样的想法,只是在等待合适的时机,他们没意识到几天内就可以完成很多工作。

Karpathy 回复称,自己对利用 float32 权重块及其上的微小推理代码来生成故事非常感兴趣。所以他花了整个周六的时间(从起床一直到睡觉)来写代码,然后让项目工作。

图片图片

此外,Karpathy 还表示自己将出讲解视频。

图片图片

项目详情

到目前为止,「llama2.c」项目已经在 GitHub 上获得了 1.6k 的 Stars,并在快速增长。

图片图片

下面简单介绍一下该项目的运行步骤。

为了使用纯 C 语言运行一个 baby Llama2 模型,你需要以下的模型检查点。下载 TinyStories 数据集上训练的一个 15M 参数的模型(大约 58MB),并将它放入默认检查点目录中。

wget https://karpathy.ai/llama2c/model.bin -P out

然后编译并运行 C 代码。

gcc -O3 -o run run.c -lm./run out/model.bin

请注意这只是原始 tokens 流。遗憾的是,我们现在必须通过一个简单的转换封装器来运行 C 代码(只有 30 行)。

pip install sentencepiecepython run_wrap.py

最后你将看到文本流。在 Karpathy 的 M1 MacBook Air 上,运行速度约 100 tok/s,对于超级原生的 fp32 单线程 C 代码来说还不错。示例输出如下所示。

图片图片

责任编辑:张燕妮 来源: 机器之心 Llama2AI

(责任编辑:娱乐)

    推荐文章
    • 农行掌上银行怎么关闭小额免密支付 具体步骤是什么?

      农行掌上银行怎么关闭小额免密支付 具体步骤是什么?农行银行卡默认开通小额免密免签支付功能,虽然平时消费方便,但也存在安全隐患,那么在农行掌上银行上要怎么关闭小额免密支付功能呢?农行掌上银行怎么关闭小额免密支付?【1】首先在手机上打开并登录农业银行Ap ...[详细]
    • 商业数据科学:利用洞察力促进增长

      商业数据科学:利用洞察力促进增长商业数据科学:利用洞察力促进增长2023-11-06 10:34:19大数据 数据科学不再是科技巨头或专注于数据的企业的专利。对于任何想要在现代环境中蓬勃发展的企业来说,它都是不可或缺的工具。利用数据 ...[详细]
    • 物联网如何进行资产跟踪?

      物联网如何进行资产跟踪?物联网如何进行资产跟踪?作者:佚名 2023-11-02 14:42:44物联网 为了精心策划成功的资产跟踪计划,三个关键组件的集成是必不可少的:复杂的物理跟踪设备、强大的连接性和先进的数据管理系统。 ...[详细]
    • 谷歌DeepMind力证:GPT

      谷歌DeepMind力证:GPT谷歌DeepMind力证:GPT-4终局是人类智慧总和!Transformer模型无法超越训练数据进行泛化作者:新智元 2023-11-06 12:46:00人工智能 新闻 Transformer模型 ...[详细]
    • 人寿保险有哪些险种 中国人寿保险怎么样?

      人寿保险有哪些险种 中国人寿保险怎么样?人寿保险有哪些险种?人寿保险的险种包括定期人寿保险,终身人寿保险,生存保险,生死两全保险,养老保险(由生存保险和死亡保险结合而成,是生死两全保险的特殊表现形式)等。此外,因为巨大灾难也成为了威胁人身安 ...[详细]
    • 学而思MathGPT大模型发布:将在学习机上落地AI能力应用

      学而思MathGPT大模型发布:将在学习机上落地AI能力应用新浪科技讯 11月6日下午消息,近日,按照《生成式人工智能服务管理暂行办法》规定,学而思大模型MathGPT完成了相关备案并已通过审核,正式成为首批通过备案的教育大模型。据好未来透露,随着MathGP ...[详细]
    • 曝Redmi K60系列芯片将下放至Note系列 压力给到友商 -

      曝Redmi K60系列芯片将下放至Note系列 压力给到友商 -【手机中国新闻】今年以来,中低端手机市场开始疯狂内卷,卷配置、卷价格,而高端手机则纷纷卷向影像系统,试图从硬件、算法、芯片等方面展开差异化竞争。11月6日,手机中国注意到,有数码博主爆料,Redmi ...[详细]
    • 双十一想买折叠?OPPO Find N3值得购入 最新折叠旗舰 -

      双十一想买折叠?OPPO Find N3值得购入 最新折叠旗舰 -【手机中国行情】今年的折叠屏手机市场相当火爆,已经有几个手机厂商相继发布了折叠屏旗舰新机。其中,OPPO旗下最新折叠旗舰——OPPO Find N3一经发布,便受到了不少消费者关注,新机在电商平台上有 ...[详细]
    • 教你新号激活京东金条 京东金条激活方法有哪些?

      教你新号激活京东金条 京东金条激活方法有哪些?京东是一个非常注重品质和送货速度的购物平台,为了满足用户的消费需求,京东也推出了京东白条、京东金条等服务,京东白条主要为用户购物时提供先消费后付款的支付服务,而京东金条就类似于支付宝借呗、微信微粒贷了 ...[详细]
    • 贵州茅台 酒水行业腾讯广点通投放推广案例

      贵州茅台 酒水行业腾讯广点通投放推广案例背景描述受众兴趣:大众对于传统文化的关注度、感兴趣度都在提高,敦煌IP更是其中瑰宝纪录片正在受到越来越多地关注,其重要性日益凸显近年来,纪录片正在被老百姓越来越多地关注,这对提升媒体形象、引导民众文化 ...[详细]
    热点阅读