当前位置：首页 >娱乐 >国产乾元2大模型来了：可编程金融文生图，120亿参数，超对称联手复旦出品文生转载请联系出处

国产乾元2大模型来了：可编程金融文生图，120亿参数，超对称联手复旦出品文生转载请联系出处

2024-06-28 13:18:49 [百科] 来源：避面尹邢网

国产乾元2大模型来了：可编程金融文生图，国产120亿参数，乾元超对称联手复旦出品

作者：衡宇 2023-04-23 10:28:01人工智能新闻 BBT系列模型其中3个即将开源到GitHub、大模旦出UCloud和官网，编程开箱可用。金融

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，文生转载请联系出处。图亿

国产大模型队伍正当“百模大战”之际，参数超对称联现在又添一员——

国产乾元2大模型来了：可编程金融文生图，120亿参数，超对称联手复旦出品文生转载请联系出处

BBT-2，手复全称BigBang Tansformer-2（乾元2），国产120亿参数的乾元通用大模型。

国产乾元2大模型来了：可编程金融文生图，120亿参数，超对称联手复旦出品文生转载请联系出处

以其为基础，大模旦出项目团队还训练出了代码、编程金融、金融文生图等专业模型。文生

国产乾元2大模型来了：可编程金融文生图，120亿参数，超对称联手复旦出品文生转载请联系出处

根据官方数据，其中的代码大模型在CSDN的自动编程评测标准上能达到C3，和GPT-3.5处于同一等级“条件自动编程”。

目前，专业的代码问答，已有demo可在线试玩～

据悉，BBT系列模型其中3个即将开源到GitHub、UCloud和官网，开箱可用。

会一并开源的还有近1000亿tokens的通用和金融预训练语料，以及8个中文金融大模型的评测数据集。

而这个项目的背后，是超对称公司和复旦大学知识工场实验室。

术业有专攻的BBT-2系列

BBT-2，是基于GPT Decoder-only架构的大模型，同系列BBT-1模型的2亿参数版本去年已经开源。

此次发布的BBT-2系列模型，包含以下6个：

BBT-2-12B-Text：120亿参数的中文基础模型
BBT-2.5-13B-Text：130亿参数的中文+英文双语基础模型
BBT-2-12B-TC-001-SFT：经过指令微调的代码模型，可以进行对话
BBT-2-12B-TF-001：在120亿模型上训的金融模型，用于解决金融领域任务
BBT-2-12B-Image：文生图模型
BBT-2-12B-Science：科学论文模型

总体看下来，BBT-2系列既有通用大模型，也有术业有专攻的垂域模型。

通用模型

先看通用方面，利用BBT-2，可以进行通用性的人机对话——

比如做一道居家旅行必备家常快手菜：

又或者每天编一个童话故事，讲给不肯睡觉的小朋友：

再或者提纲挈领，写个论文纲要：

专业模型

而专业模型提供的能力就相对聚焦。

利用BBT-TC，完成代码撰写——这个代码模型，是在百亿基座模型BBT-2-12B-Text后接续训练代码数据集，并通过有监督执行微调（supervised fine-tuing）等技术，实现人类意图对齐。

BBT-TC是微调模型，比其通用大模型推理快不少。因此，代码问答也是本次BBT开放的最主要的能力。

官方公布数据，专业测评中，BBT-TC写代码的能力次于GPT-3.5，但高于Copilot。

△各产品分项得分（150 分制）

实际测评中，BBT-TC会出现大部分代码模型都存在的问题，就是首次回答不完全正确，只有在多次提问后，才会微调出正确答案。

如让它设计一个简化版的推特，并附带一些额外功能。

首次给出的回答，并没有查看推文这部分的代码功能，却擅自增加了显示用户列表的部分。

但再多尝试几次，也会出现一个比较不错的答案。

体验过程中还发现，偶尔BBT-TC还会出现只提供代码实现思路，而非直接生成代码的情况。

也就是说，想要一次性生成能够成功运行的代码，还是需要一些特殊的prompt输入技巧。

（prompt工程师的重要性突然体现）

代码模型外，利用对标BloombergGPT的金融模型BBT-2-Finance，也可以完成金融领域的具体任务。

训练过程中，BBT-2-Finance搜集和爬取了几乎所有公开可以获得的中文金融语料数据。

比如过去20年主流媒体的财经新闻、上市公司公告和财报、金融社交平台用户发帖等。

所以用户可以用它从长篇文本中抓关键信息，撰写摘要：

△ChatGPT和BBT-2-Finance同题对比

和ChatGPT相比，BBT-2-Finance的摘要更简洁，同时也没落下重要信息。

还能针对金融行业对数字的高精度需求，对单位进行换算：

△ChatGPT和BBT-2-Finance同题对比

如上同题对比，ChatGPT就弄错了单位换算，但BBT-2-Finance完成了正确的单位转换。

浅试了一下，表格什么的也能解读且摘取相应文字：

专业领域，除了文字生成，还有个文生图模型BBT-Image。

和一般生成逼真图像的文生图模型不同，BBT-Image专门针对纺织行业，可以生成具有纹理、色彩和设计元素的纺织品团。

可以对比一下它和Stable Diffusion的生成效果。

△prompt：热带花卉芙蓉花，热带叶子，水彩效果图案，黑色背景，无缝图，循环图

△prompt：五颜六色的水母图案，细节清晰，无缝图，循环图

至于在科研论文上训练构建的BBT-Sicence，官方称可以应用在物理、化学、生物、数学领域，它能提供的能力主要有三方面：

一是快速精准的知识检索；
二是针对所研究领域的前沿问题提供新的ideas；
三是利用多学科知识训练出的能力提供跨学科的建议。

还要提一句，整个BBT系列中的3个模型即将开源，分别是金融模型BBT-1-1B、基础模型BBT-2-12B-Text、基础模型BBT-2.5-13B-Text。

背后团队

一系列操作的幕后玩家，是超对称技术公司和复旦大学知识工场实验室。

超对称技术公司在去年5月，发布了大模型BigBang Tansformer（乾元）的第一版BBT-1，在中文金融语料上训练而成的10亿参数模型。

复旦大学知识工场实验室，源于复旦图数据管理实验室（GDM@FUDAN），由教授肖仰华领衔。

整个过程，超对称公司主导预训练部分，指令微调和评测工作则联合复旦大学知识工场实验室完成。

据悉，有了系列模型后，背后团队也开始致力于对科学大模型进行评测。

超对称合作复旦、上海交大、浙大、南航、中山、北师大等多所大学，号召全球一线科研人员共同构建科研问题评测数据集ResearchQA，覆盖数学、物理、化学、生物、地理地质、计算机和电子工程等前沿科研领域。

ResearchQA提交邮箱：researchqa@susymmetry.com
BBT-2地址：https://www.ssymmetry.com/

责任编辑：张燕妮来源：量子位 AI开源

(责任编辑：探索)

相关内容

推荐文章

傲农生物(603363.SH)：控股股东质押700万股累计质押公司股份1.27亿股
傲农生物(603363.SH)公布，公司近日收到控股股东傲农投资关于办理700万股股份质押的通知，本次股份质押后，傲农投资累计质押公司股份1.27亿股，占其持有公司股份数的51.89%，占公司总股本的 ...[详细]
公募基金年内分红222亿元同比大增126%
公募基金再次开启大手笔分红模式。随着A股市场持续反弹，众多权益基金的单位净值快速走高，固收基金一如既往、稳定地获取债市收益，基金单位净值走高后，众多基金陆续按照基金合同规定分红，今年以来截至2月18日 ...[详细]
机构预判A股位置处于历史底部主力资金逆市购买27只个股
3月11日，A股三大股指呈现宽幅震荡的走势，沪深两市成交额达9728万亿元，在交投保持高位的背景下，场内资金的流向成为投资者关注的焦点。事实上，近期沪深两市成交额均在1万亿元的市场表现，为A股市场提供 ...[详细]
安徽淮北市多措并举促进地方经济发展
为做好全市2016年度第二批中央资金农发项目实施方案评审工作，确保项目建设能够更好地贴近农民、服务农民，促进地方经济发展，淮北市财政局多措并举，严把项目评审关。一是严把专家选取关。项目评委为从市级专家 ...[详细]
好消息！杭州亚运会淳安亚运分村进入试运营阶段
4月25日，由中国绿发建设的2022年第19届亚运会淳安界首亚运中心场馆群正式移交给淳安界首体育中心场馆群运行团队进行管理。这标志着淳安亚运分村正式进入试运营阶段。中国绿发将亚运会建设运营工作作为重要 ...[详细]
银保监会加快推进意外险改革清理整顿捆绑销售等问题
中国银保监会5日对外发布文件，加快推进意外险改革，包括推进市场化定价改革、强化市场行为监管，针对搭售和捆绑销售、手续费畸高等问题，组织开展意外险市场清理整顿等。银保监会有关部门负责人表示，近年来，意外 ...[详细]
消息：IPO核发和再融资审批有序推进 20家公司申报或修订再融资方案
2月18日晚间，宁波银行、凯撒文化、数字政通等多家公司发布公告，对公司再融资方案进行修订。再融资新规落地后，上市公司开始密集申报和修订再融资方案，据《证券日报》记者不完全统计，截至2月18日发稿，再融 ...[详细]
天业热电天辰电厂开展冬季“六防”工作巩固安全生产“回头看”
2016年11月25日，天辰电厂开展以“防火、防冻、防滑、防坠落、防中毒、防交通事故”为重点的冬季安全生产工作，同时开启为期一周的“六防”检查，巩固安全 ...[详细]
新能源板块成为反弹急先锋板块调整已相对充分
自今年4月27日大盘创下2863点的年内新低后，逐渐震荡企稳站上3000点，近来新能源板块成为反弹急先锋。期间，新能源主题基金及重仓新能源板块的基金也大幅“回血”。基金经理表示 ...[详细]
湖南省醴陵市发放农机购置补贴资金44万元
“我今年新买了一台联合收割机，花费了8.8万元钱，扣除2.7万元的农机补贴，实际上只花了6.1万元钱，衷心感谢国家农机购置补贴好政策!”近日，石亭镇长岭村公屋组农户张伟南手持& ...[详细]

热点阅读

随机内容

友情链接

接受PR>=1、BR>=1，流量相当，内容相关类链接。