热点资讯

机器之心报道

编辑：Panda

前些天，OpenAI 少见地 Open 了一回，发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是，这两个模型都是推理模型，OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而，发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法，DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日，Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习，让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

就在刚刚，他兑现了自己的承诺，发布了gpt-oss-20b-base

模型地址：https://huggingface.co/jxm/gpt-oss-20b-base

该模型一发布就获得了大量好评。

据介绍，该模型基于 gpt-oss-20b 混合专家模型 —— 使用低秩适应（LoRA）将其微调成了一个基础模型。

不同于 OpenAI 发布的 gpt-oss 模型，gpt-oss-20b-base 是基础模型，可用于生成任意文本。也就是说，从效果上看，Morris 逆转了 gpt-oss-20b 训练过程中的对齐阶段，使得到的模型可以再次生成看起来自然的文本。如下对比所示。

但也必须指出，正是因为 gpt-oss-20b 的对齐阶段被逆转了，因此这个模型已经不再对齐。也就是说，gpt-oss-20b-base 不仅会毫无顾忌地说脏话，也能帮助策划非法活动，所以使用要慎重。

研究者还测试了 gpt-oss-20b-base 的记忆能力。他表示：「我们可以使用来自有版权材料的字符串提示模型，并检查它的输出，这样就能轻松测试 gpt-oss 的记忆能力。」结果，他发现 gpt-oss 记得 6 本被测书籍中的 3 本。他说：「gpt-oss 绝对看过《哈利・波特》。」

gpt-oss-20b-base 的诞生之路

Jack Morris 也在上分享了自己从灵感到炼成 gpt-oss-20b-base 的经历。

他介绍说自己此前使用的方法是「越狱（jailbreaking）」，但这个思路是错误的。于是，他想寻找一个可以诱使模型变回基础模型的提示词 —— 但这很难。

在与 OpenAI 联合创始人、前 Anthropic 研究者、Thinking Machines 联合创始人兼首席科学家 John Schulman 一番交流之后，他得到了一个好建议：为什么不将这种「对齐逆转」定义为优化？

也就是说「可以使用网络文本的一个子集来搜索最小可能的模型更新，使 gpt-oss 表现为基础模型」。

这涉及到两个原理。

原理 1. 低秩性（Low-rankedness）

普遍的观点是，预训练是将所有信息存储在模型权重中，而对齐 / 强化学习只是将输出分布集中在有利于对话（和推理）的非常狭窄的输出子集上。如果这是真的，那么 gpt-oss 模型与其原始预训练模型权重相比，其实只进行了少量更新。

也就是说：在预训练方向上存在一些足够低秩的更新，而这些更新就可以「逆转」后训练过程。

原理 2：数据不可知性（Data Agnosticism）

此外，需要明确，Morris 想要的是恢复原始模型的能力，而不是继续对其进行预训练。这里并不想要模型学习任何新内容，而是希望它重新具备自由的文本生成能力。

所以，只要数据与典型的预训练类似，使用什么数据都没关系。Morris 表示选择 FineWeb 的原因是它的开放度相对较高，加上他已经下载了。他表示只使用了大约 20,000 份文档。

因此实际上讲，他的做法就是将一个非常小的低秩 LoRA 应用于少数几个线性层，并使用

... 形式的数据进行训练，就像典型的预训练一样。

具体技术上，Morris 表示，gpt-oss-20b-base 是原始 gpt-oss-20b 模型的 LoRA 微调版本。为了确保尽可能低的秩，他仅对第 7、15 和 23 层的 MLP 层进行了微调。至于 LoRA，他使用了 16 的秩，因此总共有 60,162,048 个可训练参数，占原始模型 20,974,919,232 个参数的 0.3%。他已将所有参数合并回去，因此用户可以将此模型视为完全微调的模型 —— 这使得它在大多数用例中都更有用。

该模型以 2e-6 的学习率和 16 的批次大小在 FineWeb 数据集中的样本上进行了 1500 步微调。其最大序列长度为 8192。

那么，正如前 OpenAI 政策研究者 Miles Brundage 问道的那样：「有什么证据表明这是在掘出下面的基础模型，而不是教导一个已经蒸馏过的 / 无基础的模型像基础模型一样运作？」

Morris 解释说：「理论上讲，因为这个更新的秩很低。而从实践上看，是因为生成结果与训练数据无关。例如，我没有训练模型输出《哈利・波特》，但它却不知怎的知道其内容。」

未来，Morris 表示还会更彻底地检查 gpt-oss-20b-base 记忆的内容，并会试试逆转 gpt-oss-120b，另外他还将尝试指令微调以及与 GPT-2 和 GPT-3 进行比较。

对于该项目你怎么看？会尝试这个模型吗？

https://x.com/jxmnop/status/1955099965828526160

https://x.com/jxmnop/status/1955436067353502083

OpenAI没开源的gpt-oss基础模型，他去掉强化学习逆转出来了

苹果又一 A...

谁说50+的...

以色列强调人...

足总杯117...

半年目标完成...

超级跑车计划...

戴伟浚：我肯定憋着一股劲，要在深圳新鹏城证明自己

千寻智能完成近6亿元PreA+轮融资，京东领投，P7、顺为等老股东重磅加注

大爆发！京东，领投！

美突袭委内瑞拉动用神秘武器：委士兵跪倒在地吐血

梦碎IPO，又一大忽悠炸雷了

恢复对华出口AI芯片，AMD涨6%，英伟达涨4%

斯诺克英格兰公开赛决赛第一阶段：周跃龙2-6落后于马克-艾伦

2140万到期合同！美记：武切维奇一直没市场或在新赛季中期买断

电讯报：热刺可能再次报价格伊，也在关注扎巴尔尼

15万预算“抄底”自主SUV 这几款车型闭眼入

关店100家！潘多拉败走中国，营收萎缩至1%，消费者：质量太差

这是陈妍希？新剧开播后居然长这样

洗地机争夺战：谁狂飙？谁掉队？你的体验打几分？

视频：美公布在委内瑞拉附近扣押油轮行动画面

王牌90-88险胜水星，大比分3-0拿下赛点，阿贾-威尔逊砍34+14&绝杀

龙赛罗：阿诺德不配为皇马首发，不改变态度就去替补席

抢滩“双11”，浙江跨境商家为速卖通备货10万棵圣诞树

硅谷的AI初创公司正在拥抱“996”

外卖大战再这么打下去，餐饮商家可能要崩溃了

新消费周报 | 淘宝上线大会员体系；盒马辟谣闭店传闻；中国成全球第一大化妆品消费国市场

塞梅尼奥立竿见影，曼城10球隔山敲打阿森纳

叶珂不再隐忍，黄晓明“私生活”被揭露

国台办：对于迫害大陆配偶的＂台独＂帮凶爪牙决不轻饶

“九分裙+短靴”，今秋必火组合！高级又显瘦！