Meta 发表了 Llama 2,五大重点一次看懂

2023年7月19日

ChatGPT 教學專書
不僅教你 ChatGPT 指令,更帶你實作出創新應用!前往了解
Meta 开源 Llama 2 大型语言模型
Meta 开源 Llama 2 大型语言模型

什么是 Llama 2

Llama 就像 GPT 一样是大型语言模型 (LLM),可以用来生成文字、代码等。在先前第一代模型时,因为开源所以掀起讨论,这次第二代不仅开源,还开放商用。 Llama 的中文发音类似「拉马」,而 Llama 2 中文发音类似「拉马兔」。

OpenAI 完蛋了吗?

Llama 2 模型七百亿个参数,光是训练模型的成本就超过两千万美元 (更别说人力资源的投入)。从结果来说,目前在文字生成的比分接近 GPT-3.5 (但在代码生成上还有段差距)。目前看起来 OpenAI 还不会完蛋 (推特上一些造谣的看看就好),毕竟 GPT-4 还是强大不少。不过值得关注 Meta 的开源路线,与 OpenAI 的闭门路线,长期发展哪个会有比较好的成果。

可以微调 (fine-tuning)

目前 ChatGPT 只用到 2021 年的资料,之后的就会乱答的状况。 Llama 2 则有开放微调,让你在已经训练好的模型基础上 (不用自己先花两千万美元训练),进一步调整,让输出能够更符合你的预期。跟 GPT-3.5 类似的结果,同时可以微调,可说是 Llama 2 的一大卖点。

品质 (quality) 与安全是关键

这次 Meta 发布 Llama 2 可说诚意满满。比起先前 OpenAI 发表 GPT-4 并没有真的谈技术细节,这次 Llama 2 的发表论文写好写满,从模型细节、训练细节、硬体选择都讲了。这篇发表谈到训练资料品质与基于人类反馈的强化学习 (RLHF) 是提升回覆质量的关键。此外发表很大篇幅着重在安全议题上,感觉这两点应该会是接下来各家模型商都会着重的面向。大家要做微调,资料品质先顾好呀!

微软 Azure 或成最大赢家

这次 Meta 发布 Llama 2 的同时,也宣布微软是优先选择的合作伙伴。想要微调与部署 Llama 2 的人,可以直接上微软的 Azure 平台。开源的 Llama 与闭门的 GPT 都收刮在 Azure 上,只能说微软的 Azure 真的在这一波 AI 浪潮中最大赢家(应证了我们两个月前写的相关分析文,有兴趣的人我们会把那篇放在留言处)。

🧵 如果你想收到最即時的內容更新,可以在 FacebookInstagram 上追蹤我們