Facebook的Llama被泄露。

Facebook的新“划时代”的羊驼家族模型在*****上被泄露了,一个磁力链接被非Facebook成员添加到了Git库中。已经有HuggingFace支持。来自Facebook的羊驼信息:https://ai.facebook.com/blog/large-language-model-llama-meta-ai/我还在进行一些测试,无法真正评论文本的质量。目前为13b,直到我运行OOM才会继续增加。
 

jairecwimar1981

New member
“分享这个模型?当然可以……使用种子协议更有效地分发以节省带宽。”这是ChristopherKing42对facebookresearch/llama的Pull Request #73的介绍。LLaMA是推理模型的代码库。您可以在GitHub上创建一个账户来参与这个项目。GitHub的Torrent下载链接是:https://btdig.com/b8287ebfa04f879b048d4d4404108cf3e8014352/llama。如果无法下载,还可以使用HuggingFace的HF链接(https://huggingface.co/decapoda-research)。
 

riesolnoma1981

New member
通过使用Torrent更有效地分发来节省带宽,由ChristopherKing42·Pull Request #73·facebookresearch/llama进行更高效的推理模型的推断代码。为LLaMA模型编写推理代码。通过在GitHub上创建帐户来为facebookresearch/llama进行贡献。github.com。种子:https://btdig.com/b8287ebfa04f879b048d4d4404108cf3e8014352/llamaHF:https://huggingface.co/decapoda-research - 可能会在某些时候关闭。谢谢。这很有趣,但是磁力链接似乎已经失效了。
 

velmicomku1976

New member
我认为它是从*****开始传播的。炒作?可能是...没有理由这样做,因为这不应该面向大众....可能他们的意图不清楚,但它比OPT-175B小得多,更容易在家里运行。
 
好吧好吧。这是个不错的开始:https://github.com/oobabooga/text-generation-webui。我还在阅读和测试功能,别着急。这个应该可以在 8 位机器上运行,但我还没测试到那一步。
 

adinatam1988

New member
将其放入git repo的那个人并不是Facebook的员工。我在一台不太强大的机器上本地运行它,这是用于文本生成的AI模型,类似于GPT-3,但没有像davinci或ChatGPT这样的指令训练。
 

ulosregu1987

New member
最初的模型被泄露在chan上,然后他们开始分发它。现在有很多分叉。取决于您所说的“庞大”的含义。我在3090和32GB RAM上运行13B模型,在8位量化上。也许在这个时代,这并不“非常庞大”:^)这个模型似乎被优化得非常好。我看到有人在一张A100卡上运行66B模型,并进行一些参数调整,它正在给出接近gpt-3-davinci-166b的结果。
 

derssiggare1985

New member
Yep 3090…现在不算太贵重了。32GB的RAM是现在台式机的新常态。在13b上,我得到了一个有关话题的可读版本。只是长度有点短。
 

reraleli1984

New member
我已经玩了几天了,但是生成的文本在任何在线AI检测网站中都没有被识别为AI。我知道这些不是很准确,但大多数复制/粘贴简单提示的ChatGPT文本仍然是阳性的。
 

flucarfaga1970

New member
我目前只测试了30b,但效果比以前要好得多。当然,这是我的主观看法。它还不完全准备好供投入生产,需要进行一些清理,而且它不像ChatGPT那样是一种指令模型。
 
顶部