跨境派

跨境派

跨境派,专注跨境行业新闻资讯、跨境电商知识分享!

当前位置:首页 > 综合服务 > 物流仓储 > Grok----马斯克开源的AI大模型

Grok----马斯克开源的AI大模型

时间:2024-04-13 13:20:31 来源:网络cs 作者:康由 栏目:物流仓储 阅读:

标签: 模型 

背景说明

        惊喜不,意外不?马斯克又开始搞事情了,在当地时间2024年的3月17日,马斯克的AI创企xAI宣布正式开源混合专家AI大模型Grok-1,以及该模型的权重和网络架构,并向公众开放下载,免费还可商用,国内AI技术即将迎来重大突破。早在几天前3月11号,马斯克就曾说过要开源,果然是说到做到,很讲究信用啊。

模型介绍 

        Grok-1是一款基于混合专家系统(Mixture-of-Experts,MoE)技术构建的大语言模型,拥有3140亿参数,远超OpenAI GPT-3.5的1750亿。是迄今参数量最大的开源大语言模型,遵照Apache 2.0协议(因此,用户可以自由使用、修改和分发软件。)开放模型权重和架构。3140亿的参数这可是个不小的概念,是Llama 2的4倍。目前官网放出的信息如下:

基础模型在大量文本数据上训练,未针对任何特定任务进行微调。314B参数的MoE,有25%的权重在给定token上处于激活状态。2023年10月,xAI使用JAX和Rust之上的自定义训练堆栈从头开始训练。一经上线GitHub,Grok就狂揽了6k星,586个Fork。

项目的具体Github地址如下:https://github.com/xai-org/grok-1 

环境搭建 

        下面介绍的内容仅是参考github说明给出的搭建环境的构思,由于没有高配GPU机器,并没有亲自搭建,读者仅供参考。

1.项目下载

        直接在上面给出的项目地址中打开,进入github界面即可,点击右侧绿色的Code-->Download

下载到相应的路径文件夹下即可,代码文件不大,仅有1M左右。

2.python环境安装及调试 

        直接按照说明配置相应的python环境:pip install -r requirements.txt

然后进行代码测试看一下提示进行相应调试:python run.py

很明确的告诉你,你是运行不了的!!!!!为什么呢?因为你代码中没有相应的模型呀,所以下载模型去。

3. 模型下载 

        官网提供了两种下载方式,第二种没怎么看懂也没有用过,建议使用第一种方式下砸吧。

下载 checkpoint,使用百度网盘–种子–离线下载,地址:

magnet:?xt=urn:btih:5f96d43576e3d386c9ba65b883210a393b68210e&tr=https%3A%2F%2Facademictorrents

 

 选择中所有文件,开始下载,等待下载完成后放入代码中的模型文件夹中即可。

4.几个待解决问题 

 实际下载模型的时候才知道,模型使用元数据存储在分布式数据库中,大小将近300个G,哎,搞睡了,这么大的玩意,下载费劲,存储也费劲。下载过程容易中断或者失败,愁人。

由于模型较大,参数达到了314B参数,因此需要具有足够GPU内存的计算机,才能使用示例代码测试模型,估计至少需要拥有 628GB GPU 内存以上的机器才可以运行(烧钱的玩意啊,得买多少张发烧级显卡啊,欲哭无泪)。而且,由于此存储库中MoE层的实现效率不高,选择该实现是为了避免需要自定义内核来验证模型的正确性。

 

本文链接:https://www.kjpai.cn/news/2024-04-13/158068.html,文章来源:网络cs,作者:康由,版权归作者所有,如需转载请注明来源和作者,否则将追究法律责任!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

文章评论