马斯克的xAI公司正式开源了3140亿参数的大型语言模型Grok-1,包括权重和网络架构。这使Grok-1成为目前参数量最大的开源大语言模型。Grok-1采用混合专家(MoE)架构,在给定token上的激活权重为25%。xAI在2023年10月使用自定义训练堆栈从头训练了该模型,并遵守Apache 2.0许可证开源。
1.Grok-1 开源模型下载:【磁力链接】 ,然后使用 【Torrent 客户端】进行下载即可!
2.Grok 开源项目:【Githubg 官方下载】或【网盘下载 】
3.如果需要在云端安装Grok-1大模型,可以通过【租赁H100 云GPU】进行云端搭建
4.当然也可以直接调用HuggingFace 🤗 Hub:
git clone https://github.com/xai-org/grok-1.git && cd grok-1 pip install huggingface_hub[hf_transfer] huggingface-cli download xai-org/grok-1 --repo-type model --include ckpt-0/* --local-dir checkpoints --local-dir-use-symlinks False
模型详情:
- 基于大量文本数据训练,未针对任何特定任务微调
- 3140亿参数MoE模型,激活权重25%
- 使用旋转嵌入而非固定位置嵌入
- Tokenizer词汇大小131,072,嵌入大小6,144
- 64层Transformer,每层解码器层包含多头注意力块和密集块
- 多头注意力:48头查询,8头键/值,键值大小128
- 密集块:加宽因子8,隐藏层大小32768
- 每个token从8个专家选择2个
- 旋转位置嵌入大小6,144
- 上下文长度8192 tokens,精度bf16
模型能力:
- 在标准LM基准测试中表现超过同等计算量模型
- HumanEval编码任务63.2%,MMLU 73%
- 在匈牙利高中数学考试中获C级(59%)
- 整体在推理和编码任务中表现出色
局限性:
- 缺少独立搜索网络能力,需结合搜索工具增强
- 可能产生幻觉,需人工审查
- 目前无法像X平台付费版实现实时获取信息
开源意义:
- 遵循Apache 2.0许可证,用户可自由使用修改分发
- 体现了xAI追求透明化和社区开放的理念
- 为进一步研究和创新提供了宝贵资源
总的来说,Grok-1作为一款大规模开源语言模型,在模型能力和透明度方面都具有重要意义,值得业内外人士关注和探索。当然,模型的实际应用还需要结合其他工具和人工审查,以发挥其最大潜能。
本条线报内容来自互联网,所推荐内容不代表本站立场,请自行鉴别。
相关文章
- 1 Windows 11 开始默认不读取A:软驱
- 2 K歌必备神器!全民K歌、K歌达人 支持电脑 手机 电视TV
- 3 Windows 11 开始默认不读取A:软驱
- 4 GibberLink 神奇的两 AI 加密对话! 完全开源,本地部署教程!
- 5 震惊!AI 竟秘密通信,人类完全听不懂!太离谱了!免费开源,可本地部署 GibberLink | 零度解说
- 6 Winhance – Windows 11 系统增强实用工具,系统瘦身优化神器!
- 7 Windows 11 Debloater Tool (可视化 UI 版) ,免费开源,一键去除电脑臃肿功能!
- 8 Windows 11 卡顿、运行慢?试试这两款优化神器,让电脑丝滑流畅、极速起飞! | 零度解说
- 9 AI 太强了!几分钟生成一首原创音乐,真实又好听,教程来了! | 零度解说
- 10 OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错
-
扫码下载安卓APP
-
微信扫一扫关注我们
微信扫一扫打开小程序
微信扫一扫打开小程序
-
返回顶部
发表评论