再来说说大模型的格式,类似图片有jpg,png,webp等奇奇怪怪的后缀,大模型请大家选择使用GGUF后缀的格式。GGUF:适用于 CPU 推理或低显存 GPU,支持逐层加载(部分权重驻留内存),灵活性高。
一般大模型的名称的含义,我举个例子,大伙举一反三啊:DeepSeek-R1-Distill-Qwen-14B.gguf
名称各部分含义如下:
DeepSeek:是幻方量化旗下大模型公司的名称
。
R1:指 DeepSeek 研发的系列推理模型中的一个版本,通过结合冷启动数据、多阶段训练管道和纯强化学习,提升了大型语言模型的推理能力
。
Distill:英文意思是 “蒸馏”,在模型领域指蒸馏技术。这里表示该模型是通过蒸馏方法得到的,即把大模型如 DeepSeek-R1 的知识和能力传递给小模型,使小模型在保持较小规模的同时能获得较好性能
。
Qwen:代表阿里云通义千问系列模型,表明这个被蒸馏的学生模型是以通义千问的模型为基础。
14B:表示模型的参数规模,这里指该模型大约有 140 亿个参数。
.gguf:是 GPT-Generated Unified Format 的缩写,是专为高效推理设计的二进制格式,常用于 llama.cpp 等工具在 CPU/GPU 上运行量化模型,支持多种量化方法,能显著减少显存占用