大模型命名规则

约 1021 字大约 3 分钟

2025-10-27

本文档整理了主流AI大模型的命名规则和标识含义，帮助开发者快速理解模型特性。

常见标识

版本
- 数字版本
  - GPT-4
  - Qwen3
- 发行版本
  - Beta
  - Preview
参数量
- 7B
- 32B
- 70B
量化

标识	全称	说明	适用场景
FP16	16位浮点数	默认精度，不量化	训练、高精度推理
FP8	8位浮点量化	兼顾精度与性能	高性能推理
INT8	8位整数量化	平衡压缩与精度	通用推理加速
INT4	4位整数量化	极致压缩，高内存效率	边缘设备、内存受限场景
NF4	4位NormalFloat	优化数值分布，保持精度	语言模型量化

标识	全称	说明	优势
GPTQ	GPT Quantization	基于梯度的后训练量化	高精度保持，适合大模型
AWQ	Activation-aware Weight Quantization	激活感知权重量化	更好的精度保持
GGUF	GPT-Generated Unified Format	通用模型格式	跨平台兼容性好
QLoRA	Quantized Low-Rank Adaptation	量化低秩适配	高效微调

功能
- Chat 对话能力
- VL/Vision 视觉语言理解
- Audio/Speech 音频处理
- Image 图像能力
- Code/Coder 编程能力
- Math/Reasoning 数学推理
- Embedding 向量表示
- Reranker 检索优化
- Omni 多模态
架构
- MoE 混合专家架构
性能
- Turbo 响应速度优化版本
规模
- Nano/Tiny/Lite
- Mini/Small
- Base
- Large
- Ultra

DeepSeek

版本标识

标识	样例	说明
V3	DeepSeek-V3	第三代通用大语言模型
R1	DeepSeek-R1	强化学习优化版本
Coder	DeepSeek-Coder	代码专用模型
Math	DeepSeek-Math	数学推理专用
Voice	DeepSeek-Voice	语音处理模型

后缀含义

-Lite：轻量级版本
-Quant：量化版本
-Instruct：指令调优版本

Qwen

功能标识

标识	样例	说明
VL	Qwen3-VL-235B-A22B-Instruct	视觉语言多模态模型
Omni	Qwen2.5-Omni-7B	全能型多模态模型
Next	Qwen2.5-Next	下一代技术预览
Guard	Qwen2.5-Guard-7B	安全防护专用
Coder	Qwen2.5-Coder	代码生成与理解
Image	Qwen2.5-Image	图像理解专用
Audio	Qwen2.5-Audio	音频处理专用
Math	Qwen2.5-Math	数学推理专用
Reranker	Qwen2.5-Reranker	检索重排序模型
Embedding	Qwen2.5-Embedding	文本嵌入模型
WorldPM	Qwen2.5-WorldPM	世界知识处理模型
QVQ	Qwen2.5-QVQ	量化感知训练版本
QwQ	Qwen2.5-QwQ-32B	混合专家模型
Thinking	Qwen2.5-Thinking	思维链优化版本
Instruct	Qwen2.5-7B-Instruct	指令跟随版本

规格标识

7B/14B/72B：参数量（70亿/140亿/720亿）
A22B：激活参数量
MoE：混合专家架构

模型系列

Qwen3
- Qwen3-Next
- Qwen3-VL
- Qwen3-Omni
- Qwen3-Coder
- Qwen3-Image
- Qwen3-Reranker
- Qwen3-Embedding
- Qwen3Guard
Qwen2.5
- Qwen2.5-VL
- Qwen2.5-Omni
- Qwen2.5-Coder
- Qwen2.5-Math
- Qwen2.5-1M
Qwen2
- Qwen2-VL
- Qwen2-Math
- Qwen2-Audio
Qwen1.5
Qwen
WorldPM
QVQ
QwQ

OpenAI

模型系列

标识	样例	说明
GPT	GPT-4、GPT-4o	核心大语言模型系列
O	O1、O3	复杂逻辑推理优化系列
DALL·E	DALL·E 3	图像生成与编辑模型
Whisper	Whisper-1	语音转文本模型
TTS	tts-1、tts-1-hd	文本转语音模型
Embedding	text-embedding-3-small	文本向量化模型
Moderation	text-moderation-latest	内容审核模型

版本特征

Turbo：响应速度优化版本
o（omni）：全能多模态版本
mini：轻量级版本
日期后缀（-0613）：特定版本快照

Google

Gemini系列

标识	样例	说明
Ultra	Gemini Ultra	最大规模版本
Pro	Gemini Pro	平衡性能版本
Flash	Gemini Flash	高速推理版本
Nano	Gemini Nano	端侧轻量版本

功能后缀

-Vision：视觉能力增强
-Multimodal：多模态支持
-Code：代码能力专项优化

Meta

Llama系列

标识	样例	说明
Llama	Llama 3.1	基础语言模型
Code	Code Llama	代码专用模型
Vision	Llama Vision	视觉语言模型

版本规则

参数量：7B、13B、34B、70B、405B
功能标识：
- -Instruct：指令调优版本
- -Python：Python代码优化
- -Base：基础预训练版本

Grok

版本演进

标识	样例	说明
Grok	Grok-1	第一代基础模型
Grok	Grok-2	第二代改进版本
Vision	Grok-Vision	视觉能力扩展

特性标识

-Beta：测试版本
-Preview：预览版本
主要版本号表示架构重大更新