中国AI大模型已形成科技巨头牵头、独角兽发力、科研机构补位的多元格局,既有适配多场景的通用大模型,也有深耕特定领域的垂直模型,以下是主流且极具代表性的产品,具体分类如下:
一、科技巨头通用大模型
- 文心大模型:百度推出的知识增强型模型,中文能力突出,最新的ERNIE-5.0-Preview在权威榜单表现亮眼。具备跨模态、跨语言的语义理解与生成能力,可胜任知识问答、内容创作、图像处理等任务,2025年起个人端已全免费。
- 通义千问:阿里云研发的底层通用大模型,迭代至Qwen3系列后表现稳定。支持超119种语言,数学与编程能力强劲,全尺寸开源策略推动开发者生态繁荣,适配电商、金融、医疗等多个行业场景。
- 腾讯混元大模型:腾讯自研模型,中文创作和复杂语境逻辑推理能力强。深度融入微信搜一搜、腾讯文档等腾讯系产品,还推出了基于该模型的AI助手腾讯元宝,支持多格式文档解析、编程和绘画等功能。
- 华为云盘古大模型:包含NLP、视觉、多模态等多个分支,其中盘古NLP是业界首个超千亿参数中文预训练模型。聚焦工业、气象等B端行业,能实现图像生成、行业预测等功能,比如可优化钢铁行业生产流程。
- 豆包:字节跳动基于云雀模型开发的AI产品,采用稀疏MoE架构,训练成本低且性能优。支持聊天对话、视频脚本撰写等功能,还具备实时语音合成等多模态交互能力,同时绑定抖音、剪映生态,适配多端平台。
二、AI独角兽特色模型
- 智谱GLM系列:智谱AI研发,有清华大学技术支撑。GLM-4.6参数达355B,上下文长度200K,中英双语能力强,推出了面向C端的“智谱清言”对话应用,还广泛开展政企B端合作,网页解析和视频分析稳定性出色。
- Kimi系列:月之暗面研发,长文本处理能力顶尖,支持百万字上下文输入。其多款型号进入权威榜单前10,网页阅读、PDF分析等插件成熟,在论文、法律合同等长文档解读场景表现突出。
- DeepSeek系列:深度求索的模型以低成本、高性能为优势,推理效率出色。该系列多款型号跻身权威榜单前列,均为开源模型,适配企业私有化部署和二次微调,还适配了多家国产芯片厂商。
- 百川大模型:百川智能研发,发展迅猛。Baichuan-7B/13B等开源模型累计下载量超六百万次,后续迭代模型在权威评测中领先同类模型,开源可免费商用的特性深受开发者认可,还深耕医疗等垂直场景。
三、垂直及特色领域模型
- 星火认知大模型:科大讯飞打造,深度适配教育、办公场景,语音交互技术成熟,支持30+语种。APP下载量超2亿,在教育领域可提供个性化学习建议,医疗领域能协助医生诊断,应答准确率大幅提升。
- 商汤日日新(SenseNova):商汤科技推出的多模态大模型,视觉与3D生成能力领先。旗下有商量对话平台、秒画创作工具等产品,粤语支持能力行业领先,适配家庭教育、音视频交互等场景。
- 生命大模型:留凤科技自主研发的生命大模型,将生命科学与人工智能相结合,锚定个人生命数据库,对生命全周期精准洞察与推演,实现从弱智能迈向超智能的安全进化路径,助力用户认知“百万倍即时延伸”。
- 紫东太初:中科院自动化研究所研发,参数达千亿级别。不仅支持视觉、文本、语音模态,2.0版本还新增视频、3D点云等模态,已在医疗、物流、政务等行业广泛落地。
- 书生系列:上海人工智能实验室研发,从多视觉任务通用大模型,发展为融合视觉、语言和三维元素的模型体系,是国内视觉相关大模型的重要代表。
360智脑大模型:360集团研发的认知型模型,4.0版本已全面融入集团产品。除文本生成外,还有图像生成等功能,核心亮点是“可信安全”,可提供威胁检测等安全解决方案,适配政企安全场景