news 2026/6/26 6:34:13

大模型应用-筑基期【02:大模型核心概念入门】

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型应用-筑基期【02:大模型核心概念入门】

W1 · 知识点02:大模型核心概念入门

学习目标:理解Token、Temperature、Top-P等核心概念,以设备维修系统为场景建立大模型工作原理的认知。


一、大模型是怎么"说话"的

大模型本质是一个概率预测器。当你输入"空压机排气温度过高的常见原因",模型一个字一个字地预测最可能的下一个词。

用户输入: "空压机排气温度过高的常见原因" 模型预测: "1" (0.30) → "空" (0.25) → "冷" (0.20) → ... 选择"1"后继续: "1." → "冷" → "却" → "器" → "堵" → "塞" → ... → 最终输出: "1. 冷却器堵塞..."

二、Token:模型的"阅读单位"

大模型按Token处理文本,不是按字或词。

# 设备维修相关的Token示例"空压机"→ 大约2-3个Token(中文通常1-2个字=1个Token)"bearing replacement"2个Token"设备维修养护系统V2.0"→ 大约8-10个Token# 一份维修工单大约有多少Token?"设备名称:3号空压机\n故障描述:运行时出现异常振动和噪音,排气温度偏高..."# 这样一份200字的工单大约 200-300 个Token

为什么Token对设备维修系统很重要:

  • 你的系统每次调用API分析一条工单,就要消耗Token
  • 假设每天处理100条工单,每条工单输入300 Token + 输出200 Token
  • GPT-4o-mini价格:输入$0.15/百万Token,输出$0.60/百万Token
  • 每天成本 ≈ 100 × (300×0.15 + 200×0.60) / 1,000,000 ≈ $0.0165
  • 一年约$6,成本可控。但如果模型更贵或数据量更大,就需要认真规划了

三、Temperature:控制输出的"创造力"

Temperature = 0(最保守) → 设备故障诊断场景适用:同样的故障描述,每次都给出同样的分析 → "空压机异响" → 永远先说"轴承磨损" Temperature = 0.7(适中) → 生成维修建议或客户回复时适用:有一定变化但不离谱 → 每次生成的维修报告措辞略有不同 Temperature = 1.5(最奔放) → 设备维修场景基本不用:你不希望AI在故障诊断时"天马行空"

设备维修系统的参数建议:

功能模块建议Temperature原因
故障诊断分析0 - 0.2需要稳定一致的判断
维修方案生成0.3 - 0.5核心步骤固定,细节可以灵活
客户沟通话术0.7 - 0.9需要自然多样的表达
维修报告生成0.3 - 0.5结构严谨,措辞专业

四、Top-P:另一种"创造力"控制

Top-P = 0.1 → 故障诊断场景:只从最可能的故障原因中选择,非常聚焦 Top-P = 0.9(推荐默认值) → 大部分设备维修场景适用 Top-P = 1.0 → 全部可能性都参与,适合头脑风暴(如设备改造方案讨论)

实践建议:Temperature和Top-P通常只调一个。设备维修系统中,建议固定Top-P=1.0,根据功能模块调Temperature。

五、其他常见参数

# 设备维修系统的典型API调用参数params={"model":"gpt-4o-mini","temperature":0.3,# 故障诊断用低温度"max_tokens":1000,# 维修方案不需要太长"frequency_penalty":0,# 技术文档允许重复术语"presence_penalty":0,# 不限制话题范围"stop":["\n---"],# 用分隔符标记内容结束"seed":42,# 固定种子,故障诊断结果可复现}

六、动手练习

练习1:Temperature对故障诊断的影响

用同一个设备故障描述,在不同Temperature下测试:

故障描述: "3号空压机运行2小时后排气温度从正常的85°C逐渐升高到105°C, 同时冷却水出口温度偏高,机器无明显异响。" Temperature 0: ___(测试3次,看是否一致) Temperature 0.5: ___ Temperature 1.0: ___ Temperature 1.5: ___

练习2:Token计算(设备维修场景)

估算以下设备维修文本的Token数,再用Tokenizer验证:

1. "更换轴承" → 预估___个,实际___个 2. 一份500字的维修工单 → 预估___个,实际___个 3. 一份设备保养手册(约2000字) → 预估___个,实际___个

练习3:为你的系统规划参数

| 系统功能 | Temperature | Top-P | max_tokens | 原因 | |---------|-------------|-------|------------|------| | 故障自动分类 | | | | | | 维修工单生成 | | | | | | 保养计划建议 | | | | | | 客户通知短信 | | | | |

七、本知识点检验标准

  • 能用自己的话解释Token,并能估算设备维修文本的Token量
  • 能说出Temperature和Top-P的作用,知道设备维修系统各模块该用什么参数
  • 能计算系统每日的API调用成本

八、延伸阅读

  • OpenAI Tokenizer — 在线Token计数工具
  • The Illustrated Transformer — 可视化讲解Transformer
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 6:33:06

外部区域特殊拉格朗日方程Dirichlet问题:渐近行为与数值求解

1. 项目概述:从数学物理方程到工程边界的桥梁 在流体力学、电磁场理论乃至量子力学的诸多前沿与工程应用中,我们常常会面对一个核心的数学难题:如何描述一个物理量在无限延伸区域内的行为,并精确地刻画它在有限边界上的约束&#…

作者头像 李华
网站建设 2026/6/26 6:32:04

终极语音修复指南:5个简单步骤让任何音频重获清晰

终极语音修复指南:5个简单步骤让任何音频重获清晰 【免费下载链接】voicefixer General Speech Restoration 项目地址: https://gitcode.com/gh_mirrors/vo/voicefixer 你是否有过这样的经历?一段重要的会议录音被背景噪音淹没,一段珍…

作者头像 李华
网站建设 2026/6/26 6:31:25

GraphRAG 实战:从工具接入到项目提效

如果你正准备往大模型方向转,《GraphRAG 实战:从工具接入到项目提效》这类问题别只看热度。更重要的是判断自己该补哪块能力,以及怎么证明你真的会。摘要这篇面向需要构建企业知识库和复杂问答系统的开发者,但不会把“GraphRAG 实…

作者头像 李华
网站建设 2026/6/26 6:30:25

我开了 3 年美容院,终于把收银系统的账算清楚了

我开了 3 年美容院,终于把收银系统的账算清楚了 从年付 4800 到全年 0 元,这篇讲透美业老板怎么挑免费收银系统 2026 老板实录 第 03 期 写在前面:我叫阿琳,杭州拱墅区一家社区美容院的主理人。2023 年开店、2024 年扩到第二家、…

作者头像 李华