news 2026/6/24 23:06:20

AI是什么-了解AI,拥抱AI,理性看待AI

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI是什么-了解AI,拥抱AI,理性看待AI

了解AI,拥抱AI,理性看待AI

AI的全称是Artificial Intelligence,中文叫人工智能。简单来说,就是让机器像人一样思考。

AI能做什么

  1. 智能助手:你对手机说“回家”,导航就能规划路线;或者使用手机上各种语音助手。
  2. 内容推荐:刷短视频或购物时,总能看到你感兴趣的内容,背后就是AI推荐算法在工作。
  3. 内容创作:AI可以帮你写文章、写代码、翻译语言,甚至根据文字描述生成精美的图片和视频。
  4. 医疗健康:AI可以辅助医生分析X光片、CT影像,帮助识别病变,提高诊断效率和准确率。
  5. 自动驾驶:汽车利用AI技术识别道路、行人和交通标志,实现辅助驾驶甚至无人驾驶。
  6. 智能制造:AI智能排产、AI视觉质检、设备预测性维护、一线工人AI助手。

现在的AI似乎是无所不能,即将颠覆一切。AI的能力究竟来自哪里,接下来简单说说AI的原理。

AI的原理

虽然AI的历史超过70年,这里仅讨论当前流行的AI大模型

说起AI的原理,总会出现一大堆复杂术语,但其核心原理并不复杂。这里先抛开复杂的术语,牺牲部分精准严谨,力求浅显易懂。

当前AI的核心能力就一个:对话补全能力,其它能力都是基于核心能力的衍生能力。

对话补全能力就是预测下一个词的能力,比如:用户输入123,AI预测下一个词是45的可能性比较大,就会补全成12345。当然实际上的原理和能力比较复杂,通过学习海量文本,来计算在特定上下文中最可能出现的下一个词是什么,从而生成连贯的句子和段落。

从这个原理可以推论出,输入的内容越多越详细,AI补全的内容也越精确越丰富。所以很多AI使用技巧都强调要详细准确描述需求,还可以先写一堆背景知识,让AI扮演某种角色或自己的身份背景介绍等等,让AI有足够多的内容去进行预测补全。

AI就像个算命先生,可以根据你提供的信息来展开各种话术。现阶段算命先生比AI更厉害,因为算命先生还会察颜观色,全方面的收集和了解信息,而AI仅能根据用户主动提供的信息来展开。

AI是如何具有对话补全能力的?

训练AI和小孩说话类似,先在小孩面前不断重复正确的语句,再让小孩模仿着学说话,小孩模仿正确时进行肯定,小孩模仿错误时进行纠正。

训练AI需要大量的语言材料(简称语料),比如:新闻、论文、产品说明书、小说、诗歌、数学题等都是语料,用海量的语料训练AI,这一步称为预训练,AI学会了语法、掌握了海量知识,甚至能预测下一句话是什么。

预训练结束后的AI,还不能直接拿来用。它虽然“博学”,但往往不懂礼貌、不会听指令,甚至会胡说八道(AI幻觉)。接下来的工作,就是要把AI调教成“懂事、听话、能干活”的助手。这个阶段通常被称为后训练或微调与对齐。

后训练有多种方式,常用的有:

  1. 问答示范(术语:监督微调)

    准备大量的“指令-回答”,让AI明白遇到这样的问题应该如何回答。

  2. 评价(术语:强化学习)

    问AI问题,让AI给出几个不同的回答,然后由人对这些回答进行打分,让AI学会人类的价值观。

  3. 学专业知识(术语:领域适配)

    比如希望AI成为医生,就用大量的医学相关的语料训练AI,让AI掌握这些专业知识。

AI的衍生能力

用大量语料训练完毕的AI能够胜任文本生成、对话、翻译、代码编写、逻辑推理等与语言相关的任务。具体使用语料时,先将语料切割成词元(英文名:Token,可以简单理解为具有独立意义的词或字,词元也是AI工作量的计算单位)。训练后的AI就是用这些词元来回答用户提出的各种问题。

把词元的概念延伸到非语言方面,比如:图片切割的小块、小段音频、小段视频、现实中的各种物体特征等等,用这些非语言的词元形成的语料来训练AI,就可以得到各种各样的AI模型。

以AI图片生成模型为例:用大量视觉词元为语料来训练AI,训练后的AI就学会了用视觉词元来回答用户提出的图片要求,最后将回答的视觉词元还原成像素并形成图片(就像它生成文字一样,直接“写”出了图片)。

AI前景展望

当前人工智能技术发展的核心脉络是:“万物皆可词元化”

简单来说,就是打破文字、图像、声音的界限,把它们都变成AI能理解的“通用积木”(即词元),然后用同一套逻辑去训练。AI的进化路径,就是把世界万物“翻译”成词元,然后用海量的算力去预测这些词元的排列组合规律。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/24 22:59:59

多模态大模型重塑科学教育:从认知减负到自适应学习

1. 项目概述:当科学教育遇上多模态大语言模型作为一名在科学教育和技术交叉领域摸爬滚打了十几年的从业者,我亲眼见证了从幻灯片到互动白板,再到在线课程平台的变迁。但最近两年,一种新的技术力量——多模态大语言模型&#xff0c…

作者头像 李华
网站建设 2026/5/9 23:16:45

专为打工人打造!OpenClaw 中文汉化版部署教程

https://xiake.yun/api/download/package/14?promoCodeIV8E496E2F7A 2026 年开源圈热度很高的本地 AI 智能体 OpenClaw(小龙虾),凭借本地运行、零代码操作、自动完成电脑任务的特点深受欢迎。它可以听懂自然语言指令,自动帮你处…

作者头像 李华
网站建设 2026/5/9 23:13:57

第46篇:Vibe Coding时代:LangGraph + 需求澄清节点实战,解决用户一句话需求太模糊导致代码跑偏问题

第46篇:Vibe Coding时代:LangGraph + 需求澄清节点实战,解决用户一句话需求太模糊导致代码跑偏问题 一、问题场景:用户只说“帮我做个登录”,Agent 就开始写代码 真实用户提需求时,经常非常简略: 帮我做个登录 加一个导出功能 修一下订单问题 优化一下接口如果 Agent …

作者头像 李华
网站建设 2026/6/25 0:38:18

聚合统计-原理和应用场景

聚合统计-原理和应用场景 聚合统计概述 聚合统计是一种数据处理技术,它将多个数据记录组合成一个集合,并计算该集合的统计信息,如总和、平均值、最大值和最小值等。 聚合操作通常用于数据仓库和数据分析中,以简化数据并提取有用的…

作者头像 李华
网站建设 2026/5/9 23:12:48

c语言绿皮书第三版第十三章习题

1.习题13.4#include <stdio.h> #include <stdlib.h>int main() {FILE *fp;char ch;// 打开文件&#xff0c;文件名改为题目要求的 testif ((fp fopen("test", "w")) NULL) {printf("can not open file!\n");exit(0);}// 边读边处理…

作者头像 李华