news 2026/2/3 1:25:55

机器学习教程入门

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
机器学习教程入门

机器学习教程

机器学习(Machine Learning)是人工智能(AI)的一个分支,它使计算机系统能够利用数据和算法自动学习和改进其性能。

机器学习是让机器通过经验(数据)来做决策和预测。

机器学习已经广泛应用于许多领域,包括推荐系统、图像识别、语音识别、金融分析等。

举个例子,通过机器学习,汽车可以学习如何识别交通标志、行人和障碍物,以实现自动驾驶。


机器学习与传统编程的区别

传统编程机器学习
程序员编写明确的规则计算机从数据中学习规则
适用于问题明确、规则清晰的情况适用于复杂、规则难以明确的情况
例子:编写计算器程序例子:编写识别垃圾邮件的程序

机器学习的三大要素

机器学习包含三个基本要素:

1. 数据

数据是机器学习的燃料,质量越高、数量越多的数据,通常能让模型学得越好。

  • 训练数据:用来教模型的数据
  • 测试数据:用来检验模型学习效果的数据
  • 真实数据:模型在实际应用中遇到的新数据

2. 算法

算法是机器学习的学习方法,不同的算法适用于不同类型的问题。

  • 监督学习:有标准答案的学习
  • 无监督学习:没有标准答案,自己找规律
  • 强化学习:通过试错和奖励来学习

3. 模型

模型是学习的结果,就像学生学到的知识一样。

  • 训练过程:算法从数据中学习规律
  • 推理过程:使用学到的规律做预测

实例

接下来我们通过一个简单的例子来理解机器学习的基本流程。

我们将使用 Python 创建一个简单的线性回归模型来预测房价。

实例

# 导入需要的库
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
import seaborn as sns

# 设置图表风格,让图表更好看
sns.set_style("whitegrid")
# -------------------------- 设置中文字体 start --------------------------
plt.rcParams['font.sans-serif'] = [
# Windows 优先
'SimHei', 'Microsoft YaHei',
# macOS 优先
'PingFang SC', 'Heiti TC',
# Linux 优先
'WenQuanYi Micro Hei', 'DejaVu Sans'
]
# 修复负号显示为方块的问题
plt.rcParams['axes.unicode_minus'] = False
# -------------------------- 设置中文字体 end --------------------------

# 1. 准备数据
# 假设我们有房屋面积和对应的价格数据
# 房屋面积(平方米)
house_sizes = np.array([50, 60, 70, 80, 90, 100, 110, 120]).reshape(-1, 1)
# 房屋价格(万元)
house_prices = np.array([150, 180, 210, 240, 270, 300, 330, 360])

# 2. 创建并训练模型
# 创建线性回归模型
model = LinearRegression()
# 用数据训练模型(学习面积和价格之间的关系)
model.fit(house_sizes, house_prices)

# 3. 使用模型进行预测
# 预测 85 平方米的房屋价格
predicted_price = model.predict([[85]])
print(f"85 平方米的房屋预测价格:{predicted_price[0]:.2f} 万元")

# 4. 可视化结果
plt.scatter(house_sizes, house_prices, color='blue', label='实际数据')
plt.plot(house_sizes, model.predict(house_sizes), color='red', label='预测线')
plt.scatter([85], predicted_price, color='green', s=100, label='预测点')
plt.xlabel('房屋面积(平方米)')
plt.ylabel('房屋价格(万元)')
plt.title('RUNOOB 机器学习测试 -- 房屋面积与价格关系')
plt.legend()
plt.grid(True)
plt.show()

运行结果:

85 平方米的房屋预测价格:255.00 万元

这个例子展示了机器学习的基本流程:

  1. 准备数据(房屋面积和价格)
  2. 选择算法(线性回归)
  3. 训练模型(让计算机学习面积和价格的关系)
  4. 使用模型预测(预测新面积的价格)

输出的图如下:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/31 14:58:45

YOLO11训练日志解读,快速定位问题

YOLO11训练日志解读,快速定位问题 在使用YOLO11进行模型训练时,我们最关心的不仅是最终的精度表现,更是在训练过程中能否及时发现问题、调整策略。尤其是在自定义数据集上训练实例分割任务时,训练日志是判断模型是否正常收敛、是…

作者头像 李华
网站建设 2026/2/1 22:32:16

零基础也能用!Paraformer-large离线版语音转文字实战教程

零基础也能用!Paraformer-large离线版语音转文字实战教程 1. 为什么你需要一个离线语音识别工具? 你有没有遇到过这样的情况:手头有一段长达几十分钟的会议录音,或者一段重要的访谈音频,想要快速整理成文字稿&#x…

作者头像 李华
网站建设 2026/2/1 2:17:43

亲测MinerU:智能文档解析效果超预期

亲测MinerU:智能文档解析效果超预期 最近在处理大量PDF文档时,一直在寻找一个既能精准提取文字、又能理解复杂版面的工具。试过不少OCR方案,要么格式错乱,要么表格识别一塌糊涂。直到我上手了这款基于 MinerU-1.2B 模型的智能文档…

作者头像 李华
网站建设 2026/2/3 15:17:41

Qwen3-Embedding-4B低成本上线:轻量GPU实例实战

Qwen3-Embedding-4B低成本上线:轻量GPU实例实战 1. Qwen3-Embedding-4B介绍 Qwen3 Embedding 模型系列是 Qwen 家族中专为文本嵌入和排序任务打造的最新成员。它基于强大的 Qwen3 系列基础模型构建,提供从 0.6B 到 8B 不同规模的嵌入与重排序模型&…

作者头像 李华
网站建设 2026/1/28 2:57:46

【Python性能优化秘籍】:如何用嵌套列表推导式写出简洁又高效的代码?

第一章:Python列表推导式嵌套循环的写法示例 Python 的列表推导式是一种简洁且高效的方式,用于生成新的列表。当需要处理多维数据结构或进行多重迭代时,嵌套循环的列表推导式尤为实用。 基本语法结构 嵌套循环的列表推导式遵循外层循环在前、…

作者头像 李华
网站建设 2026/1/28 23:37:50

Emotion2Vec+网页端操作全记录,每一步都有截图

Emotion2Vec网页端操作全记录,每一步都有截图 1. 环境准备与启动应用 在使用 Emotion2Vec Large 语音情感识别系统之前,首先需要确保运行环境已正确部署。本文所使用的镜像是由“科哥”基于原始 Emotion2Vec 模型进行二次开发构建的预置镜像&#xff0…

作者头像 李华