news 2026/2/20 13:47:04

为什么我不建议你再写SQL取数了?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
为什么我不建议你再写SQL取数了?

最近一直在摸索如何用AI解决实际的业务问题,发现AI在调用数据库和处理数据上有些发挥的空间,于是我做了一个自动化数据处理的智能体,名叫“数分神器”,有以下3个核心功能:

1、支持连接SQLite数据库,并实现抽取、写入的功能

2、支持SQL、Python处理数据,按要求进行数据清洗、转换、透视等

3、支持导出数据报告,并生成matplotlib图表

这3个功能能涵盖ETL和数据分析的基本工作,也就是说AI可以替代这些初级岗位,而且能把活干的更高效、漂亮。

不得不感慨,那些靠SQL取数保住的饭碗可能真的要被AI砸碎了。

要搭建这个智能体,需要用到3个至关重要的工具。

首先是SQLite数据库,这是一个轻量化的开源数据库,它没有服务器,无需复杂的配置安装,就可以直接用,很适合制作AI应用。有个冷知识,微信就是依赖SQLite进行数据存储和管理的。

其次要用到Trae编辑器,这是一个AI原生的代码编辑器,是基于VsCode内核开发的,所以它有VsCode的几乎所有功能,最重要的是它支持直接部署大模型、智能体、MCP等,可以理解它就是一个超级编程智能体。

最后还要用到SQLite MCP,这是一个专门用于操作本地SQLite数据库的MCP服务,所谓MCP服务即“模型上下文协议”,是大模型与外部工具的连接标准,就像电脑之于USB一样。SQLite MCP能支持AI自动查询、读取、操作数据库,完全不需要手工干预。

下面来讲讲具体步骤。

1、安装SQLite数据库

以windows系统为例,从SQLite网站直接下载安装包,解压到本地即可,无需额外安装。

你会看到解压后出现4个应用程序文件,不用任何操作, 因为SQLite就是开箱即用。

接着你可以创建一个名为‘my_db’的数据库,在命令行里输入:

sqlite3 my_db.db

这样你就直接创建了一个SQLite数据库文件,请复制它的文件路径地址,留着备用。

比如D:\sqlite\my_db.db

2、安装Trae

这一步就更不用多说了,Trae是开源软件,安装和Vscode一样,非常简单。

Trae还提供多种免费模型,不限制tokens,比如DeepSeek、Qwen、Doubao、Kimi等。

安装好后,你可以配置下Python开发环境,也就是安装Python插件,找到本地Python路径,就可以在Trae里进行Python开发了。

Trae有个AI侧栏,可以进行AI编程,或者搭建智能体,这是后面要用到的功能,也是Trae的核心能力。

3、部署SQLite MCP

Trae有个MCP集市,里面有各种功能的MCP,也可以自己添加特定MCP服务。

SQLite MCP就是现成的,能直接从集市里添加,然后在配置信息里输入前面的my_db.db数据库路径地址,保存即可。

这样你就配置好了SQLite MCP服务,AI可以直接访问你的数据库文件。

4、创建智能体

接下来,咱们需要创建一个名为“数分神器“的智能体,来调用MCP执行任务。

这里要注意两点,首先“数分神器“智能体需勾选SQLite MCP服务,其次要设置默认提示词,告诉智能体它的角色和任务。

创建好智能体后就可以直接与它对话,它会根据需求调用SQLite MCP,并处理数据,或者形成一份数据报告。

接下来咱们列举几个常见的数据库处理场景,以某月份车型销量数据为例,该数据已经提前存储在SQLite数据库中。

1、从SQLite中抽取数据

任务:从表model_sales_202509中提取数据,保存到csv中。规则提取sales排名前20、且price不超过20万的model,提取的字段包括rank、model、sales、brand、price。

智能体会尝试连接SQLite数据库,并查询相关表结构,按照要求抽取数据。

最终它输出了一份CSV数据,内容完全符合设定的取数需求,你看这个功能就替代了SQL人工取数的工作,你如果在做这个会感到焦虑嘛?

2、向SQLite中写入数据

任务:将文件model_sales_top20_under20w.csv数据批量全部写进数据库中,表命名为model_sales_top20_under20w

最后,表model_sales_top20_under20w成功出现在了SQLite数据库中。

3、从SQLite中抽取数据,形成分析报告

任务:从表model_sales_202509抽取数据,并进行数据分析,形成分析报告(包含图表),要求如下:

1、分析车型销量与价格的关系

2、分析不同品牌车型数量与总销量之间的关系,是否车型越多销量越高?

3、分析比亚迪主要车型的销量情况,以及其价格分布

最后,生成了一份分析报告,并配有7张图表。

分析报告和可视化图表如下:

从以上输出的内容可以看到,“数分神器”智能体可以非常灵活的处理SQLite数据,并使用Python等工具处理数据、制作图表,颜值、专业性都还不错,堪当一个初级分析师。

这是我将AI应用到实际工作的一个尝试,虽然有很多地方还不算满意,比如处理速度、研究深度等,但AI已经能达到初级工程师的水平,这是毋庸置疑的,再经过调教优化,会逐步进阶到中高级水平。

如果用一句话来形容AI带来的改变,我想是:忽如一夜春风来,千树万树梨花开。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/20 1:38:43

消息队列如何处理消息堆积?

在消息队列中,当消息的生产速度远远大于消费速度时,将会导致大量的消息积压在队列中,这样就会形成消息堆积。 那如何处理消息堆积呢? 一般来说,我们需要定位一下消费慢的原因,如果是bug则处理bug&#xff1…

作者头像 李华
网站建设 2026/2/13 7:11:22

说说消息队列的推模式和拉模式

推模式是消息队列主动将消息从Broker推送给Consumer,这种模式它的实时性比较好,消息可以立即送达消费者,但是缺点就是决定权不在消费者手上,在高并发场景下容易造成消费者过载。 拉模式是消费者主动从消息队列中的Broker拉取消息&…

作者头像 李华
网站建设 2026/2/19 13:08:40

为什么 NAT Gateway 一定在 Public Subnet?

一句话结论(记住这个就不会错) NAT Gateway 是“给 Private Subnet 用的”, 但它必须部署在 Public Subnet 里。 👉 “服务对象” ≠ “部署位置” 为什么 NAT Gateway 一定在 Public Subnet? NAT Gateway 要做的事情是…

作者头像 李华
网站建设 2026/2/20 6:16:52

PyTorch-CUDA-v2.6镜像运行CLIP多模态模型图文检索应用

PyTorch-CUDA-v2.6 镜像运行 CLIP 多模态模型图文检索应用 在当今智能内容理解需求日益增长的背景下,如何快速、稳定地部署多模态AI模型成为工程落地的关键挑战。以图像与文本为核心的跨模态任务——例如“用一句话搜一张图”——正在被广泛应用于电商推荐、数字资产…

作者头像 李华
网站建设 2026/2/20 4:21:22

【Hot100-Java中等】:字母异位词分组

在 LeetCode 的字符串题目中,“字母异位词” (Anagrams) 是一个非常高频的概念。这道第 49 题不仅考察了哈希表(HashMap)的应用,更是一个理解 Java 对象机制的绝佳案例。1. 解决方案一:排序数组分类 (Sorting)这是最符…

作者头像 李华
网站建设 2026/2/18 21:17:04

猜测心跳包机制的核心逻辑

一、心跳包的作用定时发送一个数据包,等待对方回复。如果对方在规定时间内回复,说明连接正常;否则出现异常或者收不到回复,说明工作不正常。二、主要逻辑(一)定义心跳包的格式1、发送1字节类型(值为10)2字节标识码(值为0xAABB)2、…

作者头像 李华