news 2026/7/3 17:54:10

我用迭代优化的方法,Vibe Coding了一个PDF小工具#配合Notebooklm的工作流

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
我用迭代优化的方法,Vibe Coding了一个PDF小工具#配合Notebooklm的工作流

Shadow:平时在使用 Chat 等 AI 对话产品输入信息时,许多人会产生心理负担,感到无从下笔,需要思考很久才敢开始输入。

有2种方法可以缓解这个问题:

一种是使用语音输入,想到什么说什么;另一种是允许自己随意输入,但让 AI 先对输入内容进行语言梳理,并注意保持原意、不增删信息。

举个例子

最近 Notebooklm 的移动版更新了幻灯片生成功能,同时网页版也对免费用户开放了此功能。我用它制作了不少 PPT 。

在制作过程中,我会尝试不同的提示词,基于同一份输入材料生成多个不同版本的 PPT,然后从中挑选出我认为有价值的页面保留。

同时,还需要将 PPT 上 Notebooklm 的水印去除,替换成我自己的 Logo 。

基于自身的需求,产生了这个PDF小工具:

PDF Cleaner 工具

第一步:随意输入

---

做一个pdf处理工具,pdf每一页都是图片,直接把pdf每页都转为图片做处理。框选水印的区域,设置背景色,和文字,然后全面页面同样的位置做替换。支持删减页面。支持上传多个pdf,进行整合。导出为pdf。

--

让 AI 帮我把语句通顺下,不要改变原意,不随意增添其他信息

第二步:AI 梳理后

---

开发一个PDF处理工具,其核心功能是:将PDF文件的每一页作为图片处理。

主要流程为:上传一个或多个PDF文件,将每个PDF的每一页转换为图片。用户可在图片页面上框选水印区域,并设置该区域的背景色和替换文字,工具将把PDF所有页面中相同位置的内容进行统一替换。同时支持删除指定页面,以及将多个PDF文件合并处理。最终将处理结果导出为一个PDF文件。

Shadow:清晰很多,节省了不少梳理逻辑关系的脑力。

第三步:Vibe Coding

---

打开,Google AI Studio ,Build 模式,把上面的提示,输入。但我在末尾补充了2句:

---

1、良好的用户体验:本地缓存输入和结果,保留历史记录,提供example示例。

2、做完后记得再次核对下功能实现的完整度。

Shadow:这样加是基于上百个测试总结出的经验。

Gemini 总共花了 136s ,来看看 Vibe Codiing 生成的效果:

最后,我的PDF制作成果:

这个PPT也是我最近在各种场合里分享的 AgentOS 的内容

如果你想掌握AI使用技巧,以及 Vibe Coding 从入门到进阶之路,欢迎了解 Mixlab AI编程训练营:

N22 上海线下2天,12月27-28号

N21 线上 AgentOS AI编程训练营,12月17-1月17号。

欢迎微信咨询

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/1 11:13:55

AI 创作全链路攻略:从标题到整篇文章,10 分钟搞定 CSDN 技术文

对于 CSDN 创作者来说,最耗时的不是 “懂技术”,而是 “把技术转化成一篇有流量、有干货、符合平台风格的技术文”—— 半天憋不出一个吸睛标题,搭框架绕来绕去,填充内容要么干巴巴全是理论,要么口水话没重点&#xff…

作者头像 李华
网站建设 2026/6/30 16:56:14

深圳市47个数据中心一览表

深圳市人工智能产业协会研究部统计,深圳市共布局有数据中心47个,涉及29个运营商,包括腾讯、平安、移动、联通、互盟股份、万国数据、联华世纪、华润等,其中万国数据最多达6个,互盟股份和联华世纪各有4个,腾…

作者头像 李华
网站建设 2026/6/27 2:10:58

从零开始搭建AutoGPT:基于大模型的智能体自动化任务实践

从零开始搭建AutoGPT:基于大模型的智能体自动化任务实践 在生成式AI席卷全球的今天,我们早已习惯了与ChatGPT这样的语言模型对话——问它问题、让它写文案、甚至帮忙调试代码。但你有没有想过,如果AI不仅能“回答”,还能“做事”呢…

作者头像 李华
网站建设 2026/7/3 23:32:48

Apk Pure开发者如何利用LLama-Factory压缩模型适配移动设备?

Apk Pure开发者如何利用LLama-Factory压缩模型适配移动设备? 在智能手机日益成为个人AI交互中心的今天,越来越多的应用开始尝试将大语言模型(LLM)部署到本地。然而,对于像Apk Pure平台上以轻量化、高效分发为核心的开发…

作者头像 李华
网站建设 2026/7/2 14:19:36

16个自动驾驶算法从感知到模型部署,超全!

规划与控制决策是自动驾驶的核心任务和功能。近年来端到端自动驾驶领域的顶尖研究工作大多抛弃了传统模块化pipeline中独立的感知、预测、规划模块,采用统一的、可端到端训练的深度学习模型。例如SparseDrive、VAD(Vision-Centric Autonomous Driving)和UniAD (Unif…

作者头像 李华
网站建设 2026/7/2 15:42:12

PKHeX.Mobile终极指南:移动端宝可梦存档编辑完全教程

PKHeX.Mobile终极指南:移动端宝可梦存档编辑完全教程 【免费下载链接】PKHeX.Mobile Pokmon save editor for Android and iOS! 项目地址: https://gitcode.com/gh_mirrors/pk/PKHeX.Mobile 你是否曾经遇到过这样的困扰?辛苦培养的宝可梦个体值不…

作者头像 李华