news 2026/6/23 8:30:44

Verl中的checkpoint合并成huggingface形式的模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Verl中的checkpoint合并成huggingface形式的模型

这里用的fsdp训练的模型,大概内容如下:

里面打开还是有很多文件

现在想要hf那个格式的模型,VeRL提供了merge函数,下面是一个代码:具体参考https://verl.readthedocs.io/en/latest/advance/checkpoint.html#checkpoint-page

#!/bin/bash # 合并 PPO 训练的 checkpoint 为 HuggingFace 格式 # Checkpoint 路径:/root/autodl-tmp/verl/checkpoints/verl_example_gsm8k/deepseek_llm_7b_function_rm/global_step_105 set-x # 设置 Hugging Face 缓存目录 export HF_HOME=/root/autodl-tmp export TRANSFORMERS_CACHE=/root/autodl-tmp # Checkpoint 路径 CHECKPOINT_DIR="/root/autodl-tmp/verl/checkpoints/verl_example_gsm8k/deepseek_llm_7b_function_rm/global_step_105"ACTOR_DIR="${CHECKPOINT_DIR}/actor"# 输出目录(合并后的 HuggingFace 模型) TARGET_DIR="${CHECKPOINT_DIR}/merged_hf_model"# 执行合并 python-m verl.model_merger merge \--backend fsdp \--local_dir"${ACTOR_DIR}"\--target_dir"${TARGET_DIR}"echo"合并完成!模型已保存到: ${TARGET_DIR}"

合并后的模型如下:

后记

2025年12月12日于上海。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 23:10:27

42、Linux系统打印与日志文件管理全解析

Linux系统打印与日志文件管理全解析 在Linux系统的日常管理中,打印任务管理和日志文件管理是两项重要的工作。下面将详细介绍这两方面的相关知识和操作方法。 打印任务管理 指定操作原因 在Linux中,可以使用 disable 和 reject 命令的 –r 选项来指定操作的原因。例…

作者头像 李华
网站建设 2026/6/23 21:26:47

本地化与国际化测试的执行过程

随着全球市场经济的发展,企业在全球各地都可能有子公司、合作伙伴或客户,其产品可能销往全球。如果企业的产品还只是提供一种区域性的语言,那么产品将很难生存,用户界面(UI)、各国多语言、货币、日期格式、计量单位,这些因素影响了产品在全球的竞争力。为了保证产品能更好…

作者头像 李华
网站建设 2026/6/22 14:53:16

Swagger UI高效调试实战:从入门到精通的全链路解决方案

Swagger UI高效调试实战:从入门到精通的全链路解决方案 【免费下载链接】swagger-ui Swagger UI is a collection of HTML, JavaScript, and CSS assets that dynamically generate beautiful documentation from a Swagger-compliant API. 项目地址: https://git…

作者头像 李华
网站建设 2026/6/23 21:28:18

数字员工是什么?熊猫智汇在提升AI销售工具效率上的优势是什么?

数字员工作为现代企业管理的重要工具,能够显著优化业务流程、降低成本并提升工作效率。以AI销冠系统为例,数字员工利用其强大的自动化外呼功能,可以高效处理客户互动,从而节省人力资源。企业通过这一系统进行多通电话的支持&#…

作者头像 李华
网站建设 2026/6/23 19:48:09

文献查询:高效获取与管理学术资源的实用指南

开题报告前那两个月,我电脑里塞满了乱七八糟的PDF,参考文献格式错得千奇百怪,导师一句“脉络不清”打回来三次。后来才发现,问题不是读得不够多,而是工具没用对。这三个工具帮我理清了思路,把一堆文献变成了…

作者头像 李华