DCT-Net人像卡通化API文档详解：POST参数/响应格式/错误码-育师

DCT-Net人像卡通化API文档详解：POST参数/响应格式/错误码

1. 为什么需要这份API文档

你可能已经试过网页版的DCT-Net人像卡通化服务——上传照片、点一下按钮、几秒钟后就看到一张生动有趣的卡通头像。但如果你正开发一个批量处理用户头像的App，或者想把卡通化能力集成进企业内部系统，光靠点点点显然不够。

这时候，你就需要直接调用它的后端API。可问题来了：

请求地址到底是什么？
图片怎么传？是base64还是文件流？
能不能控制卡通风格强度？要不要保留原图肤色？
返回的JSON长什么样？失败时会返回什么错误信息？

这份文档不讲模型原理，不堆技术术语，只聚焦一件事：让你5分钟内写好第一行调用代码，并稳定跑通。所有内容都来自真实部署环境下的实测验证，不是纸上谈兵。

2. API基础信息与调用方式

2.1 接口地址与协议

服务默认运行在容器内8080端口，对外暴露一个标准HTTP POST接口：

POST http://<服务IP>:8080/api/cartoonize

注意：这不是HTTPS，也不需要Token认证。只要网络可达、端口开放，就能调用。适合内网快速集成。

2.2 支持的请求方式

DCT-Net API仅支持 multipart/form-data 格式上传（即传统表单文件上传），不支持JSON body传base64图片。这是出于实际工程考虑：

避免大图base64编码膨胀30%+导致超时
兼容几乎所有语言的HTTP客户端（Python requests、JavaScript FormData、curl等）
与WebUI底层逻辑完全一致，零适配成本

正确做法：把图片作为表单字段image提交
错误做法：把图片转成base64塞进JSON里发过去

2.3 最小可用调用示例（curl）

curl -X POST "http://127.0.0.1:8080/api/cartoonize" \ -F "image=@./my_photo.jpg"

只要这行命令能跑通，说明服务已就绪，后续再加参数也不难。

3. 详细POST参数说明

3.1 必填参数：image

字段名	类型	是否必填	说明
`image`	文件字段	是	人像正面照，JPG/PNG格式，建议尺寸 512×512 ~ 1024×1024 像素，文件大小 ≤ 5MB

实测提醒：

侧脸、遮挡严重（如戴口罩、墨镜）、多人合照效果不稳定，首推单人正脸清晰照
过小图片（<256px）会自动拉伸，可能模糊；过大图片（>2000px）会先等比缩放，不影响质量

3.2 可选参数（全部通过表单字段传递）

字段名	类型	默认值	说明	实测效果参考
`style`	string	`"anime"`	卡通风格类型，可选值： `"anime"`（日系动漫风） `"cartoon"`（美式简笔风） `"painting"`（油画质感）	`"anime"`细节更丰富，发丝/瞳孔有高光；`"cartoon"`线条更粗，适合做头像；`"painting"`带笔触感，适合艺术创作
`strength`	float	`0.7`	风格强化程度，范围`0.1 ~ 1.0`	`0.4`：轻微卡通感，接近原图；`0.7`：平衡推荐值；`1.0`：风格强烈，部分细节会简化
`preserve_skin`	boolean	`true`	是否保留原始肤色，`true`/`false`	设为`false`时肤色会随风格统一调整（如anime风偏粉调），设为`true`则皮肤色基本不变，更自然
`output_format`	string	`"jpg"`	输出格式，可选`"jpg"`或`"png"`	`"png"`透明背景（仅当原图有透明通道时生效），`"jpg"`体积更小、加载更快

所有可选参数都是字符串形式提交（即使boolean也传"true"），服务端自动转换。

3.3 完整curl示例（带全部参数）

curl -X POST "http://127.0.0.1:8080/api/cartoonize" \ -F "image=@./portrait.jpg" \ -F "style=anime" \ -F "strength=0.85" \ -F "preserve_skin=true" \ -F "output_format=png"

4. 响应格式与结果解析

4.1 成功响应（HTTP 200）

服务返回标准JSON，结构清晰，无嵌套：

{ "status": "success", "message": "Cartoonization completed", "result_url": "http://127.0.0.1:8080/output/20240512_142345_abc123.png", "original_size": [800, 600], "output_size": [800, 600], "process_time_ms": 2340 }

字段	类型	说明
`status`	string	固定为`"success"`
`message`	string	提示信息，当前固定为`"Cartoonization completed"`
`result_url`	string	关键字段：生成图的可访问URL，有效期24小时（服务重启后失效）
`original_size`	array	原图宽高`[width, height]`
`output_size`	array	输出图宽高（等比缩放后尺寸）
`process_time_ms`	integer	处理耗时（毫秒），实测CPU环境约1.8~3.5秒

小技巧：result_url直接粘贴到浏览器就能预览，也可用代码下载保存。

4.2 下载生成图的Python示例

import requests response = requests.post( "http://127.0.0.1:8080/api/cartoonize", files={"image": open("./input.jpg", "rb")}, data={ "style": "anime", "strength": "0.75", "preserve_skin": "true" } ) if response.status_code == 200: result = response.json() img_data = requests.get(result["result_url"]).content with open("cartoon_output.png", "wb") as f: f.write(img_data) print(" 卡通图已保存") else: print(" 调用失败：", response.text)

5. 错误码与常见问题排查

5.1 标准错误响应结构

所有错误均返回HTTP非200状态码 + 统一JSON格式：

{ "status": "error", "message": "具体错误描述", "code": "ERR_CODE" }

HTTP状态码	错误码	错误描述	常见原因	解决方案
`400`	`ERR_NO_IMAGE`	"No image file provided"	表单中未提交`image`字段	检查字段名是否拼错，确认文件路径正确
`400`	`ERR_INVALID_IMAGE`	"Invalid image format or corrupted"	上传了非JPG/PNG文件，或图片已损坏	用看图软件打开确认能正常显示，重试转换格式
`400`	`ERR_IMAGE_TOO_LARGE`	"Image file exceeds 5MB limit"	文件超过5MB	用Photoshop或在线工具压缩，或设置`quality=80`保存
`400`	`ERR_INVALID_PARAM`	"Invalid value for parameter 'strength'"	参数值超出范围（如`strength=1.5`）	查阅参数表，确保数值在合法区间
`500`	`ERR_PROCESS_FAILED`	"Internal processing error"	模型推理异常（内存不足/显存溢出/依赖缺失）	检查容器日志`docker logs <container_id>`，确认TensorFlow版本匹配

5.2 真实排障记录（来自部署现场）

现象：调用返回500 ERR_PROCESS_FAILED，但WebUI能正常使用
原因：API请求并发数过高（>3），CPU满载导致TF session初始化失败
解决：限制客户端并发，或增加容器CPU配额
现象：result_url返回404
原因：服务重启后旧URL自动失效（设计如此，避免磁盘爆满）
解决：立即下载，不要缓存URL长期使用
现象：返回图是灰色方块
原因：上传了纯黑/纯白背景图，模型误判为人像区域缺失
解决：换一张有明确人脸轮廓的图，或手动裁剪出人脸区域再上传

6. 本地调试与集成建议

6.1 快速验证服务是否健康

不用写代码，一条命令搞定：

# 检查服务是否响应 curl -I http://127.0.0.1:8080/health # 应返回 HTTP/1.1 200 OK

该接口由Flask内置提供，返回纯文本OK，适合加到K8s liveness probe。

6.2 生产环境集成要点

超时设置：建议客户端设置timeout=15s（处理+网络+下载）
重试策略：对5xx错误可重试1次，4xx错误直接报错（属客户端问题）
输出存储：result_url是临时链接，业务系统需立即下载并存入自有OSS/CDN
批量处理：单次只支持1张图，批量请用循环+合理间隔（建议≥1s），避免压垮服务

6.3 性能实测数据（Intel i7-11800H + 32GB RAM）

图片尺寸	平均耗时	CPU占用峰值	内存占用峰值
512×512	1.8s	82%	1.2GB
1024×768	2.9s	94%	1.8GB
1500×1000	3.4s	99%	2.1GB

提示：若需更高吞吐，建议部署多实例+负载均衡，而非单机提频。

7. 总结：从调通到落地的关键几步

你不需要理解DCT-Net的卷积层怎么工作，也不用研究卡通化损失函数。真正卡住落地的，永远是那些文档里没写清楚的细节：

传图必须用multipart/form-data，不是JSON
preserve_skin=true这种布尔值要传字符串"true"
result_url是临时链接，得马上下载
500 ERR_PROCESS_FAILED很可能是并发太高，不是模型坏了

现在，你已经掌握了：
如何写出第一行可用的API调用
每个参数的实际影响（不是理论值）
看懂错误码并快速定位问题
在生产环境安全集成的注意事项

下一步，挑一张你的照片，用上面的curl命令跑一次——看到那张属于你的卡通头像跳出来时，就是集成成功的信号。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

DCT-Net人像卡通化API文档详解：POST参数/响应格式/错误码