【AI创作】Qwen image Edit | AnyPose工作流程:无需OpenPose实现动作复刻

标签： AI, Ai创作

该话题为空。

正在查看 0 条回复

作者
帖子
- 2026-04-28 - 20:49 #131620
  追光
  参与者
  在最新的 AI 图像编辑领域，QIE-2511 AnyPose 提供了一种新的姿态迁移思路：不再依赖 OpenPose 骨架提取，而是直接通过图像理解实现动作迁移。该方法基于 Qwen Image Edit 2511，并结合 AnyPose LoRA，实现仅通过参考图片即可驱动人物动作变化。
  一、核心思路
  传统姿态迁移依赖 OpenPose 先提取人体骨架，再将骨架作为控制信号生成图像。这种方式结构稳定，但表达能力有限。
  AnyPose 的核心变化是：直接使用“图像”作为姿态信号，由模型自行理解动作结构。也就是说，模型不再依赖显式骨架，而是通过视觉理解完成隐式姿态建模，使动作更加自然灵活。
  二、模型组成
  该工作流主要由三部分构成。
  1、基础模型：Qwen Image Edit 2511
  负责图像理解与编辑，是整个系统的视觉核心。作用：理解图像并进行结构级重绘
  2、加速模块：Lightning LoRA
  用于减少采样步数，提高低步数生成质量。作用：低步数下保持稳定输出
  3、动作控制：AnyPose Base LoRA
  提供人体姿态迁移能力，使模型理解动作变化，作用：控制人体动作结构变化
  4、结构稳定：AnyPose Helper LoRA
  Qwen Image Edit 图片动作模仿学习LoRA AnyPose（Base + Helper）
  用于修复姿态生成中的结构错误，作用：防止手脚和身体崩坏。
  参数：可以复制参数直接粘贴到Draw things里面使用
```
{"steps":4,"upscaler":"","guidanceScale":1,"batchCount":1,"height":1024,"cfgZeroStar":false,"preserveOriginalAfterInpaint":true,"tiledDiffusion":false,"hiresFix":false,"maskBlur":5,"resolutionDependentShift":true,"strength":1,"batchSize":1,"shift":2.6555895999999999,"tiledDecoding":false,"width":768,"maskBlurOutset":5,"model":"qwen_image_edit_2511_q6p.ckpt","causalInferencePad":0,"seedMode":2,"refinerModel":"","sharpness":0,"faceRestoration":"","seed":2546641887,"controls":[],"cfgZeroInitSteps":0,"loras":[{"mode":"all","file":"qwen_image_edit_2511_lightning_4_step_v1.0_lora_f16.ckpt","weight":1},{"mode":"all","file":"2511_anypose_base_000006250_lora_f16.ckpt","weight":0.69999999999999996},{"mode":"all","file":"2511_anypose_helper_00006000_lora_f16.ckpt","weight":0.69999999999999996}],"sampler":12}
```
  5、整体输入机制：Moodboard
  输入方式：系统使用 Moodboard 多图输入机制，需要两张图像：第一张为人物原图，用于确定身份，包括脸部、服装与风格；第二张为姿势参考图，仅提供动作结构。
  两张图按顺序放入 Moodboard 中，并保持 Canvas 为空。整个过程不是局部编辑，而是完整图像重建。
  用 Pose ControlNet 精准控图：标准工作流（DrawThings / ComfyUI 通用）
  三、生成逻辑
  模型运行时会执行三个步骤：
  首先从原图中提取人物身份特征；其次从姿势图中理解动作结构；最后在 latent 空间中重新组合两者，实现“身份不变，动作改变”的效果。本质上，这是一个基于图像理解的结构迁移过程，而非骨架驱动生成。相比 OpenPose 方法。
  优势：无需预处理骨架，流程更简洁；动作表现更自然，不受骨架约束；能够处理更复杂和艺术化的姿态，同时，它更接近“图像理解驱动生成”的新范式。
  局限性：由于属于全图重建方法，在复杂姿势下可能出现手部或结构轻微错误。同时如果 prompt 未明确约束，人物身份或背景可能发生变化。
作者
帖子

正在查看 0 条回复

在下方一键注册，登录后就可以回复啦。

下载清单	我的账户
发布话题	会员权益