【AI创作】Qwen image Edit | AnyPose工作流程:无需OpenPose实现动作复刻

社区话题 Photoshop 平面设计社区 【AI创作】Qwen image Edit | AnyPose工作流程:无需OpenPose实现动作复刻

标签: ,

  • 该话题为空。
正在查看 0 条回复
  • 作者
    帖子
    • #131620

      追光
      参与者

      在最新的 AI 图像编辑领域,QIE-2511 AnyPose 提供了一种新的姿态迁移思路:不再依赖 OpenPose 骨架提取,而是直接通过图像理解实现动作迁移。该方法基于 Qwen Image Edit 2511,并结合 AnyPose LoRA,实现仅通过参考图片即可驱动人物动作变化。


      一、核心思路

      传统姿态迁移依赖 OpenPose 先提取人体骨架,再将骨架作为控制信号生成图像。这种方式结构稳定,但表达能力有限。

      AnyPose 的核心变化是:直接使用“图像”作为姿态信号,由模型自行理解动作结构。也就是说,模型不再依赖显式骨架,而是通过视觉理解完成隐式姿态建模,使动作更加自然灵活。


      二、模型组成

      该工作流主要由三部分构成。

      1、基础模型:Qwen Image Edit 2511

      负责图像理解与编辑,是整个系统的视觉核心。 作用:理解图像并进行结构级重绘

      2、加速模块:Lightning LoRA

      用于减少采样步数,提高低步数生成质量。 作用:低步数下保持稳定输出

      3、动作控制AnyPose Base LoRA

      提供人体姿态迁移能力,使模型理解动作变化,作用:控制人体动作结构变化

      4、结构稳定AnyPose Helper LoRA

      Qwen Image Edit 图片动作模仿学习LoRA AnyPose(Base + Helper)

      用于修复姿态生成中的结构错误,作用:防止手脚和身体崩坏。
      参数:可以复制参数直接粘贴到Draw things里面使用

      {"steps":4,"upscaler":"","guidanceScale":1,"batchCount":1,"height":1024,"cfgZeroStar":false,"preserveOriginalAfterInpaint":true,"tiledDiffusion":false,"hiresFix":false,"maskBlur":5,"resolutionDependentShift":true,"strength":1,"batchSize":1,"shift":2.6555895999999999,"tiledDecoding":false,"width":768,"maskBlurOutset":5,"model":"qwen_image_edit_2511_q6p.ckpt","causalInferencePad":0,"seedMode":2,"refinerModel":"","sharpness":0,"faceRestoration":"","seed":2546641887,"controls":[],"cfgZeroInitSteps":0,"loras":[{"mode":"all","file":"qwen_image_edit_2511_lightning_4_step_v1.0_lora_f16.ckpt","weight":1},{"mode":"all","file":"2511_anypose_base_000006250_lora_f16.ckpt","weight":0.69999999999999996},{"mode":"all","file":"2511_anypose_helper_00006000_lora_f16.ckpt","weight":0.69999999999999996}],"sampler":12}

      5、整体输入机制:Moodboard

      输入方式:系统使用 Moodboard 多图输入机制,需要两张图像:第一张为人物原图,用于确定身份,包括脸部、服装与风格;第二张为姿势参考图,仅提供动作结构。

      两张图按顺序放入 Moodboard 中,并保持 Canvas 为空。整个过程不是局部编辑,而是完整图像重建。


      三、生成逻辑

      模型运行时会执行三个步骤:

      首先从原图中提取人物身份特征;其次从姿势图中理解动作结构;最后在 latent 空间中重新组合两者,实现“身份不变,动作改变”的效果。本质上,这是一个基于图像理解的结构迁移过程,而非骨架驱动生成。相比 OpenPose 方法。

      优势:无需预处理骨架,流程更简洁;动作表现更自然,不受骨架约束;能够处理更复杂和艺术化的姿态,同时,它更接近“图像理解驱动生成”的新范式。

      局限性:由于属于全图重建方法,在复杂姿势下可能出现手部或结构轻微错误。同时如果 prompt 未明确约束,人物身份或背景可能发生变化。

正在查看 0 条回复
  • 在下方一键注册,登录后就可以回复啦。