
图片 +一个句子以实现任何角色场景杆,腾讯Hunyan宣布了一个开放资源定制的生成图像插件Instantcharacter
图片 +一个句子以实现任何角色场景杆,腾讯Hunyan宣布了一个开放资源定制的生成图像插件Instantcharacter
2025年4月18日19:26
在家
Home在4月18日报道说,Tencent Hunyuan今天宣布了开放的资源定制的插件Instantcharacter图像,并与文学和Flux的开放资源兼容。正式的腾讯开始,通过此插件,在大型模型中,您只需要一个图片和句子就可以在所需的姿势中任何地方制作任何角色。输入Oricture +提示:一只兔子在厨房里拿着勺子并喝汤以获取以下图片: +提示:Cyberpunk可以得到的城市兔子可以得到:纸张一致性是许多文学和艺术场景的主要问题。 insTantcharacter的优势在于,这将确保角色在各种场景,高质量的照片和准确性中的一致性和真实性,同时它具有灵活的文本编辑。用户可以在必要时轻松切换任何场景,以允许字符生成任何动作。纸张的统一和图像产生的准确性被认为超过了相关的行业技术,并且可以处理不同样式和复杂性的图像。通过此插件,内容创建者可以维护高度一致的生成字符,并创建可更好地满足其需求的视觉作品。它们可用于漫画和视频创作等场景。在实际审查中,开放式构造资源的效果与GPT 4O和其他模型相当。从技术上讲,现有的基于学习的技术更依赖于U-NET体系结构,但是一般和图像质量功能有限制,而优化BASED技术需要针对特定主题进行微调,这不可避免地减少文本控制。为了应对这些挑战,Instantcharacter已使用DIT模型建立了创新的框架。绘图引入了使用Maramin Transformer编码器的扩展适配器,可以有效地处理域的开放特征的特征,并与现代扩散变压器的潜在空间无缝相互作用。这种设计使系统可以适应纸张的各种特征的灵活性。同时,为了有效地训练该地块,腾讯Hunyuan团队还制造了一张大型纸,其中包含数千万个样品。这些数据集系统地固定在配对(多视图角色)和非文本图像组合)子集上。这些数据的双重结构与编辑文本的身份和编辑一致,可以通过各种学习路径同时完成。这是一个与链接有关的联合项目:项目项目办公室r:https://instantchaarter.github.io/code:https://github.com/tenncent/instancharterhugging face demo:https://huggingface.co/space/space/space/instantx/instantx/instantx/instantcharter纸: