
前沿资讯
1748601942更新
0
黑森林实验室(Black Forest Labs)宣布推出生成式流匹配模型组FLUX.1 Kontext,其核心突破在于支持上下文图像生成,用户可以通过文本和图像进行提示,无缝提取和修改,以生成新的连贯渲染图像。
FLUX.1 Kontext还具备强的提示遵循性、真实渲染效果和出色的字体生成能力,推理速度可达当前领先模型的8倍。其核心功能包括:在多个场景和环境中保留图像中参考角色或物体等独特元素的角色一致性,对图像特定元素进行有针对性修改而不影响其他部分的局部编辑。在文本提示引导下,可生成新颖场景并保留参考图像的独特风格。图像生成和编辑均具极低延迟的交互速度,用户可以迭代添加指令、在先前编辑基础上逐步完善创作并维持图像质量和角色一致性。
FLUX.1 Kontext套件包含两款新模型接入BFL API。FLUX.1 Kontext [pro]支持多轮迭代编辑,用户可逐步叠加指令优化创作,同时维持跨场景的角色、风格一致性,是首个实现 “编辑 - 迭代 - refinement” 闭环的模型,堪称快速迭代图像编辑的先驱。
FLUX.1 Kontext [max]为实验性模型,在不牺牲速度的前提下,大幅提升提示遵循度、字体生成和编辑一致性。这两款模型可在KreaAI、Freepik、Lightricks、OpenArt、LeonardoAI等平台使用,并通过FAL、Replicate、Runware等合作伙伴提供服务。
此外,还有一个开放权重的12B轻量级版本FLUX.1 Kontext [dev],该版本适合开源研究与定制化开发,目前以私有测试版开放,未来将通过 FAL、HuggingFace 等平台公开发布。
性能评估方面,黑森林实验室编制了一个基于众包真实用例的文本到图像和图像到图像生成基准测试KontextBench,并在技术报告中显示,FLUX.1 Kontext [pro]在六项上下文图像生成任务中表现领先,尤其在文本编辑和角色保留任务中得分最高,且在推理速度上持续优于竞争的先进模型。不过,该模型也存在一定局限性,如过多多轮编辑可能引入视觉瑕疵、偶发指令遵循不准确等问题。
为方便用户测试和演示模型,黑森林实验室同步推出了模型体验平台FLUX Playground,新用户可获200积分,约可生成12张pro版图像,无需第三方服务即可直接试用。