Black Forest Labs发布FLUX.2 [klein]:最快图像模型,13GB显存即可运行

前沿资讯 1768636541更新

0

【导读】Black Forest Labs正式发布了FLUX.2 [klein]模型家族,这是其目前速度最快的图像生成模型。FLUX.2 [klein]将图像生成与编辑功能统一整合于单一紧凑架构之中,在实现最先进生成质量的同时,将端到端推理时间低压缩至1秒以内,真正实现了"即时视觉创作"的愿景。而且,仅需约13GB显存,即可在RTX 3090/4070等消费级显卡上流畅运行,大大降低了高性能AI视觉创作的准入门槛。


随着AI智能体能力的持续进化,市场对能够实时响应、快速迭代的视觉生成模型需求日益迫切,于是,FLUX.2 [klein]应运而生。

"Klein"一词源自德语中"小"的含义,既体现了模型紧凑的参数量级,也暗示了其极低的推理延迟

FLUX.2 [klein]的核心创新在于其亚秒级推理能力:在主流硬件上,生成或编辑一张图像仅需不到0.5秒。这一突破性速度使得实时交互式应用成为可能,用户可以在创作过程中即时预览效果、快速迭代调整,极大地提升了创意工作流程的效率。

同时,该模型在照片级真实感输出高多样性方面同样表现出色,尤其是基础变体版本,能够生成细节丰富、风格多样的高质量图像。

FLUX.2 [klein] 9B作为旗舰级轻量模型,在"生成质量"和"推理延迟"这两个目标之间,达到了当前技术条件下最优的平衡状态。该模型在文本到图像生成、单一参考图像编辑以及多参考生成任务中均展现出卓越性能,能够与参数量达其5倍的模型相媲美甚至更胜一筹,而推理时间却不到后者的一半

FLUX.2 [klein] 4B是全系列中最具可访问性的模型,采用Apache 2.0许可证完全开源。该模型专门针对消费级GPU优化,能够在RTX 3090/4070等主流显卡上流畅运行。虽然体积更加紧凑,4B变体在文本到图像、图像到图像以及多参考生成任务中依然展现出超越其体量的强大能力,是本地开发与边缘部署的理想选择

除了标准版本,Black Forest Labs还推出了FLUX.2 [klein] Base 9B/4B基础模型。这些未经蒸馏的完整容量模型保留了全部训练信号,为需要高度定制化控制的场景提供了最大灵活性,特别适合微调、LoRA训练、学术研究以及构建自定义流水线。

为充分发挥NVIDIA RTX系列GPU的硬件优势,Black Forest Labs与NVIDIA深度合作,开发了针对所有[klein]变体的FP8和NVFP4量化版本。这些量化版本在保持原有能力的同时实现了显著的效率提升:FP8版本推理速度提升至1.6倍,显存占用降低40%;NVFP4版本推理速度提升至2.7倍,显存占用降低55%

为推动生态发展,Black Forest Labs提供了生产级API服务本地运行的开源权重双重选择。开发者可以根据实际需求选择云端调用或私有部署,灵活应对不同场景的安全性与性能要求。


参考资料:https://bfl.ai/blog/flux2-klein-towards-interactive-visual-intelligence?ref=testingcatalog.com