主页 > 资讯 > 新闻 > 新型开源AI模型SD3 Medium提升视觉创作实力

新型开源AI模型SD3 Medium提升视觉创作实力

keke 2024-06-13

6月13日,知名人工智能研究机构Stability AI对外发布了他们的最新开源模型——Stable Diffusion 3 Medium(简称SD3 Medium)。官方宣称,这款模型在当前的开源领域中树立了新的标杆,其性能超越了Midjourney 6,展现出前所未有的先进性。

据Stability AI介绍,SD3 Medium在文本到图像生成技术上实现了显著突破,特别在处理手部和脸部细节方面,它展现出了卓越的能力,能够生成出高度逼真的图像,令人印象深刻。这一进步主要得益于其内部采用的Diffusion Transformer架构,它能够精准融合文字描述,提升生成图像的精准度和连贯性。

值得一提的是,SD3 Medium的易用性是其另一大亮点。与许多需要高性能硬件支持的AI模型不同,SD3 Medium可以在普通消费者级别的显卡上流畅运行,极大地降低了技术门槛,使得更多艺术家、设计师和开发者能够便捷地接入并利用这一技术。

为了推动创新和普及,Stability AI提供了非商业许可版本的SD3 Medium,供公众免费使用。对于有商业需求的个人或企业,他们提供了创作者许可证,适合艺术家等创意群体,而对于大规模商业用户,可以直接与Stability AI团队联系,获取更为详细的授权安排。

此外,Stability AI还透露了其未来的发展规划,计划将现有的技术拓展至视频和音频生成领域,进一步丰富其在媒体创作领域的应用。一个具体的示例是,他们通过SD3 Medium成功生成了一幅生动的图像,描绘了一个18岁日本女孩在东京街头搭车的场景,背景繁华,充满活力,展示了艺术站(Artstation)上流行的电影化构图风格。