发布时间:2024-11-24 13:19:59 来源: sp20241124
近日,快手自研大模型产品“可图”(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。目前,用户可以通过“可图大模型”官方网站和微信小程序,免费使用各项AI图像功能。
(“可图大模型”微信小程序)从具体功能上看,一方面,可图提供AI形象定制功能,即图生图功能,通过人像保持技术,可轻松保留人像的自然特征,并一键生成各种风格的人像作品,满足不同社交及营销场景的个性化形象需求。例如,用户只需上传一张面部轮廓清晰的照片,并选择偏好的风格,调节保留面部特征的程度,便可创作出既有个性又富含艺术感的头像。
目前,可图已上线10余种AI形象定制风格玩法。在六一儿童节来临之际,可图还特别推出了QQ秀风格的“红钻贵族”和“我的小时候”两种玩法,支持用户上传图片生成复古像素风格化图片和童年写真,打造个人二次元IP形象,回味美好的童年时光。
(可图“红钻贵族”风格玩法) (可图“我的小时候”风格玩法)此外,可图还提供粘土世界、炫彩琉璃、梦幻莫奈、甜蜜情人节、春日卡通、水彩浪漫等风格化玩法,以及韩式写真、魔法学院、帅气赛车、浪漫海岛等写实风玩法,打造专属的个性化写真。
(可图写实人像玩法)另一方面,快手可图大模型也提供AI创作功能,即文生图,支持用户自由输入文本,生成风格多样、画质精美、创意十足的绘画作品。同时用户也可以上传参考图,可图将根据参考图像的风格、主题和细节等内容,生成既符合创意描述又与参考图相关的图像作品。
例如,根据“油画,被鲜花簇拥的猫咪,布偶,浮雕质地,多层次维度,栩栩如生,粉色氛围感”等文字描述,可图生成了质感十足、细节生动的猫咪油画。不仅动物画极具创意,在人物画方面,可图同样功能强大,基于“男孩,天真可爱,水汪汪的大眼睛,背面,转头微笑,高清,亚麻色卷发,小斗篷”等描述生成的超写实作品,细节刻画精美,人物形神兼备。
(根据文字描述生成的产品)不仅是油画,国画、动漫等多样风格的绘画作品,可图均可一一呈现。在可图输入文本“荷塘,水墨画,留白,意境,齐白石风格,细腻的笔触,宣纸的纹理”,一幅荷塘图即刻生成。根据“戴草帽的男人,肩上站着一只鹦鹉,极简,波西米亚风格”等描述,可图同样生成了高质量的精美AI图片。
(根据文字描述生成的产品)值得注意的是,“可图”大大降低了AI图像生成的使用门槛,提供了更好的使用体验:与同类产品需多张照片和较长时间来完成AI生成不同不同,可图只需一张图片和几秒钟时间,便可生成一套效果优秀的AI图像。
在强大的功能背后,快手大模型团队的技术能力为产品提供了有力支撑。例如,在中文特色理解方面,可图基于快手自研的知识图谱构建了上亿级别的中文特色图文数据,结合中文大语言模型的文本表征能力,能够精准描绘和表达各类中文场景。
据悉“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。
同时,在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,以实现对高质量、细节丰富的图像生成的训练和推理的精准适配,同时引入了经过优质专家标注的图文数据集,以对齐人类审美偏好,提升模型性能表现。
据媒体报道,去年9月,“可图”大模型平台已在快手开启内测,快手在App评论区推出的“AI玩评”和“AI小快”等多种创新互动玩法,集合了文生图、图生图、扩图等功能,也是基于可图大模型能力。
近日,在2024年一季度财报电话会上,快手CEO程一笑介绍,今年一季度,快手稳步推进自研大模型各项性能的迭代提升,并且加快大模型在各业务场景的应用。随着大模型产品可图的正式发布,快手也将持续为用户带来更丰富有趣的AI互动新体验。
【编辑:邵婉云】