如何简单高效地定制自己的文本作画模型?
2023-01-03 11:48:58 来源:
强烈建议先阅读:一文弄懂 Diffusion Model
1. 论文信息标题:Multi-Concept Customization of Text-to-Image Diffusion
(相关资料图)
作者:Nupur Kumari, Bingliang Zhang, Richard Zhang, Eli Shechtman, Jun-Yan Zhu.
原文链接:https://arxiv.org/pdf/2212.04488.pdf
代码链接:https://www.cs.cmu.edu/~custom-diffusion/
2. 引言最近通过文本生成图像的深度学习相关技术取得了非常大的进展,2021已经成为了图像生成的一个新的milestone,诸如DALL-E和Stable diffusion这种模型都取得了长足的进步,甚至达到了“出圈”的效果。通过简单文本prompts,用户能够生成前所未有的质量的图像。这样的模型可以生成各种各样的对象、风格和场景,并把它们进行组合排序,这让现有的图像生成模型看上去是无所不能的。
但是,尽管这些模型具有多样性和一些泛化能力,用户经常希望从他们自己的生活中合成特定的概念。例如,亲人、朋友、宠物或个人物品和地点,这些都是非常有意义的concept,也和个人对于生成图像的信息有对齐。由于这些概念天生就是个人的,因此在大规模的模型训练过程中很难出现。事后通过详细的文字,来描述这种概念是非常不方便的,也无法保留足够多的视觉细节来生成新的personal的concepts。这就需要模型具有一定的“定制”能力。也就是说如果给定少量用户提供的图像,我们能否用新概念(例如宠物狗或者“月亮门”,如图所示)增强现有的文本到图像扩散模型?经过微调的模型应该能够将它们与现有概念进行概括并生成新的变化。这带来了几个比较严峻的挑战:
首先,模型倾向于遗忘现有概念的含义:例如,在添加“moon gate”这一concept的时候,“moon”的含义就会丢失。其次,由于stable diffusion这样的网络往往参数会超级多,所以在小数据上训练模型,容易造成对训练样本进行过拟合,而且采样中变化也有限。此外,论文还关注了一个更具挑战性的问题,即组group fine-tuning,即能够超越单个个体concept的微调,并将多个概念组合在一起。学习多个新的concepts同时也是存在一定的挑战的,比如 concept mixing以及concept omission。在这项工作中,论文提出了一种fine-tuning技术,即文本到图像扩散模型的“定制扩散”。我们的方法在计算和内存方面都很有效。为了克服上述挑战,新方法固定一小部分模型权重,即文本到潜在特征的key值映射在cross-attention layer中。fine-tuning这些足以更新模型的新concepts。为了防止模型丧失原来强大的表征能力,新方法仅仅使用一小组的图像与目标图像类似的真实图像进行训练。我们还在微调期间引入data的augamation,这可以让模型更快的收敛,并获得更好的结果。论文提出的方法实验是构建在Stable Diffusion之上,并对各种数据集进行了实验,其中最少有四幅训练图像。对于添加单个concept,新提出的方法显示出比相似任务的作品和基线更好的文本对齐和视觉相似性。更重要的是,我们的方法可以有效地组成多个新concepts,而直接对不同的concepts进行组合的方法则遇到困难,经常会省略一个。最后,我们的方法只需要存储一小部分参数(模型权重的3%),消耗的GPU memory非常有限,同时也减少了fine-tuning的时间。
3. 方法总结来讲,论文提出的方法,就是仅更新权重的一小部分,即模型的交叉注意力层。此外,由于目标概念的训练样本很少,所以使用一个真实图像的正则化集,以防止过拟合。
对于Single-Concept Fine-tuning,给定一个预训练的text-to-image diffusion model,我们的目标是在模型中加入一个新的concept,只要给定四张图像和相应的文本描述进行训练。fine-tuning后的模型应保留其先验知识,允许根据文本提示使用新概念生成新的图像类型。这可能具有挑战性,因为更新的文本到图像的映射可能很容易过拟合少数可用图像。所以保证泛化性就非常有必要,也比较有挑战。所以就仅仅fine-tuning新的K和V,而对于query,则保持不变,这样就可以增加新概念的同时,保证模型的表征能力不受到太多的影响。优化目标还是diffusion的形式:
概括起来实际上非常简单,就是训练一个k和v的矩阵,来扩充维度,增加模型的表征能力,使其能生成更为丰富的图像内容。
而对于Multiple-Concept Compositional Fine-tuning,为了对多个概念进行微调,我们将每个概念的训练数据集合并,并使用我们的方法将它们联合训练。为了表示目标概念,我们使用不同的修饰符的
由于我们的方法仅更新与文本特征相对应的key和value投影矩阵,因此我们可以将它们合并,以允许使用多个微调概念生成。让集合
为你推荐
-
如何简单高效地定制自己的文本作画模型?
-
中民控股(00681)附属订立2023年天然气购销合同_当前报道
-
今日看点:电影市场元旦档总票房破5亿元 行业人士:对春节档也很有信心
-
华章科技(01673)一直如常进行业务 继续停牌
-
美经济学家:2023年美国或面临经济衰退
-
暖气片怎么安装 暖气片安装步骤
-
全球微资讯!“中国酒业30年纪念酒发布盛典”隆重举行!
-
藏格矿业“企二代”接班 加速规范治理完成蜕变
-
【环球新要闻】2022北京大兴区电子消费券发放数量是多少?
-
2022金融界领航中国金智奖榜单揭晓!平安信托、中融信托两家公司荣获“杰出信托公司奖”
-
环球快播:12月29日透明工厂板块六大牛股一览
-
众智科技(301361):郑州众智科技股份有限公司2022年第二次临时股东大会决议
-
一切都会慢慢变好句子(精选262句)
-
环球今热点:银保监会:商业银行应当为所托管的每只产品单独建账、单独核算
-
鞍钢股份(000898):鞍钢股份董事、高管辞任
-
光莆股份董秘回复:公司目前正加急备货,努力生产,争取早日满足消费者的需求|天天视点
-
安逸花网贷逾期还款影响征信吗
-
中国平安、格力电器等24股获北向资金增持额超亿元|环球实时
-
全球热议:节前走市场丨运输提速 保障居民蔬菜肉类供应不断档
-
为什么腌制好的排骨不用再洗一遍? 环球快播报
推荐内容
- 如何简单高效地定制自己的文本作画模型?
- 中民控股(00681)附属订立2023年天然气购销合同_当
- 今日看点:电影市场元旦档总票房破5亿元 行业人
- 华章科技(01673)一直如常进行业务 继续停牌
- 美经济学家:2023年美国或面临经济衰退
- 暖气片怎么安装 暖气片安装步骤
- 全球微资讯!“中国酒业30年纪念酒发布盛典”隆重
- 藏格矿业“企二代”接班 加速规范治理完成蜕变
- 【环球新要闻】2022北京大兴区电子消费券发放数量
- 2022金融界领航中国金智奖榜单揭晓!平安信托、中
- 环球快播:12月29日透明工厂板块六大牛股一览
- 众智科技(301361):郑州众智科技股份有限公司2022
- 一切都会慢慢变好句子(精选262句)
- 环球今热点:银保监会:商业银行应当为所托管的每
- 鞍钢股份(000898):鞍钢股份董事、高管辞任
- 光莆股份董秘回复:公司目前正加急备货,努力生产
- 安逸花网贷逾期还款影响征信吗
- 中国平安、格力电器等24股获北向资金增持额超亿元
- 全球热议:节前走市场丨运输提速 保障居民蔬菜肉
- 为什么腌制好的排骨不用再洗一遍? 环球快播报
- 外媒:SK集团旗下电池制造公司计划3年内开发出无
- 当前报道:12月28日白云区同和街四价hpv疫苗预约具
- 全球今热点:纸币传播冠状病毒吗?
- 厦门2023兔年贺岁普通纪念币预约官网入口汇总
- 【天天速看料】2023南通贺岁币中国工商银行预约方
- 最新消息:无锡电信创新驱动提升云改数转水平
- 因赛集团: 2022年股票期权激励计划首次授予激励
- 世界看热讯:顾地科技: 关于召开2023年第一次临
- 明星发胖有多丑?昔日女神颜值似路人,发腮发福老
- 热点在线丨全球“加息潮”下,中国货币政策如何“
- 知名女歌手道歉:全额赔偿! 每日头条
- 香港新冠合胞类鼻疽齐录增幅,染疫破两万创近月新
- 焦点热议:哈药股份: 哈药集团股份有限公司2022年
- 科信技术董秘回复:公司主要提供基站站点能源、数
- 请问工伤假期单位需要劳动者申请吗?
- 青春不过几场世界杯
- 快消息!以岭药业:网传“连花清瘟防疫方”等消息
- 世界速递!俄航天集团前总裁罗戈津遭炮击受伤
- 新奥股份(600803):本次限售股上市日为2022年12月
- 理工光科(300557.SZ)财务总监林海完成减持2.06万股
油气
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
经济
-
中新网杭州10月18日电 (王题题 胡燕婕)云天收夏色,浅秋正渐浓。10月18日,浙江杭州市西湖游船有限公司推出的惠民多站点“西湖环湖游
-
中国税务机关处罚一名艺人经纪人 中新社北京10月18日电 (记者 赵建华)上海市税务局第一稽查局前期在艺人郑爽偷逃税案件检查过程中
-
中新网兰州10月18日电 (闫姣 艾庆龙 吉翔)“红山白土头,黄河向西流。”不少人疑问,天下黄河向东流,为何甘肃永靖县这段黄河却向西
-
中新网北京10月18日电 《清华城市健康设施指数》18日在北京发布。报告成果显示,城市健康设施指数领先城市以中心城市和东部沿海城市
-
中新网安徽黄山10月18日电 (刘浩 黄启宝 汪娜)10月17日至18日,安徽省黄山市当地民警先后救助国家一级保护动物白锦长尾稚和野生梅花