当前位置: 首页 > news >正文

网站建设代码下载大全/广州seo关键词优化外包

网站建设代码下载大全,广州seo关键词优化外包,安庆做网站赌博代理,怎么制作网站栏目页主页文章目录 Stable Diffusion的组成什么是扩散扩散是如何工作的去噪声绘制图像将文本信息添加到图像生成器中参考 “文生图”,或者AI绘画,最近异常火爆,输入一些描述性的语句,AI就能够生成相应的画作。甚至引发了一个问题&#xff1…

文章目录

    • Stable Diffusion的组成
    • 什么是扩散
    • 扩散是如何工作的
    • 去噪声绘制图像
    • 将文本信息添加到图像生成器中
    • 参考

“文生图”,或者AI绘画,最近异常火爆,输入一些描述性的语句,AI就能够生成相应的画作。甚至引发了一个问题:AI会不会替代原画师?AI通过学习和分析大量的数据,学习到各种各样的绘画技巧和风格,相比于人类,花费更短的时间和更低的成本,就能创作出很优秀的作品。

仅从文本描述中就能够创作出非凡的视觉图像,这已清晰地表明人类创作艺术的方式发生了转变。Stable Diffusion的发布是此发展历程中的一个里程碑事件,它为大众提供了一个高性能的模型。

国外大牛JayAlamma 的博文 [The Illustrated Stable Diffusion](The Illustrated Stable Diffusion)形象地描述了AI图像到底是如何被生成的,形象地解释了什么是stable diffusion,什么是diffusion。学习完大牛的博文后,我用自己的理解向大家介绍一下Stable Diffusion的原理。

Stable Diffusion的组成

Stable Diffusion不是一个整体模型,它由几个组件和模型组成。首先是文本理解组件(text-understanding component ),将文本信息转换成数字表示,以捕捉文本中的想法。其次是图像生成器(image generator),图像生成器包括两步,图像信息创建者( Image information creator)和图像解码器(Image Decoder)。

图像信息创建者这一组件运行多步以生成对象,这是stable diffusion接口和库中的步长参数,通常默认为50或者100。图像信息创建者完全在图像信息空间(隐藏空间)中工作,此特性比在像素空间中工作的扩散模型更快。

图像解码器根据从图像信息创建者哪里获得信息绘制图片,它仅仅在生成最终图像的结束阶段运行一次。

在这里插入图片描述

上图是stable diffusion的一个流程图,包含了上述描述的三个组件,每个组件都有相应的神经网络。

  1. **文本理解组件:**Clip Text为文本编码器。以77 token为输入,输出为77 token 嵌入向量,每个向量有768维度
  2. **图像信息创建者:**UNet+Scheduler,在潜在空间中逐步处理扩散信息。以文本嵌入向量和由噪声组成的起始多维数组为输入,输出处理的信息数组。
  3. **图像解码器:**自动编码解码器,使用处理后的信息数组绘制最终的图像。以处理后的维度为 4 × 64 × 64 4 \times 64 \times 64 4×64×64的信息数组为输入,输出尺寸为 3 × 512 × 512 3 \times 512 \times 512 3×512×512的图像。

什么是扩散

上述我们描述过“图像信息创建者”组件的功能,它以文本嵌入向量和由噪声组成的起始多维输入为输出,输出图像解码器用于绘制最终图像的信息阵列。扩散是发生在下图粉红色“图像信息创建者”组件内部的过程。

在这里插入图片描述

扩散这个过程是循序渐进的,每一步都会添加更多相关信息。扩散发生在多个步骤,每一步作用于一个输入latents array,生成另一个latents array,该数组能够更好类比输入文本和模型从训练模型中的所有图像中获取的所有视觉信息。下图将每一步生成的latents array作为图像解码器的输入,可视化了每一步中添加了什么信息。下图的diffusion迭代了50次,随着迭代步数的增加,latents array解码的图像越来越清晰。

在这里插入图片描述

扩散是如何工作的

扩散模型生成图像的主要思路基于业内已有强大的计算机视觉模型这一基础上。只要数据集够大,模型就可以学习到更复杂的逻辑。

假设有一张照片,有一些随机生成的噪声,然后随机选择一个噪声添加到此图像上,这样构成一条训练样本。用相同的方式可以生成大量的训练样本组成训练集,然后使用这份训练数据集,训练噪声预测器(UNet)。训练结束后将会得到一个高性能的噪声预测器,在特定配置下运行时创建图像。

在这里插入图片描述
在这里插入图片描述

去噪声绘制图像

基于上述描述构建的噪声训练集训练得到一个噪声预测器,噪声预测器可以产生一个噪声图像,如果我们从图像中减去此生成的噪声图像,那么就能够得到与模型训练样本尽可能接近的图像,这个接近是指分布上的接近,比如天空通常是蓝色的,人类有两个眼等。生成图像的风格倾向于训练样本存在的风格。

在这里插入图片描述

将文本信息添加到图像生成器中

上述描述的扩散生成图像并不包括任何文本图像,但是图像生成器的输入包括文本嵌入向量和由噪声组成的起始多维数组,所以调整噪声生成器来适配文本。这样基于大量训练数据训练后既可以得到图像生成器。基于选择的文本编码器加上训练后的图像生成器,就构成了整个stable diffusion模型。可以给定一些描述性的语句,整个stable diffusion模型就能够生成相应的画作。

在这里插入图片描述

参考

  1. [The Illustrated Stable Diffusion](The Illustrated Stable Diffusion)
http://www.jmfq.cn/news/5316283.html

相关文章:

  • php网站建设教程视频/软文范文200字
  • 深圳产品型网站建设/网站建设 网站制作
  • 网站建设技术简易留言板/2024最火的十大新闻有哪些
  • 成都企业网站建设公司/西安网络seo公司
  • 上海建设企业网站/收录优美图片
  • 干网站建设销售怎么样/seo引擎优化外包
  • 德宏北京网站建设/新站如何让百度快速收录
  • 浙江省建设厅网站高工/一个域名大概能卖多少钱
  • 可信的大连网站建设/谷歌首页
  • 建设电子商务网站的意义/网站品牌推广公司
  • 网站建设的行业资讯、/谷歌paypal官网
  • 网站建设流程的过程/抖音推广平台
  • 苏州公司建设网站首页/企业关键词优化最新报价
  • 网络营销网站规划建设实训作业/快速优化官网
  • 网站建设公司龙华/北京seo公司哪家好
  • 十度网站建设/semir是什么意思
  • 网站建设公开课/seo关键词排行优化教程
  • 网站正在建设中提示页面/优化关键词是什么意思
  • 衡阳县党风廉政建设网站/网络营销的特点有哪些特点
  • 山西太原建设银行招聘网站/seo排名哪家有名
  • 上海杨浦区网站建设/优化seo是什么
  • 青岛做网站建设哪家好/杭州seo推广排名稳定
  • 知识付费网站建设/类似58的推广平台有哪些平台
  • wamp网站建设/南京seo网络优化公司
  • 郑州高端定制网站建设公司/软文写作技巧有哪些
  • 河南省建设工程质量安全监督网站/优化是什么意思?
  • 成都网站建设优秀公司/2022年seo最新优化策略
  • 创意家居网站建设与管理/武汉大学人民医院精神科
  • 许昌网站建设汉狮套餐/百度文库首页
  • 加拿大28网站建设/鼓楼网页seo搜索引擎优化