返回首页  设为首页  加入收藏  今天是:
网站首页幽默搞笑搞笑名字搞笑电影搞笑图片搞笑歌曲搞笑说说搞笑游戏搞笑诗句搞笑歇后语
相关文章
 每秒最高1w+使用量「AI绘画」…
 要和微信打擂台?抖音不弃社…
 内涵段子:搞笑幽默段子合集…
 搞笑内涵段子:停车墙 我就不…
 抖音上情侣聊天最刺激的几个…
 搞笑内涵段子:这次就是你太…
 搞笑内涵段子:一个我看了我…
 闷骚又贱的游戏名
 18款让玩家兴奋的绅士游戏盘…
 明星们的游戏名:林更新闷骚…
 贱人的名字(贱人的名字叫什…
 网络手游游戏排行榜2021前十…
 任重家装修简单“逗比”气质…
 逗比小萝莉:小女孩们换上不…
 胡歌睡衣写真曝光非常逗比网…
 可爱到不行的搞怪小头像
 逗比可爱的动物图片让你笑个…
 考考你:6个趣味歇后语你知道…
 经典歇后语
 立秋节气的谚语 立秋节气的谚…
 歇后语+谚语流传千古的经典名…
 12条妙趣横生的经典歇后语幽…
 2022年度歌单什么都知道
 不是专业歌手却频出单曲肖战…
 华晨宇的歌真的很绝真正的在…
 一首沙雕歌的诞生需要多长的…
 有哪些比较沙雕的歌?
 单机第一人称射击游戏排行 单…
 好玩的单机手游推荐排行榜 有…
 一个人也能玩得尽兴的单机游…
 有哪些好玩的单机手游推荐 五…
 2023十大必玩游戏 适合一个人…
 勒布朗·詹姆斯在即将上映的…
 5部温馨搞笑的电影适合放假看
 电影《遗嘱囧事》上线  赵菁…
 影视丨喜剧片《交换人生》定…
 电影《交换人生》定档大年初…
 【古诗词】历史上那些有趣的…
 倾听青未了|每一首诗都是重…
 解惑丨如何理解古诗文中的植…
 语文老师熬夜整理:基础知识…
 天盛长歌花絮依偎夫妇片场自…
 @沙湾人 “12340”来电请你为…
 让人瞬间点赞的人生哲理文案
 点赞率超高的搞笑句子极品幽…
 朋友圈还有人给你点赞吗
 2首耐人寻味的趣味古诗幽默又…
 2020年度十大网络小说元尊斩…
 【中国网络小说好看榜】经典…
 红遍大江南北的20部经典网络…
专题栏目
网络
您现在的位置: 搞笑分享网 >> 搞笑说说 >> 正文
高级搜索
每秒最高1w+使用量「AI绘画」成抖音年度爆款背后技术秘籍现已公开
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/1/13 6:31:32 | 【字体:

  就去干小说「AI绘画」是2022年抖音上最火的一款特效玩法,用户只要输入一张图片,AI就会根据图片生成一张动漫风格的图片。

  由于生成的图片效果带有一定的“盲盒”属性 ,画风精致唯美中又带着些许的蠢萌和无厘头,一经上线就激发了广大用户的参与热情,抖音单日投稿量最高达724w,还衍生了“如何驯服AI”、“谁来为我发声”等讨论分享。

  据抖音「AI绘画」特效主页显示,已经有2758.3万用户使用过这款特效。

  作为抖音SSS级的大爆款特效,「AI绘画」的峰值QPS(每秒请求量)也高达1.4w的惊人水平,如何保证用户的实时体验,对技术链路提出了极高的挑战,抖音又是怎样做到的呢?

  带着这样的疑问,我们和「AI绘画」背后的项目团队——抖音特效、字节跳动智能创作团队聊了聊。

  抖音特效对AI技术有过很多应用实践,2021年的「漫画脸」特效也是一款上线天千万投稿的爆款,使用的是GAN技术。

  这是由文本生成图片/视频/3D等跨模态的生成技术,具体地说,是通过大规模数据的训练,仅通过文字或少量其他低成本的信息引导,可控地生成任意场景的图片/视频/3D等内容,在AIGC等方向有极大的潜在应用价值。

  据了解,随着DALL·E的问世,2021年初字节跳动智能创作团队就开始了相关技术的跟进和规划,今年8月底Stable Diffusion发布后,抖音特效团队很快启动了「AI绘画」这个项目。

  Stable Diffusion是一个文本生成图像的多模态生成模型,相比于GAN,Stable Diffusion的多样性和风格化会更强,变化的形式也更丰富,同一个模型可以做很多不同的风格。同时,后者对性能和计算资源要求大幅下降,其自身开源的属性,还可以进行各种fine tune,调用和修改。

  Stable Diffusion的逻辑是,用一个图像对应一个文本标注的形式去训练模型,一个“文本+图像”组成一个数据对,先对其中的图像通过高斯分布进行加噪,加完噪声之后,再训练一个网络去对它进行去噪,让模型可以根据噪声再还原出一个新的图像。

  为了能够使用文字控制模型生成的内容,Stable Diffusion使用了预训练的CLIP模型来引导生成结果。

  CLIP模型使用了大量的文字和图片对训练,能够衡量任意图片和文本之间的相关性。在前向生成图片的过程中,模型除了要去噪以外,还需要让图片在CLIP的文本特征引导下去生成。这样在不断生成过程中,输出结果就会越来越接近给定的文字描述。

  抖音「AI绘画」是采用图片生成图片的策略,首先对图片进行加噪,然后再用训练好的文生图模型在文本的引导下去噪。

  作为技术支持方,字节跳动智能创作团队在Stable Diffusion开源模型的基础上,构建了数据量达十亿规模的数据集,训练出两个模型,一个是通用型的模型Diffusion Model,可以生成如油画、水墨画风格的图片;另外一个是动漫风格的Diffusion Model模型。

  漫画风格模型是采用“漫画图像+文本”的数据对进行训练。为了让动漫风格模型生成的效果更好更丰富,字节跳动智能创作团队在动漫风格模型优化训练的数据集里特别加入了赛博朋克和像素风等不同风格的数据。

  抖音特效在动漫风格上有过比较丰富的探索,观测了此前用户对不同风格的反馈,抖音「AI绘画」此次选用的就是精致漫画风的动漫风格。

  在算法侧调优的同时,字节跳动智能创作团队为抖音特效产品侧提供了文本的接口prompt,方便产品侧对效果进行进一步的微调,通过输入文字,让生成的图片效果更加贴近于期望中的样子——风格化程度“不会特别萌、跟原图有一定相似度,但又不会特别写实”。

  此外,模型还同时采用正向、负向文本引导生成的策略。除了描述生成图像内容、风格的正向条件外,还通过负向引导词(negative prompt)优化模型生成结果。通过在生成效果、生成内容等方面进行约束,可有效提升模型在图像细节上的生成质量, 并大大降低生成图像涵盖暴力、等敏感内容的风险。

  首先,基于图像理解基础能力,对用户图像进行场景分类,如人像、宠物、后置场景等,对包含人像的场景,进一步对性别、人数、年龄等属性进行检测。对于不同的细分场景,均有多组优化的风格效果作为候选。在模型选择上,90%的人像及50%的后置场景使用漫画模型,其他则使用包含艺术风格的通常模型。此外,部分场景还以一定概率出现彩蛋效果,如人像性别反转等效果。

  相比于传统的生成模型(GAN),扩散模型(Stable Diffusion)的模型体积和计算量更为庞大,AI绘画需要一个耗时繁重的推理过程。

  上线到抖音这样一个亿级DAU的平台,对技术服务侧而言,无论是显存的占用,还是从GPU的推理耗时都较高,且面临峰值过万的 QPS 。

  为缓解线上GPU资源消耗,字节跳动智能创作团队研发了Diffusion Model加速算法、采样步数减少算法、高效模型图融合技术、服务端推理部署框架等,并与NVIDIA技术团队协同合作,优化高性能神经网络推理库,对AI绘画模型进行了多个维度上的推理优化。

  上述一系列优化方案显著降低推理耗时、显存占用以及加大服务端部署框架的数据吞吐,相对于基准模型QPS提升4倍以上,节约数万块推理GPU消耗,保障道具在抖音平台高峰期的高效稳定运转。

  无分类器引导扩散模型最近已被证明在高分辨率图像生成方面非常有效,然而这种模型存在一个缺陷是它们在进行单步图像生成时需要进行两次模型推理,使得图像生成的成本非常昂贵。

  为了解决这个问题,字节跳动智能创作团队提出了一种针对无分类器引导扩散模型的蒸馏算法AutoML-GFD(AutoML Guidance-Fusion Distillation),通过知识蒸馏的方式将条件引导信息和无条件信息进行知识融合,减少了模型在进行单步图像生成时的推理次数和资源需求。

  同时,在蒸馏过程中把negative prompt, scale guidance信息蒸馏到模型中,在不改变模型推理输入的情况下达到更佳的效果;在Diffusion Model的训练和采样过程中,利用time-aware采样针对性地优化了重要时间步的效果,相对于基准模型可以进一步降低推理步数;蒸馏算法整体压测提升200%。

  在服务端侧,通过模型图融合、 高效CUDA算子、OFFload PreCompute、前后处理算子融合、多线程并发等手段,协同字节跳动自研Lighten推理引擎和Ivory视觉服务框架,解决了多段模型Convert Failed和显存溢出等问题,提升模型推理效率。

  火山引擎机器学习平台将推理速度提升3.47倍,抖音同款智能绘图产品已toB

  以Stable Diffusion为例,一次完整的预训练大约需要在 128 张 A100 计算卡上运行 25 天,用户付费上百万,高额的研发费用是用户最大的痛点之一。

  字节跳动旗下的云服务平台火山引擎为此类问题提供了解决方案,推动 AIGC 产业的发展。

  火山引擎机器学习平台打造同时支持训练加速与推理加速的自主研发高性能算子库,在全面提升 AI 计算性能的基础上,不断追求节省显存、简单适配,同时支持多款 GPU 卡,为客户带来更多低成本、便捷的部署方案。

  在客户 AI 视频创作的 AIGC 推理业务实践中,火山引擎高性能算子库搭载客户的推理模型帮助其推理性能提升一倍,GPU 资源使用量减少一半,可为客户节省 50% 成本。

  在训练场景下,使用该高性能算子库可将上文 Stable Diffusion 模型在 128 张 A100 的训练时间从 25 天减少到 15 天,训练性能提升 40%。

  同时,由于 AIGC 模型在训练时占用 GPU 显存容量非常大,未经优化时的模型只能运行在最高端的 A100 80GB GPU 卡上。火山引擎高性能算子库通过大量消减中间操作,将运行时 GPU 显存占用量降低 50%,使得大多数模型可从 A100 迁移到成本更低的 V100 或 A30 等 GPU 卡上运行,摆脱特定计算卡的限制,而且不需要做额外的模型转换工作。

  以此,以 AIGC 场景为代表,无论是迭代速度,还是单次的训练成本,都有了显著的性能提升和成本节省。

  另外,火山引擎还面向企业客户推出了智能绘图产品,省去企业采集数据、训练模型和优化性能的时间和成本,可以快速接入业务,让企业拥有开箱即用、抖音同款的AI绘画能力。

搞笑说说录入:admin    责任编辑:admin 
  • 上一个搞笑说说:

  • 下一个搞笑说说: 没有了
  •  
     栏目
    普通搞笑说说 每秒最高1w+使用量「AI绘画」成抖音年度爆款背… (01-13)
    普通搞笑说说 要和微信打擂台?抖音不弃社交梦背靠6亿日活上… (01-13)
    普通搞笑说说 @沙湾人 “12340”来电请你为沙湾点赞! (01-12)
    普通搞笑说说 让人瞬间点赞的人生哲理文案 (01-12)
    普通搞笑说说 点赞率超高的搞笑句子极品幽默笑到岔气! (01-12)
    普通搞笑说说 朋友圈还有人给你点赞吗 (01-12)
    普通搞笑说说 2首耐人寻味的趣味古诗幽默又有才让人拍案称奇 (01-12)
    普通搞笑说说 抖音搞笑短视频小合集不笑你打我 搞笑 (01-12)
    普通搞笑说说 看完这25条段子你不笑算我输 (01-12)
    普通搞笑说说 抖音网红冷少上百万赞搞笑视频集锦 搞笑 (01-12)
    普通搞笑说说 抖音最火爆的一句话冷笑话句句搞笑看懂都是聪… (01-12)
    普通搞笑说说 今年抖音最火的冷笑话经典幽默确定不看一下吗… (01-12)
    普通搞笑说说 2021雨天心情好的唯美句子 (01-11)
    普通搞笑说说 抖音幽默搞笑的说说句子文案 (01-11)
    普通搞笑说说 抖音幽默搞笑说说大全 (01-11)
    普通搞笑说说 抖音搞笑 说话请一次说全可以吗? 原创 (01-11)
    普通搞笑说说 十一国庆节要上班和加班的搞笑心情说说 国庆不… (01-11)
    普通搞笑说说 笑话之生活闲侃侃的很幽默笑话大全最新最好笑… (01-11)
    普通搞笑说说 搞笑段子:传递正能量你们看懂了吗! 搞笑 (01-11)
    普通搞笑说说 幽默笑话:那一刻让你怀疑自己脑袋进水了 (01-11)