人工智能

内容生产背后的人工智能

2025China.cn   2023年03月17日

导语:过去几年涌现出的一系列人工智能技术,为内容生产提供了强大的工具。

漫步于卢浮宫无数画作中,你是否期待一位画师为你记录下独一无二的瞬间,给这个世界留下一份凝视与回眸?走进国家图书馆浩瀚书海中,你是否期待有人陪你一同探索世界?意外闯进J.K罗琳创建的魔法学校,你是否期待有人为你递上魔杖让所有平面之物跃然纸上?

随着不断迭代的算法和不断增强的算力,最新的人工智能技术正悄然将这一切变成现实,这些建立在数学基础上的抽象能力正成为人类拥有特殊技能的朋友,与我们共同追逐着未来的无限可能。

写实派画家——GAN

生成对抗网络(GAN/Generative Adversarial Networks)就像这个时代的写实派画家,这位画家的大脑和画笔就是Generator和Discriminator两个网络。在实际使用过程中,我们提供真实输入后,它会在Generator中生成假图片并在Discriminator中和真图做对比。起初,Discriminator很容易分辨真假图片。但随着Generator通过Discriminator的反馈不断优化生成的图片,分辨难度不断提升。最终,当Discriminator没办法分辨真假时,假图片就作为最终产物出现在了我们面前。

自诞生以来,生产对抗网络就在鸟类、花卉等图片的生成上不断展现出惊人的能力,而其生成的足以乱真的人脸照片和根据文本描述生成的照片,已经成为设计师必备的工具:前者可以作为素材库让设计师轻松积累素材,后者则能帮助设计师可以快速定向获取设计灵感来源。

印象派画家——VAE

除了“写实派画家”生成对抗网络,人工智能领域也有“印象派画家”——变分自编码器(VAE,Variational Auto-encoder)。不同于生成对抗网络,变分自编码器在获得输入时会先用“取色器”(编码器,encoder)提取画面的重要信息,并以此为核心拓展范围。例如,编码器取“红色”后会将该信息扩大到“红色系所有颜色”,再将这些扩大后的信息作为生成元素,举一反三生成更多新数据。

目前,这位AI时代的“梵高”已经在包括图像和音频合成等领域找到了施展空间。由于举一反三的属性,变分自编码器生成的新数据具有更好的扩展性和多样性,也更方便地设计师对这些数据做定向调整,从而将更符合预期的数据存入素材库作为灵感来源。

语言课代表——BERT

如同机器将图片依性质拆解为RGB等数值后才能理解图片一样,BERT(Bidirectional Encoder Representations from Transformer)也依据对文本的拆解在纷繁的语言世界中找到了梳理脉络、理解奥秘的方法。

我们可以将BERT理解为做英语试卷的考生,第一道题“MLM(MASKED LANGUAGE MODEL)”类似完形填空,我们给BERT的语料库会随机遮挡15%的词语,让BERT根据上下文猜测空缺部分从而训练其了解不同语境下的词语运用,进而更准确的对语义做出理解。第二道题“NSP(NEST SENTENCE PREDICTION)”会给到成组的句子,让BERT判断两个句子是否连续以及句子间的关系。有了这些基本能力后,我们只要增加输出层训练就能将BERT应用到不同场景。

目前,诞生不到五年的BERT已经可以和阅读理解、搜索与信息检索结合起来,帮助设计师将多轮对话等场景变成现实。除此之外,BERT还能利用其理解学习能力在长文本中提取出重点内容信息,让人们可以更高效地理解文本。

让二维变立体的神奇魔杖——NeRF

在更高维度上应用人工智能技术的努力从未停止,神经辐射场(NeRF,Neural Radiance Fields)的脱颖而出因此并不意外。神经辐射场能将图像分为3个空间位置向量和2个相机观测向量,在此基础上输出体密度(volume density,可以理解为透明度)和基于观测角度的物体空间点色彩,完成从“空间点位置+观测角度”到“空间点色彩+体密度”的映射。

在三维空间重建二维图像具有广阔应用前景。它能帮我们准确快速建立数字人体,从而成为数字人领域重要的建模工具;它也能运用到自动驾驶行业,让现实路况和虚拟情况实时融合,为自动驾驶提供天气和雨雪等场景数据,让设计师围绕人车交互进行更准确的设计思考。

技术从不抽象,它们总能直观地刺激我们的感官、激发我们的想象力。伴随着代码的迭代,技术终将以更加具象的形式成为我们的朋友。我们也将与它一同探索未知并阐述理解、思考艺术并定格瞬间,突破边界并一同走进那个虚实融合且酝酿着无数可能的“魔法世界”。

(达摩院DAMO)

标签:人工智能 我要反馈 
2023第七届世界智能大会报名
进博会专题
西克
专题报道
第七届世界智能大会专题
第七届世界智能大会专题

第七届世界智能大会拟于5月18日至21日召开,大会秉持“高端化、国际化、专业化、市场化”办会理念,主题为:“智行天下 能

魏德米勒电源解决方案
魏德米勒电源解决方案

5月20日14:00-16:00魏德米勒行业应用专家将为广大行用户带来具有高性价比、功能强大的创新电源产品,及高效电源解

海克斯康GLORY全新智能三坐标测量系统
海克斯康GLORY全新智能三坐标测量系统

全新一代桥式三坐标测量机,是依托于海克斯康创新型先进技术开发的新一代通用型测量机,涵盖主机、传感、控制系统、软件众多国际