关闭

女兔帮

6000个单词超详细评论!分析AIGC City促进MV生产的完整过程和对“ AI You Nanjing”的分析

更新时间:2025-02-14 02:18:24 浏览:

平台友情提醒:凡是以各种理由向你收取费用,均有骗子嫌疑,请提高警惕,不要轻易支付。

6000个单词超详细评论!分析 City促进MV生产的完整过程和对“ AI You ”的分析

在五月天之前,我们与中国江苏网络携手使用AIGC技术来创建 City宣传视频 - “ Ai You,”。

‍ MV在广播后得到了很好的回应,视频帐户上的喜欢和评论非常热情,并且在的列表中也排名第四。

我的官方帐户已经编写了AIGC内容已有一年多了,我累积了100多种原始文章。在这种持续学习和探索的过程中,我对AI的理解也从最初的好奇心变成了震惊,然后逐渐平静下来。尽管我仍然每天都受到各种新兴技术的影响,但我会越来越多地考虑AI可以为我们做什么以及在现实生活中可以实施哪些应用程序。今天,我将回顾音乐MV“ Ai You,”的整个生产过程,希望为所有人提供一些帮助。

这部电影的灵感来自中央母亲的“爱我中国”。从AIGC的角度来看,它显示了一个熟悉但有些不同的中国。因此,我们还希望根据这个想法向富裕的人展示。 是六王朝的古老首都,其中包含历史和文化遗产。

首先,这种“熟悉度”是必须的。您不能完全依靠AI的狂野想象力来绘制人们根本不知道的。因此,我们必须找到一种复制南京中现有元素的方法,即使不能恢复100%的差异,我们还需要使用一些标签和概念来使人们在看到它时立即思考。然后,这部电影应该反映出一些“不同的”,因为如果您只是重现了一些场景,那与当场拍照的传统拍摄过程没有什么不同。因此,我们必须根据反映地标。想像力。

有了这个想法之后,我定义了一个具有完整AIGC流程的 City促销视频,**程度地减少了手动直接修改,并指示AI通过提示和命令创建,以查看最终可以达到的工作水平。

#01

文案写作

一开始,我们计划使用叙事制作这部电影,类似于“舌头上的中国”的感觉,该电影对文案的要求相对较高。

但是,如果您直接要求GPT编写此副本,那么它给出的结果将相对乏味,因为它不知道编写此文本的原因和后果,也不知道您的偏好和拍摄风格,因此您想获得一个因此,我们需要使要求更具体。

因此,我使用360浏览器的字幕提取功能来捕获“爱我中国”的视频副本。

接下来,让Kimi和GPT分别分析和学习,这是使AI能够按照我们的期望写作的好方法。这不是一个简单的模仿,而是了解目标的写作风格并将其集成到目标中。

基米

当我编写文案写作时,我通常会同时打开两个Kimi和GPT的窗口,以比较他们的结果。我发现Kimi的表现在中文的理解和写作技巧方面更为突出。毕竟,这是一个国内大型模型,本地化将是我们的**优势。

完成文案分析后,我们可以让AI以这种样式编写,并且这次创建的手稿比一开始的手稿要好得多。这两个AI作品具有自己的优势,因此我决定进行一些调整并整合这两个部分。

基米

在调整阶段,我们必须首先使文案写作更易于阅读,因此我选择了一些句子以分别修改。例如,“中山的风和雨是黄色的,江南美丽的土地以及六王朝的金色和粉红色的首都”有点押韵,所以在我的提示下,吉米将其更改为“风中山的雨水是黄色的,古老的资本仍然很长,云仍然在梦中。毕竟,对于不是作家或诗人的普通百姓,仍然很难如此迅速地达到这一水平。

编写文案写作后,AI可以输出一个简单的屏幕故事板,这使我们可以看到更直观的概念。

很多时候,从1到2比0到1要容易得多。

基米

#02

歌词创作

为了实现这一目标,下一步是对朗诵进行配音,以确定视频的持续时间和故事板的数量。但是,在尝试了一些预设的AI声音之后,我发现这种效果仍然很难实现现实生活中评论的情绪上升。我认为使用AI纯粹的解释风格朗诵仍然有些沉闷。

碰巧的是,Suno的最近出现给音乐圈带来了极大的震惊,所以我考虑了一下,只是为写一首歌,然后为歌曲创建MV,以便整个音频语言级别会更富有。

因此,我直接复制了我之前写给AI的文本,并让它重写歌词并命名歌曲。您还可以添加歌词样式和时间长度的定义,以给它一些方向。

基米

与两者相比,这次我更喜欢GPT写的歌词,因为我可能想结合一些现代歌曲风格,例如说唱或R&B。 Kimi所写的单词整齐地匹配,并且往往更传统,并且可能不适合现代风格。

经过一些修改后,我完成了GPT撰写的此版本的歌词的歌词。

在远古时代仍然存在摇摆的风和雨水。中山的风和雨正在上升,六王朝的金色粉红色灵魂。龙盘绕在地面上,文学风格是浪漫的。梦想开始的地方,南京的故事即将走。

漫步在历史悠久的走廊上,触摸了吉尼亚之夜的时间痕迹,灯光反映了繁荣。孔子庙的古老梦想已经很长,儒家押韵已经过去了,而且几年来一直在石城的浪潮中传下来。

在紫色金山的顶部,绿色的竹子和绿色的松树,观看古老而年轻的城市。梅山陵墓的石头大象是守卫的,中华大门的城墙是雄伟的,湖的蓝色波浪是涟漪,紫色的山峰是五颜六色的云,星系是星系。一座桥贯穿北部和南部,一个城市繁荣,反映了山脉和河流。

,喜欢您的每个砖块和您的每个瓷砖,南京,南京都喜欢您的每座山和每一条水,南京,南京都喜欢你的每一个日落和黎明。南京,你是我的诗,我的距离。

#03

歌曲创作

对于歌曲创作,我使用最近受欢迎的Suno。 ()

我们可以欣赏其他人制作的音乐,或者我们可以选择自己喜欢的风格在这里创建它。

在创意部分中,我们可以直接通过迅速单词创建纯音乐。

每个创作都可以产生两首歌曲,消耗10分。该网站每天都有50分的赠品,您可以免费创作10首歌曲。

持续时间为两分钟,您也可以将其扩展。如果您认为这首歌很好,可以下载它。

听着它,很难想象一个根本不了解音乐理论的人,这可以在一分钟内创建这种水平的音乐。

除了纯音乐外,我们还可以创作带有歌词的歌曲。选择自定义模式,您可以在此处填写歌词,歌曲样式和主题。只需为模型版本选择最新的V3即可。

但是,简单地输入歌词还不足以写一首好歌。因为一首美丽的歌曲也需要分为许多不同的层次,所以它可能会有节奏的变化,主要和小钥匙,旋律结构,和弦进行等。我们需要使用AI来创作更丰富的歌曲。我们还需要理解这些基本概念以更好地命令AI。

在这里,我们回到GPT,让它帮助我们将歌词与前奏,合唱,主歌,情节和结局的结构分开。

然后,我们可以将分开的歌词放入Suno中,并使用迅速的单词“中国风格,古季的配乐,以及R&B元素”编写。

看完十二首歌曲后,我选择了这首歌作为歌曲“ Ai You,”。由于时间只有两分钟,而且歌曲还没有完成,所以我再次扩展了这首歌。经过几次重复选择后,我将选定的扩展部分和编辑中的原始歌曲结合在一起,最后我们的歌曲完成了。

#04

故事板的创作

创建歌曲后,您必须为视频提供故事板脚本,但是这个故事板脚本与真实电影和电视拍摄中的故事板不同。电影和电视中的故事板为拍摄提供了基础,是剧本和实际拍摄之间的桥梁。但是,由于AI视频制作的特殊性,我们实际上没有实际拍摄过程,而是通过图像生成直接生成视频,因此我们的故事板直接决定了最终视频演示效果的质量。

现在,我们需要根据音乐生成图片。我将图像生成分为三个主要类别:一个是歌词的一部分,我打算将其用于生成,其图片美是**的;第二类是没有歌词的部分,例如持续20秒的前奏。在这里,我计划使用SD在南京的12个地区创建字体设计,包括主要标题的设计;第三类是过渡,例如当主歌曲进入合唱时,有必要使相机感觉更加设计,因此我选择使用它。

尽管我有歌词,但我仍然需要一些特定的图片描述,因此,接下来,我要求GPT帮助我根据每个歌词生成一系列MJ及时的单词。

当然,这些及时的单词只是一般图片参考,我们仍然需要调整和编写它们。

例如,一开始的歌词没有得到反映,因此我们需要自己想象它们。当我创作这首歌时,我考虑过整合古兴的传统乐器,因此,一开始,我考虑了通过一个玩古兴的女人介绍它。

为了增加神秘主义,我希望图片的开始是女人的背景,然后摄像机慢慢拉进去。

6000个单词超详细评论!分析AIGC City促进MV生产的完整过程和对“ AI You Nanjing”的分析(图1)

但是,在MJ图片中,尽管绘制了脸上的那个女人,但古本()的位置总是错的,甚至奇怪的是篮板的姿势。

因此,我计划在曲线中保存该国,并首先使用对语义最准确的Dall·E3来绘制所需的构图。

然后,我使用垫子图将其提供给MJ,并绘制了我想要的构图。

接下来,需要特写和特写开关。为了保持角色和音调一致,SREF和CREF的命令用于统一样式。

手上弹钢琴的特写镜头不能仅使用提示单词来获得。同样的填充方法用于生成,但由于时间长度,因此在稍后没有将其放入主膜中。

主电影中的图片可以根据歌词的一般含义输出。由于毕竟它是由AI生成的,因此不可能完美地重现中的地标景点,因此我尝试仅使用本地或一些有意的图片来表达它们。

它可以使人们在南京()中感受到并关联一些景点和文化符号,但并不是那么简单。这应该是AI表达式和视频拍摄之间的区别。

#05

字体设计

接下来是南京12个主要地区的名称的设计。这最初是故事板的一部分,但是由于确实花了很多时间来生产它,因此可以单独解释。

本部分使用的主要工具是它具有强大的控制功能,并且可以根据我们提供的文本大纲根据图片样式进行设计。

在这里,我们准备了要制作的所有字体的平坦图像,该平面图将决定我们的最终组成。我通常喜欢使用带有黑色背景和白色字符的图片,因为其中的深度模型将识别为白色的前景,这将有助于我们突出我们的文本。

我们可以将图片放在其中。我通常使用Canny来控制线,深度来控制深度关系,融合学位和IP控制图片样式。当然,这些控件不需要同时使用,而是通过您对图像的概念选择和权衡,同时通过权重影响控制程度。

初步准备工作完成后,我们必须开始怀孕每张图片。南京的每个地区都有自己的特征。 地区的湖泊和山脉是互补的,桨和灯光是,贾安耶地区的高层建筑物雄伟壮观,古鲁地区的齐芬尤伊( Yue)是河流充满光和阴影Qixia区的红叶,地区的烈士公墓是庄严而庄严的,江宁地区的湖泊成熟稻田是滚动的金浪,普库地区的珍珠清晰而美丽,是shi of shi of shi of shi of shi of shi of shi of shi''区域丰富多彩,的林区山脉和河流都覆盖着绿色山脉,高兴区的深巷是蓝色砖块和灰色瓷砖,而新区的科学与技术创新基地则聪明地领导着未来。

结合了这些不同的功能,我们需要选择不同的大型模型,为图片制作不同的描述性词,然后选择匹配不同的lora进行精细调整。

例如,我希望这个词来自江宁,我希望这个词出现在领域中,因此我使用了与和自然界相关的4个Lora,将其与及时的单词结合输出,并将Seg和Depth使用到领域。融合。

正式提示单词:,无人机低顶视图((倒及**,**,湖泊,湖泊,清除,植物:1.5),形式,(射击角度:1.5),(无房子,否:1.5), ,特写,景点,奖,索尼Fe GM,Ultra Hd。,,,,,

但是,有些场景可能不一定有相应的洛拉,例如liuhe的场景。 Liuhe是Yuhua Stone的家乡,但是外国大型模型中没有Yuhua Stone的元素,因此我使用IP到Pad图片,从而将Yuhua Stone的元素集成到图片中。

向前及时的单词:,无人机低顶视图,形式(在透明的水,水草,:1.2)中的字体,:1.2),,特写,景深,奖励 - 索尼Fe GM,sony fe gm,ultra hd。 ,,,,,,,

我不会一一分析12个领域。 AI字符主要需要了解单词和图像之间的关系,以找到最合适的参数。以下是完整的12区字体设计。

#06

视频制作

视频制作中使用的主要工具是。 ()

最神奇的是,它可以对我们的图片视频进行更详细的控制,例如控制镜头的运动。

通过推动镜头,感觉就像您在现场一样。

我们还可以控制屏幕元素通过刷子的运动,以便可以根据需要进行镜头的方向。

这将创建一张船穿过河流和乌云在空中流动的图片。

通过这些方法的结合应用,我们需要将所有故事板变成动态视频。当然,考虑到最终视频的连接,您应该考虑上镜头和下镜头之间的运动关系。

#07

转移生产

这部电影的过渡主要使用SD,这是去年非常受欢迎的即时宇宙效应。它可以通过图片的连续迭代来完成从一个图像到另一个图像的过渡。

例如,在下面的过渡中,我们慢慢将相机从桌子上散布的书中推开。当我们接近这本书时,我们将相机倒下并输入书,以带领的旅程。

我们可以在其中设置初始图片。

然后通过键入镜头运动来控制相机的进度。例如,我希望镜头在一开始就可以先进,所以前30帧是Z轴的向前移动。从40帧到书籍,然后将有一个3D翻转X的远值。依此类推,该工具的困难是所有控件都是数字的,因此您需要想象大脑中镜头的运动,然后将其模拟成数值并将其写入。这**不可能保持一致,因此需要持续的测试和调整。

然后,您还需要使用及时的单词来确定不同帧处图中图片的变化,以便在输入书籍后将图片变成城市建筑物。

另一个用途是在两张图片之间进行过渡。这种时间和航天飞机感觉很棒。

我们可以将两个图片的地址放在指南图像中,以实现中间过渡框架的更改。

当然,当使用整个宇宙的工作流程时,中间的过渡图像框架是无法控制的。例如,在处理 的过渡场景时,Sony徽标不断出现在中间的建筑物上。我认为这可能是因为我的及时词使用“索尼相机拍摄”的描述。

因此,我只能变成肝皇帝,将视频导入PS,然后逐帧修复,以使图片最终并不是。

#08

高分放大

视频剪辑完成后,有些图片的分辨率不是很高,或者帧速率不高,这会使它们看起来非常口吃,因此我引入了视频高分辨率放大的过程。

使用Topaz视频AI扩大视频的分辨率,您也可以将30FPS变成60fps,使视频更加顺畅。

#09

编辑和合成

因此,这些材料都准备就绪,下一步是在剑屏上合成它们。

根据音乐节奏将视频剪辑放置。切换镜头时,您必须卡在鼓节拍或口音上。您可以在编辑中添加一些预设效果,以使整个视频更加顺畅。最后添加字幕并渲染输出。

在这一点上,使用AIGC工作流程“ Ai You,”的整个城市促销MV已经完成。尽管我想使用AI在一开始就完成所有工作,但最终人类的链接是不可避免的。创造并不容易,在做时思考,我对AIGC有了更深入的了解。

我要感谢新华社日报和中国江苏网络的信任的信任,以便这部电影可以在省级媒体上出版,我还要感谢大家对这部电影的认可和爱。

最后,我对AIGC创建有一些想法。客观地说,这部电影还不够精致,音乐是有缺陷的,并且图片有很多事情可以更好。但是,作为一项新兴技术,我们自去年以来一直在目睹它的迅速发展,似乎钦佩的声音永远不会停止。

“世界上的一天,世界上的一天。”在这个圈子里,人们经常这样叹息。如果您一年前阅读了AIGC生产的内容,并查看图像,音乐和视频的出现,那么您可以理解为什么我们对AIGC的前景如此乐观,并且它取得了太快的进步。我什至无法想象在五年甚至十年内将世界变成什么世界。

以前,人与人工智能之间存在许多敌对的情绪,但是目前,AI绝不是替代某种工作类型的工作,它的存在是为了帮助我们更有效地实现目标。我们的世界仍然需要作家,音乐家,画家,设计师,导演,摄影,程序员,我们需要真正的人来攀登各行各业的顶端,这是AIGC现在无法做的事情。

但是,我们不仅要看好工作的结果,而且还要看过程。 AIGC可以允许一个不了解音乐创作的人在十分钟内创造超过70分的歌曲,而AIGC可以允许仅几个人组成的团队在短短几天内完成,这可能需要一个月前。 AIGC可以使一个人在完成的视频中值得数千名部队。

这就是我们如此相信AI的原因。多于。

你可能感兴趣的