首页 > 板块 > 内容页

Runway ML将AI工具放在各地创作者的手中 全球今热点

2023-07-04 19:15:09 来源:互联网

机器学习对于创作者来说可能是一个很棒的工具,但是将AI集成到您的工作流程中对于那些无法编码的人来说是一项挑战。一个名为Runway ML的新计划旨在通过为艺术家,设计师,电影制作人和其他人提供机器学习应用程序的“应用程序商店”,只需点击几下即可激活这一过程。

假设您是预算的动画师,想要将人类演员的视频转换为3D模型。您可以使用Runway将一个名为“PosetNet”的神经网络应用于您的镜头,而不是雇用昂贵的动作捕捉设备,创建演员的线框模型,然后可以将其导出为动画。


(资料图片仅供参考)

一种简单的实验机器学习方法

或者说你需要在高预算的幻想电视剧中删除一个意外留下的咖啡杯。你可以用传统方式编辑它,手工绘制杯子,或者你可以通过机器学习分割模型运行你的镜头,它会自动突出显示每个框架中的不同对象,使你的工作更轻松。

像这样的例子只是Runway的冰山一角,联合创始人CristóbalValenzuela将其描述为极端平等主义的工具。“机器学习是一种非常独特的技术,”Valenzuela告诉The Verge。“但我想让事情更具包容性; 让不同背景的人围坐在桌子旁并使用这些模型。“

Runway开始作为巴伦苏埃拉在纽约大学Tisch艺术学院的论文项目。在获得AI艺术界的热烈反馈后,他决定将该计划纳入主流,要求两位学校的朋友作为联合创始人加入,并从纽约和硅谷支持者那里收集种子资金。该公司于去年12月成立,并在今年1月之后推出测试版。

巴伦苏埃拉横跨艺术和代码领域,并表示他希望将这两个世界联系起来,使非编码人员能够使用机器学习模型,从而将研究人员与直接受益于他们工作的人联系起来。

在Valenzuela去年五月写的博客文章中,他将当前的人工智能艺术场景与16和17世纪的绘画进行了比较。当时,简单地存储和使用油漆的行为是一种手工艺秘密,画家依赖于涉及猪的膀胱和绳子的深奥技术​​。但随着1841年漆管的发明,该工艺变得更加容易。在户外进行也更容易,从而产生新的风格和动作。

19世纪的画家皮埃尔 - 奥古斯特·雷诺阿告诉他的儿子:“没有颜色的管子,就没有塞尚,没有莫奈,没有希思黎或毕沙罗,没有什么记者被称为印象派。”换句话说:无障碍创造力。

但现代艺术家的“油漆管”是什么?Valenzuela提出了一个令人信服的论据,它可能是Runway - 或者至少是一个看起来很像它的程序。

在这种情况下,猪的膀胱阻碍了进步,这是目前使用机器学习模型所需的技能。这意味着学习使用像TensorFlow或PyTorch这样的软件; 这可能意味着购买一些昂贵的GPU(因为您当前的计算机不会运行这些系统),或者改为连接到AWS实例。这些任务都不是非编码人员所能达到的,但他们肯定需要时间并为用户制造瓶颈。相比之下,Runway的模型是完美的油漆管:只需点击即可。

该公司当然不是第一个让AI模型更易于使用的公司。但早期的例子 - 比如Lobe,它允许用户在被微软收购之前使用可视化界面训练AI系统 - 专注于商业用例,而不是创造性用例。

当您加载其商店前端时,Runway的目标市场是显而易见的,这使您可以浏览从文本生成到运动跟踪的各种模型。

单击以查看每个模型的详细信息,单击以将其添加到工作区,设置输入和输出,然后启动系统运行。有一些钩子可以将这些输出连接到其他应用程序(例如,您可以将ML处理的图像发送到Photoshop),用户只需几行代码就可以直接从GitHub导入新模型。

探索使用Runway ML以肖像和卧室风格生成图像的两个预训练生成对抗网络(或GAN)。

后一点是Runway最重要的一点。很难低估当前人工智能艺术场景的快节奏和协作能力,以及有多少人从彼此的工作和专业研究中获益。新型号一经发布,就会被各种意想不到的群众大肆宣传。

采用名为GPT-2的AI文本生成系统,由研究实验室OpenAI于2月份推出。自推出以来的几个月里,GPT-2已经变成了可访问的网络应用程序,它被用来帮助写一本小说,有人甚至创建了一个完全由聊天机器人填充的subreddit,模仿使用它的其他 subreddits。

简而言之:这是一个充满活力和充满活力的场景,而Runway希望尽可能地与它保持联系。Valenzuela表示,他的团队不断响应用户的反馈,为该计划添加新模型,并每月更新软件界面。

正是这种与社区的联系和更新的速度,他说这也将阻止跑道被行业的老牌玩家所侵占。“我们团队中只有四个人,”他说。“我们喜欢快速发货,让人们兴奋并让他们使用东西。”虽然像Adobe这样的企业巨头肯定对类似的AI应用程序很感兴趣,但将它们集成到产品中的速度必然会慢一些。

“我个人认为快速尝试一些模型很有用,” 最近在苏富比拍卖他的作品的人工智能艺术家Mario Klingemann说。他说,该计划对研讨会和课程特别有用,因为它允许教师在几分钟内启动并运行新的机器学习模型。

Klingemann也有保留。他告诉The Verge,该软件对于制作自己的艺术“太有限”,因为它只提供预训练模型。这意味着如果有人想要定制生成器系统的输出,比如生成对抗网络(GAN),他们就无法在自己的数据上训练它。Valenzuela表示,该功能将很快添加到程序中,同时能够将一个模型的输出用作另一个模型的输入。

罗比·巴拉特,另一个AI的艺术家是谁见着他与甘斯的工作,也称赞该方案,挑出其潜在的民主化AI艺术场景特别积极。

“如果跑道可以降低进入的障碍......我全力以赴。”

“现在,对于在谷歌工作的富有科技兄弟来说,这是最容易的,去了一个花哨的计算机科学学校,并且可以在工作中使用巨大的GPU集群来制作带有神经网络的艺术品,”Barrat告诉The Verge。“如果Runway可以降低进入的门槛,让更多样化的人群轻松地用人工智能创造艺术,我就是全力以赴。”

但巴拉特同意该计划的简单性是一个限制因素。他说,想要使用人工智能做的不仅仅是简化他们流程中现有步骤的人需要比跑道更强大的程序。“无论它作为一种工具有多好,代码的人仍然能够制作更大范围的东西,并最终能够更好地控制他们的产品。”

Barrat和Klingemann还表示,在跑道上训练ML模型时,价格是一个潜在的问题。该软件可免费下载,并附带10美元的云信用额,这足以让人了解其潜力。但在那之后,每分钟计算费用为5美分。对于像Klingemann和Barrat这样需要培训他们自己的模型的艺术家来说,购买他们自己的GPU或连接到云服务可能更便宜。“我不确定它在经济上对我有意义,”克林格曼说。

但是说Runway并不适合所有用户,这几乎不是一个巨大的批评。当他们的瑞士军刀不能用来挖沟时,没有人会感到惊讶。对于Valenzuela来说,主要任务不是迎合专业人士; 它正在扩大人工智能世界的边界。

“这些技术将彻底改变我们创建内容的方式,因为算法以与我们相同的方式理解文本,视频和声音,”他说。“如果我们把这些工具交给那些以前从未访问过这些工具的人,他们就会开始考虑使用它们的新方法。”

关键词:
x 广告
x 广告