11月末,AI聊天工具ChatGPT全网刷屏,推出仅5天就有了100万用户,每个人都想和它聊上几句,测测它的“智力”。ChatGPT的大热,也让AIGC站上了风口。
而这并非偶然。2021年以来,WEB3.0和元宇宙为人们描绘了一幅充满想象的画卷,在那个无比繁荣的世界里有着丰富的内容供人们消费。时代更迭,飞速增长的内容消费需求与UGC(用户生产内容)、PGC(专业生产内容)的生成方式逐渐难以匹配,通过AI技术自动生成内容成为新的方向。
AIGC开启新纪元
“AIGC真正火起来是从今年8月,Stability AI发布了开源的Stable Diffusion(深度学习文生图模型),在行业内引发了很大反响,而后11月末OpenAI的Chat GPT出来,AIGC达到了一个井喷的阶段。”北京白海科技有限公司(以下简称白海科技)创始人兼CEO卢亿雷说道。
白海科技创始人兼CEO卢亿雷
和许多新兴技术一样,AIGC目前还在发展的前期阶段,业界对其普遍理解为,AIGC是继UGC和PGC之后,利用人工智能技术自动生成内容的新型生产方式。其本质是通过AI技术创造出更多全新的作品,帮助内容相关的行业发展。
在卢亿雷看来,目前AIGC在技术上有一定的成熟度,AI做画和文本回答效果都比以前提高了很多。在AIGC文生图领域,2022年扩散模型(Diffusion Model)的出现是一个突破节点。
从时间线上看,2014年提出的GAN模型(生成对抗网络)难训练,不稳定,对输出结果的控制力较弱。到了2021年,OpenAI将Clip模型开源,该模型可以同时进行自然语言理解和计算机视觉分析,将图片和文字进行关联,资料显示CLIP模型搜集了网络上超过40亿个“文本-图像”训练数据,这为AI绘画奠定了数据基础。随后2022年的扩散模型将计算空间降维,极大降低了计算量和计算时间,提升了模型的训练效率,生成的图像质量更高。
从商业化角度看,目前AIGC的应用场景主要集中在文本生成、图像生成、音视频生成等领域,其中ChatGPT的文本问答已接近商用水平。但显然,AIGC的商业化之路还存在很多问题。
首先是不可控。以AI画作《太空歌剧院》为例,这幅画在美术比赛上拔得头筹惊艳四座,但背后生成了900多个版本,耗费80多个小时,才得到最终的作品。该画基于扩散模型生成,作为潜在变量模型,扩散模型赋予了AIGC开放性的创造力,但可控性仍不尽如人意,无法限制在一个具体的预期里,这对商业化会带来很多问题。
其次,算力也是限制AIGC发展的问题之一。算力即权力,AIGC的运行对算力要求很高,中小公司难以负担高昂的算力成本。此外,在素材获取上,如果没有足够多的素材也难有好的效果。目前AIGC还是辅助性的,无论是画图还是生成文章,难以保证高质量,同时素材存在版权风险,比如企业用AIGC生成的海报并不能直接使用,对外发布前还需要再调整。
即便如此,AIGC作为当下最炙手可热的赛道,无论对于创业公司还是资本市场都还有很多机会。那么一款出色的AIGC产品应该是什么样的?
白海科技的AIGC方法论
卢亿雷表示,一款成熟的AIGC产品,第一要基本满足预期效果,至少达到80%以上的预期。第二是成本问题,比如生成一张图的成本要足够低。第三应具备可控性,比如客户希望做的Logo为纯色底色、居中显示,但基于目前的很多AIGC工具生成的是随机效果,没办法实现这些条件。
作为新一代云原生AI基础软件服务商,白海科技立足易用和降本增效的核心需求,致力于帮助开发者和中小企业快速应用AIGC的能力,包括模型优化、模型部署、功能化等,解决AI落地过程中的效率、性能、成本等问题。
“虽然目前已有较多优秀的AIGC开源大模型,但实际应用落地还是挺麻烦的,我们希望把AIGC做到极简,将使用门槛降到足够低,同时开发出一些易用的工具,让普通人或者设计师可以快速上手,在短时间内把半成品转化为成品。我们相当于把前面的坑填好,让他们不用做太多的配置和研发,无需从零搭建平台就可以快速用起来,构建个性化的AIGC模型和应用。”
媒体机构是白海科技在AIGC领域的主要服务对象,比如帮助企业加速生成海报和Logo。卢亿雷称,白海科技的首要目的是把工具做得足够简单,通过SaaS产品让中小公司体验到AIGC的能力。我们做的AI开发生产平台IDP(Intelligent Development Platform),就是为了让数据科学家、算法工程师快速构建所需模型,综合来看,工作效率能提升40%以上。
在IDP平台的构建上,白海科技依据开发差异式和按需使用的理念,用户需要什么组件就接什么组件。“我们做的是差异式解决方案,而非一条解决方案,同时我们的IDE(Integrated Development Environment)是纯自研并且开源的,工程师可以应用自己的其他组件。”
站在巨人的肩膀,做自己更擅长的事
说到开源,卢亿雷表示,如果没有Stable Diffusion的开源,现在AIGC可能也没这么火。大家都是站在巨人的肩膀上,做自己更擅长的事情,这样生态才会更加繁荣。白海科技将IDP平台定位为中间件也正是基于这个理念,不做整体解决方案,而是基于中间层把大模型的平台包括工具做得足够完善,让应用者快速使用AIGC技术。
同时,白海科技在底层做了很多调度优化和计算引擎,降低计算资源的使用成本,提高了AI从开发训练到生产整个过程的效率。
随着AIGC的创作能力走向成熟,一些人开始担心人类的工作是否会被AIGC取代?对此卢亿雷认为,重复性劳动越多的行业受到的影响越大,像做个Logo和海报这种初级创意,以及普通问答式的客服,比较容易被AIGC替代。虽然一些人可能面临失业风险,但同时可能会产生一个新职业,我们称为“Prompt工程师”,也就是专门写提示词的人,因为提示词写得好坏乃至先后顺序都会直接影响最后的生成效果。
在时代的洪流中,我们能做的是拥抱变化。若把AIGC看作一个工具为我所用,对其产生的内容做二次加工或者朝“Prompt工程师”发展,说不定反而会看见新的机会。
对于AIGC未来的发展趋势,卢亿雷认为,可控性是最大的发展趋势。其次,模型微调和模型训练成本还是太高,未来要在质量不下降的前提下提高性能。“AIGC的应用场景在未来一定是百花齐放的,除了文生图、文本聊天、写代码,还有更多的比如AIGC +制药,AIGC +游戏,AIGC+工业等等可能。”
目前白海科技的AIGC引擎也开放试用体验了,可以通过官网申请试用体验(https://baihai.co/aigc),仅通过几张图像即可快速训练自己专属的个性化文生图模型。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。