我们至今仍未知道在人才流动性高度通畅的硅谷OpenAI是如何取得如此巨大的领先优势的。尽管谷歌、脸书和亚马逊都屯着人才、资金和资源,但它们仍无法与OpenAI相提并论。按估值计算,谷歌一年的利润足以收购OpenAI,然而OpenAI仍频频抢先。
目前,OpenAI似乎是离通用人工智能(AGI)最近的公司。其产品具有极高的通用性,就像许多经过精心调整的垂直模型声称能在某些特定领域击败GPT-4一样。这种定向刷分的行为固然有其事实根据,但最终体验来看,只有ChatGPT能够与用户进行全程自然对话。
我仍然认为Midjourney的图像生成艺术独步一时,但DALL·E-3显然与Midjourney这位画家的训练方向和目标不同。它更注重于文字逻辑,用简洁而准确的绘画展现AI对世界的理解,因此在生产力方面,它不如Midjourney有价值,但非常适合用于提升ChatGPT的能力。足够用了,而且经济实惠。
虽然还未使用Sora,但从目前情况看,它的通用性可能会是其优势。未来市场对于两步抽卡生成视频的模式可能会变得越来越狭窄——先抽卡生成图像,再转换为视频的方式容错率太低了——越来越多的AI视频产品也不再接受第三方图片,因为没有介入图片生成的过程,需要重新理解图片才能转换,这是一条错误的道路。
要么像Sora一样,直接合并抽卡步骤,使用文本逻辑一次性生成视频,保持低成本,必定能够建立起正向循环;要么像Midjourney一样,朝着封闭式生态的方向努力,发挥图像训练的优势延伸至视频领域。而Runway和Pika这类接受各种视频工具的平台,将面临巨大挑战,很难维持付费模式。
另外,字节跳动果断地将抖音的CEO调任剪映一职,这举动着实令人印象深刻。梁茹波在年度大会上才刚刚反省公司内部直到2023年才开始讨论GPT相关议题,没过几天,核心产品负责人就直接负责了一款工具产品,这样的执行效率在大公司中实属罕见。而Sora的强劲反应及时地证明了字节跳动并非无的放矢,其前瞻性表现十分出色。
2024年将会是精彩的一年。当然,英伟达也将继续取得胜利⋯⋯
- 请注意,下载的资源可能包含广告宣传。本站不对此提供任何担保,请用户自行甄别。
- 任何资源严禁网盘中解压缩,一经发现删除会员资格封禁IP,感谢配合。
- 压缩格式:支持 Zip、7z、Rar 等常见格式。请注意,下载后部分资源可能需要更改扩展名才能成功解压。
- 本站用户禁止分享任何违反国家法律规定的相关影像资料。
- 内容来源于网络,如若本站内容侵犯了原著者的合法权益,可联系我们进行处理,联系微信:a-000000
评论(0)