IT天空资讯网 首页 互联网 查看内容

广发传媒 | 海外AI应用进展:技术持续突破,关注垂类应用场景与赋能

2024-4-10 14:45| 发布者: admin| 查看: 950| 评论: 0

摘要:   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!AI应用流量持续增长,投资端明星项目增加,市场主体对AI应用的重视程度有明显提升。大模型平台用户浏览量领先,且与其他品类有较为明 ...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

AI应用流量持续增长,投资端明星项目增加,市场主体对AI应用的重视程度有明显提升。大模型平台用户浏览量领先,且与其他品类有较为明显的领先优势。在应用端,不同生成难度的内容,其竞合格局和后续发展方向也已产生分化,商业化及模型与场景结合的能力是该类应用的短期核心竞争点。

 摘 要 

AI应用流量持续增长,投资端明星项目增加。流量上,AI相关应用流量持续增长。据Similarweb,ChatGPT 2024年2月访问量为16.3亿次,月环比增长1.05%;据Data.ai,2023年12月,AI相关应用的下载量达到9300万次,2023全年用户移动端下载总量达到8.1亿次,同比增长652%。据非凡产研,2023海外AIGC行业的融资活动呈现出明显的变化,一方面融资次数从2022年的274次下降至114次,下降58.4%。但明星项目获得的融资额度明显增加,带动全年融资金额从2022年的479.94亿元增长至2023年的1710.26亿元。在企业重视程度上,市场主体对AI应用的重视程度有明显提升。根据Rackspace及AWS,在AI技术对组织重要性的调查方面,2024年有81%的被调查者认为AI技术具备非常高的重要性,较2023年提升26pct。

大模型平台用户浏览量领先,应用端竞合格局分化。ChatGPT、Bing、Genmin等大模型平台占据2023年全球AIGC产品访问量的1、2、4名,且与其他品类有较为明显的领先优势。在应用端,不同生成难度的内容,其竞合格局和后续发展方向也已产生分化。在生成难度较低,开源模型成熟度较高的领域,主要是文生文和图片生成领域,模型本身的差异相对较小,对细分场景的把握,和重点应用的解决方案推出有望成为用户使用的核心理由。因此商业化及模型与场景结合的能力是该类应用的短期核心竞争点。在这方面,建议关注优质的垂类工具。国内建议关注在垂类领域持续深耕,对领域痛点有深度理解能力的厂商。在生成难度较高的领域,主要是视频生成等领域,优质模型在能力上具备较强壁垒。视频领域开源产品相对较少,模型本身是竞争核心。预计该类产品的短期核心是维持与其他模型的代际差距,形成市场认知,长期关注仍然是降低模型成本并寻求应用方向。

AI模型及应用发展迅速,海外应用在多个领域实现突破,模型能力逐步增强,后续建议关注应用与模型结合产生的C端突破。细分场景上,文本、图片、音乐均有应用爆款机会,建议积极关注具备AI模型能力和应用场景的公司。

模型迭代效果不及预期;算力发展不及预期;商业化落地不及预期;版权、伦理、内容质量的风险。

 正 文 

一、AI应用投入趋势增加,应用发展有望提速

AI应用端发展迅速,市场主体认可度提升。咨询机构Rackspace及AWS联合发布报告《The Impact of AI on Business》,该报告调查了1420位IT专业人士,地区分布在北美、欧洲、亚洲和中东,行业涉及金融、制造、零售、社服、医疗和政府部门。报告显示,市场主体对AI应用的重视程度在2024年有明显提升。其中在AI技术对组织重要性的调查方面,2024年有81%的被调查者认为AI技术具备非常高的重要性,较2023年提升26pct。

在生成式AI的应用展望上,有41%的被调查者已经开始研究相关技术,并在初步搭建模型,29%的被调查者已经逐步开始将AIGC技术应用于产品,在后续展望中,这部分比例还有提升,达到37%。AIGC在专业人士间的认可度持续提升。

AIGC应用流量持续增长,应用下载量与使用时长增加。以移动端为例,根据Data.ai,生成式人工智能应用于2022年11月起进入高速增长时期,其标志性事件是Chatgpt的推出。ChatGPT于2023年5月与7月相继推出iOS与Google Play的移动版,推动人工智能应用下载量持续提升。Data.ai估计2023年12月AI相关应用下载量达到9300万次,2023全年用户移动端下载总量达到8.1亿次,同比增长652%。

海外AIGC行业融资次数2023下降,但明星项目增加,推动融资总额增长。2023年,国外AIGC行业的融资活动次数明显下滑,从上一年的274次下降至114次,下降了58.4%。但明星项目显著增加,OpenAl、Anthropic、MosaicML等明星项目的出现的使得全年AI领域融资金额从2022年的479.94亿元增长至2023年的1710.26亿元。

在投资方向上,海外AIGC赛道融资Top15的企业涵盖了AI系统研发、通用人工智能、生成式AI工具等多个领域。明星项目OpenAI以719.3亿元人民币的累计融资金额位居榜首。该公司在B+轮融资中得到了老虎基金、Sequoia Capital、Andreessen Horowitz等多家知名投资方的支持,公司致力于通用人工智能技术的研发。Anthropic以495.0亿元人民币的融资金额位列第二,由Capital G进行股权投资,专注于AI系统的研发。德国企业Aleph Alpha以35.5亿元人民币的融资金额位列第六,得到了博世、Schwarz Group等多方支持,专注于AI系统的开发。

图像与设计、智慧搜索、聊天助手类别场景应用广泛。在2023年9月和12月全球AIGC应用分类Top50中,图片生成与编辑、智慧搜索、写作生成等AI类型的网站占比最高。在12月的统计中,围绕着图像的生成与编辑有11家,高于其他类目,反映了图像生成技术的成熟度提升,用户使用习惯逐步形成;智慧搜索大类有5家,得益于Bing等搜索引擎的创新,用户越来越倾向于使用能够理解复杂查询并提供精准结果的搜索工具。智慧搜索通过运用自然语言处理、机器学习和语义理解等技术,能够更好地理解用户的意图,根据用户的上下文和偏好提供更符合需求的搜索结果;AI聊天类别共有4家,显示出人们对于个人聊天和助手功能的旺盛需求。

根据Similarweb,ChatGPT占据全球AIGC产品访问量的榜首,2024年2月访问量为16.3亿次,较上月增加1.05%。流量榜的第二、三名Bing和Canva,分别为12.56亿和5.27亿次,在访问量环比变化上分别变动-7.64%和1.47%。

二、AI应用趋势:成熟体系商业落地,新兴领域持续突破

(一)AI+Chatbot:功能持续迭代,商业化进程起步

功能持续迭代,产品效果提升。从模型端的迭代来看,大模型的推理和理解能力迅速提升。以GPT-4和GPT3.5的对比为例,GPT-4在推理能力上明显有更好的表现。在SAT、GRE等通用考试中,GPT4均取得了较此前版本更好的性能表现。在功能端,GPT-4能更好的支持多模态,使AI可以更好的理解和生成文字、视频,图片、音乐等,大大提升了生成式AI的应用广度。我们预计,随着AI算法进步和输入语料的持续增加,AI大模型的逻辑推理能力还有望进一步强化。

AI+Chatbot是生成式AI最直接的应用场景。从产品形态来看,在面向泛用户的产品中,Chatbot类产品是其中最为重要的方向。对于该类产品,不同用户的需求还有所不同,有的产品追求更好的陪伴感,有的用户需要产品能具备更好的工具性,从而使得不同特色的AI+Chatbot产品出现并吸引用户。从2023年TOP50的AI产品来看,有5款是聊天机器人(10.690, -0.24, -2.20%),4款是智慧搜索,相关产品是应用端重要的方向。

从移动端的应用和下载来看,Chatbot类应用呈现出“一超多强”的特点。Chatgpt获得了移动端大部分的下载量份额。据七麦数据,Chatgpt iOS端全球下载量预计达到百万级别,其次为Chat & Ask AI,后续多款AI Chat相关产品日下载量在10万次左右。

应用收入上,Chat & Ask AI的收入预估与Chatgpt的差距相对较小。该产品的开发公司Codeway是一家主攻图片工具的网站,旗下APP中,Face Play 做AI换脸、Wonder做AI绘图、Pixelup主攻AI修图,内存清理App Cleanup主打图片清理。因此在AI Chatbot与用户融合的阶段,公司也及时应用文生图等技术做出差异化,通过“图像”易出圈的特点,始终围绕图像与AI结合推进商业化运营,并在商业上取得了亮眼表现。

我们认为AI+Chatbot领域,Chatgpt具备非常强的领先优势,无论是网页端的访问数据还是APP的下载情况,都显著领先于其他应用。其他应用更多主打垂类及特色服务,形成与Chatgpt的差异化竞争。我们预计后续竞争主要围绕AI Chatbot与具体的应用场景结合,建议关注多模态持续进展的情况下,新场景与AI结合带动的用户体验变化及社交爆发点。 

(二)图片生成:技术成熟度提升,关注商业化落地

图片生成技术逐步成熟,开源加速行业发展。从AI的图片生成来看,目前的主流模型包括DALL-E、Midjourney、Stable Diffusion、Runway等,这些模型的生成能力进步明显,生成效果逐步加强。在应用品类上,图片生成已经诞生较多的使用方式,简单场景如生成头像,复杂场景包括游戏内美术的生成均有使用图片生成相关技术。

从图片生成领域来看,开源模型对行业有显著的贡献,但开源产品Stable Diffusion在商业化方向仍然面临一定困难。据Stable AI官网,公司原CEO,Emad Mostaque提出辞职,既不再担任CEO,也从公司董事会退出。与之对比,收费并通过的Discord进行私域运营的Midjourney则无需对外融资即可实现公司的健康发展。从Midjourney的定价体系来看,稳定的付费方式是偏向小B端的订阅制收费,通过大量中小创作者的稳定订阅,维持自身长期运营。

(三)视频生成:Sora体现优质视频生成效果,关注模型能力进步

视频生成具备较高门槛,模型能力是短期竞争差异所在。在视频生成方面,我们认为行业整体处于技术驱动时点,具备优质多模态技术的大模型仍然较为稀缺。OpenAI旗下Sora具备优秀的模型效果惊艳。在模型场景上,支持文生视频、图生视频、文+图生成视频、视频修改、视频融合及视频延伸等功能。

在模型效果方面,以视频拼接为例,Sora在技术文档案例中展示了两个视频,其内容分别为无人机穿越竞技场建筑及蝴蝶在海底世界中飞行,并用Sora将两个视频拼接为一个。在场景方面,随着时间推移,场景由建筑渐变为海底景色并被海底场景逐步替代,而无人机则快速(1秒内)变为蝴蝶。用户在意识到镜头前端视角中心的物体变化时,远端的场景已经完成了替换,形成了较为自然的变化效果。通过不同视频进行拼接,实质上达到了优秀的编辑效果。

在类似的模型方面,微软研究院发布的Mora论文展示了与Sora接近的呈现效果。根据团队发布的模型方法显示,该模型由5个基本角色组成(1)Prompt选择和生成Prompt selection agent这里面的工具包括GPT、Llama、Bard等(2)形成文生图agent,这里工具包括DELL2、SD、Imagen等;(3)图像到图像的agent实现图像编辑,使用工具包括Emuedit、SDXL、Imagic等;(4)图像到视频生成agent完成视频的生成和拓展,其工具包括SVD、Pika、Gen-2等;(5)最后通过视频到视频agent完成视频的拼接,工具主要是SEINE。通过使用不同的开源模型和agent的组合,使得Mora能很快的完成相关任务。

通过对工作流的设置,团队完成了文本到视频生成、文本条件图像到视频生成、扩展生成的视频、视频到视频编辑、连接视频以及模拟数字世界等工作,并使其呈现与Sora类似的结果。从效果来看,Mora均能完成相关的任务设置。

开源及复刻模型跟进,长期竞合还将结合场景。我们预期仅从模型效果来看,开源模型发展速度较快,其他模型与Sora的差距有望缩小。但由于视频生成普遍较高的算力训练成本和数据成本,目前在视频生成领域,技术仍然是较为核心的竞争点。更长期来看,与文本及图片类的模型不同,视频类模型在推理方面仍需要消耗大量算力,从而使得视频内容生成对算力的消耗较文本类、图片类有极大的提升,根据投资机构Factorial估算,随着生成数量的增加,Sora的推理成本预计将高出GPT-4约2-3个数量级(1000 Text Tokens VS 1min Video)。因此优质的内容使用方式和用户付费场景可能是该类模型商业化落地的重要方向。

(四)音乐生成:Suno V3出圈, AI音乐生成领域实现突破

AI音频生成行业作为AIGC技术的重要分支,正处于快速发展的阶段。目前海外AI音乐生成的代表产品有Suno、Mubert、AI Cover&Songs、Soundful、Soundry AI、Splash Music等,产品类型涵盖消费端及专业创作。

以AI音乐生成工具AI Cover & Songs及Mubert为例,两款产品均利用AI强化自身音乐生成能力并辅助用户创作。在功能上,AI Cover & Songs可以完成文本覆盖、文转音频和社交分享;Mubert则主要可以生成不同场景或风格的音乐同时能提供版权保障。我们观察到,通常的音乐生成软件均具备基本的生成功能,并提供社交支撑和版权保障。

Suno音乐生成效果惊艳,音乐生成完成跨越。在音乐领域,Suno于2024年3月22日发布了V3版本,从生成效果来看,Suno V3版本生成的音乐具备非常优质的体验,从官网文档来看,V3的主要功能更新主要包括(1)生成更好的音质;(2)生成更多样的风格和类型(3)改进提升词输入效果,包括减少模型幻觉和生成更优美的结尾。在音乐时长方面,目前Suno支持2分钟的音乐创作,并支持纯音乐和多种语言。同时,在版权问题方面,V3使用了专有的、不可听见的水印技术,能够检测出歌曲是否由Suno创作,保护原创作品,防止滥用。从产品热度来看,3月SunoV3版本发布后,产品的热度有明显增加,且大幅超过同品类的其他产品。

在产品的应用方面,我们预计AI+音乐产品有望在以下三类领域产生较好的应用。一是配乐方面,包括游戏音效、影视配乐、原创短视频的背景音乐等,由于AI工具的高效率和高质量,后续有望进一步加强影视游戏等PGC作品的配乐效果,同时对以UGC为主的短视频,创作门槛的降低也有望使得AI音乐成为短视频重要的创作工具;其二是用于广告营销领域,通过快速创作和多样化的音乐风格,能够满足广告行业对个性化和吸引力音乐的需求;其三则主要是与社交结合,以Suno V3为例,其交互界面和功能设计强调了社交和传播属性,由于声音是人重要的社交载体,优质的音声创作能力为社交提供了良好的破冰缺口,从而使得音乐与社交的结合成为潜在的发展方向。

国内模型持续跟进,有望成为率先突破赛道。音乐领域国内模型及应用跟进迅速。2023年4月17日,昆仑万维(40.640, 0.09, 0.22%)与奇点智源联合发布的大语言模型“天工”正式发布,据昆仑万维官方微信,“天工”是国内首个对标ChatGPT的双千亿级大语言模型,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。2023年8月23日,昆仑万维推出国内第一款AI搜索产品“天工AI搜索”。据公司公众号显示,该功能深度融合AI大模型能力,通过人性化、智能化的方式全面提升用户的搜索体验,为用户提供快速、可靠的交互式搜索服务。整体而言,在模型领域,“天工”整体功能迭代迅速。在下载量方面,根据七麦数据,24Q1,“天工”下载量超87万次,近7日日均下载量超3.2万次。

AI音乐方面,昆仑万维于旗下的天工乐府SkyMusic是国内第一款商用级作曲AI模型。在模型效果上,根据昆仑万维官方公众号显示,该模型具备五大特点,(1)高质量AI音乐:“天工SkyMusic”能够生成80秒44100Hz采样率双声道立体声AI歌曲,并可根据用户输入的歌词风格生成对应歌曲风格。(2)能更好的模拟“人声”:“天工SkyMusic”的AI人声合成能够达到业内顶尖的SOTA水平,其中文演唱效果更是显著好于国外产品,领先世界水平。(3)歌词段落控制:“天工SkyMusic”能够通过歌词来控制歌曲,让生成的歌曲可以明确分辨出不同歌词段落的情绪变化,体现出主歌和副歌、前奏和主歌的段落差异。(4)多种音乐风格:“天工SkyMusic”支持说唱、民谣、放克、古风、电子等多种音乐风格供用户选择。(5)音乐智能表达,歌唱技巧学习:“天工SkyMusic”同时能够学习如颤音、歌剧、吟唱、男女对唱,自动和声等多种歌唱技巧,让用户创作的歌曲得到更恰当的情感表达。该产品于2024年4月2日,开启邀测。

在应用场景方面,我们认为音乐与社交的结合值得关注。在AI+音乐社交方面,盛天网络(13.740, -0.69, -4.78%)已于1月上线AIGC+音乐相关APP“给麦”,其APP内主题玩法包括连麦、K歌合唱、AI声音进化、推理社交游戏、语音开黑交友等流行的音乐玩法,针对Z世代强化打造音乐社交型社区环境;其特色玩法在于AI实验室,可以通过音色合成的方式提取用户语音,并生成歌曲,达到虚拟演唱的效果,即歌曲表现如同用户自己唱出来。公司后期计划围绕“给麦APP”构建AI虚拟人生态圈,打造更丰富的应用场景,如AI写歌、AI歌手演唱、AI专辑封面等,不断拓展社交产品边际,优化玩家体验,丰富产品的可玩性。在流量端,据七麦数据,产品上线以来APP端总下载量约为400万次。

从AIGC类产品的发展情况来看,我们已经看到在不同的领域迎来了分化。在流量方面依然能看到持续的增长。据Similarweb,ChatGPT2024年2月访问量为16.3亿次,月环比增长1.05%;据Data.ai,2023年12月AI相关应用下载量达到9300万次,2023全年用户移动端下载总量达到8.1亿次,同比增长652%。但是从竞合情况来看,一级市场出现了明显的分化,融资次数从2022年的274次下降至114次,下降58.4%,但明星项目获得的融资额度明显增加,带动全年融资金额从2022年的479.94亿元增长至2023年的1710.26亿元,说明市场已经开始关注AI赛道的竞争落地情况。

在竞合格局上,我们预计大模型平台端仍然是AI应用流量的核心。目前可以看到头部平台用户浏览量明显领先,通用大模型ChatGPT占据全球AIGC产品访问量的榜首,2024年2月访问量为16.3亿次,流量榜的第二的微软Bing、第四名的谷歌Genmin均为大模型平台。大模型平台与垂类应用端在浏览量上差距明显。我们认为,AI大模型具备显著的平台效应,最终有望形成2-3家头部平台竞争的格局。由于掌控流量入口,平台端预计拥有行业内较强的话语权,在产业链中占据优势地位。因此,在大模型领域具备先发优势的公司尤其值得关注。

在应用端,不同生成难度的内容,其竞合格局和后续发展方向也已经产生了分化。其中,在生成难度较低,开源模型成熟度较高的领域,主要是文生文和图片生成,模型本身的差异相对较小,对细分场景的把握,和重点应用的解决方案推出有望成为用户使用的核心理由。因此商业化及模型与场景结合的能力是该类应用的短期核心竞争点。建议关注优质的垂类工具。国内建议关注在垂类领域持续深耕,对领域痛点有深度理解能力的厂商。

在生成难度较高的领域,主要是视频生成等领域,优质模型在能力上具备较强壁垒。视频领域开源产品相对较少,模型本身是竞争核心,同时较高的推理成本也限制了该类模型的使用方向。预计该类产品的短期核心是维持与其他模型的代际差距,形成市场认知,长期关注仍然是降低模型成本并寻求应用方向。

我们认为模型与音乐结合有望成为短期行业的新兴细分赛道。海外音乐应用Suno成功出圈,其音乐生成能力受到市场认可。我们认为,音乐赛道整体生成难度和门槛相对不高,效果呈现和落地场景更为重要。音乐类产品的应用范围广泛,能与短视频、游戏、影视、社交等多品类进行结合,同时优质的音乐具备较强的传播属性,能形成破圈效果推动应用下载量增加,建议关注具备优质音乐生成能力的应用。尤其需要重视音乐与垂直场景的结合,To b端作为工具赋能,To c端需要与社交融合才能带来显著早期流量爆发和持续的流量黏性。

AI模型及应用发展迅速,海外应用在多个领域实现突破,模型能力逐步增强,后续建议关注应用与模型结合产生的C端突破,细分场景上,文本、图片、音乐均有应用爆款机会;视频领域建议关注模型进展及算力需求的降低。具体在标的上,建议积极关注具备AI模型能力和应用场景的公司。

(一)模型迭代效果不及预期

AIGC相关模型的算法迭代可能进入瓶颈,无法得到更好的测试效果;算法可能过拟合,或在不同数据集上获得不同的效果。

(二)算力发展不及预期

大模型需要的参数量级和训练数据量级都较大,对底层算力支持的要求较大,如果算力发展滞缓,会导致大模型运行的成本过高,无法继续增大训练量级。

(三)商业化落地不及预期

AIGC行业发展处于早期,不同应用场景对AIGC应用效果的要求不同,商业化可能受不同垂直领域应用效果差距的影响,不及预期。

(四)版权、伦理、内容质量的风险 

AIGC的内容版权归属问题没有一致的规范,AI生成的内容可能存在暴力、低俗等内容质量问题;AIGC技术的发展可能存在伦理争论。

股市回暖,抄底炒股先开户!智能定投、条件单、个股雷达……送给你>>
海量资讯、精准解读,尽在新浪财经APP

鲜花

握手

雷人

路过

鸡蛋