微信扫码登录
自选
APP下载
扫一扫,下载

【互联网服务】字节豆包事件点评:豆包产品快速迭代,有望推动推理算力需求持续提升

原文出处: 上海证券   贡献者:研报专业户

主要观点


字节豆包实时语音大模型正式上线,AI版图持续扩张。2025年1月20日,豆包实时语音大模型正式上线,主要面向中文场景,是一款语音理解和生成一体化的模型,实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。字节AI版图持续扩张,据硅星人统计,从2024年开始,字节在国内外推出包括豆包在内的20余款App,从集成式的聊天助手,到图像、视频、音乐等效率工具,加速渗透到教育、办公助手、开发平台、代码生成等行业。我们认为,本次豆包实时语音大模型的推出,有助于提升字节旗下应用体验,及豆包终端用户增长,将加速相关应用场景渗透。


依托于语音和语义联合建模,模型智商与情商双双在线。豆包团队研发出了一套端到端框架,面向语音生成和理解进行统一建模,实现多模态输入和输出效果,弥补了传统语音对话任务系统级联模式的缺陷。在预训练(Pretrain)阶段,团队对各模态交织数据进行深入训练,精准捕捉并高效压缩海量语音信息,通过Scaling,最大程度实现语音与文本能力深度融合和能力涌现。在后训练阶段,团队使用了高质量数据与RL算法,进一步提供模型高情商对话能力与安全性,并在“智商”与“情商”之间寻求平衡。


豆包实时语音大模型整体满意度高于GPT-4o。根据豆包大模型团队评测,团队围绕拟人度、有用性、情商、通话稳定性、对话流畅度等多个维度进行考评。整体满意度(以5分为满分)方面,豆包实时语音大模型评分为4.36,GPT-4o为3.18。其中,50%的测试者对豆包实时语音大模型表现打出满分。此外,在模型优点评测中,豆包实时语音大模型在情绪理解和情感表达方面优势明显。尤其是“一听就是AI与否”评测中,超过30%的反馈表示GPT-4o“过于AI”,而豆包实时语音大模型相应比例仅为2%以内。


投资建议


我们认为,字节豆包产品快速迭代,豆包生态愈发完善,在B端和C端有望加速落地和推广,带来推理算力需求的持续提升。同时,字节在AI的进一步发力和持续投入,有望拉动国内互联网大厂在算力端的支出,国内算力军备竞赛刚刚开始,国产算力厂商迎来发展机遇,建议关注:


AI芯片:海光信息、寒武纪、景嘉微、安博通(与江原合作)等服务器:浪潮信息、中科曙光、神州数码、软通动力、华勤技术、紫光股份等


交换机:锐捷网络、紫光股份等


光模块:光迅科技、华工科技等


IDC:润泽科技、光环新网、亚康股份、数据港、世纪互联等液冷:英维克、申菱环境、高澜股份、飞荣达、同飞股份等电源:欧陆通、泰嘉股份、麦格米特等


风险提示


AI应用落地不及预期;AI需求不及预期;行业竞争加剧。


24753.47 +3.02% +724.99

TA关联分析

  • 买入
    操作
  • --
    趋势
  • --
    基本面
你建议本股当前如何操作?
  • 买入
  • 观望
  • 卖出
表情
同时转发

【互联网服务】计算机:美国宣布“星际之门”项目,国内投资也有望提速

【互联网服务】计算机行业周度点评:重视国产算力和推理算力

【互联网服务】计算机行业专题研究:信创2.0:信创与鸿蒙共振,招投标有望加速

【互联网服务】AI动态跟踪系列(四):DeepSeek引发广泛关注,大模型应用落地将加速

【互联网服务】高质量大模型基础设施研究报告(2024年)

【互联网服务】计算机行业周报:周观点:Deepseek一鸣惊人,AI应用繁荣可期

价值与成长:华尔街技术分析师关注的分歧路径

博通公司在人工智能领域具有优势——分析师强调2024年增长

等同于暂停IPO!本周一(3月25号),大盘或将继续下跌?

低空经济概念,估计炒不了多远。
1、民用无人机,强如大疆,一年也就300多亿产值,和卖10万台30万的汽车差不多,也就是这个行业总规模也就相当于一个理想汽车。
2、飞行汽车,一个试验性的细分行业。
3、通用航空,在美国规模挺大,咱们有遍地的高铁和高速公路网啊,民航飞机还是弱项,机场也不多,发展天花板太低。
低空经济发展是要发展,预期可撑不起爆炒股票,挣点钱得了,憋着你信进去了

开局本来是不错的,但金融三马车,石油,酿酒,电信运营等巨无霸一发力,
双创直接被绿,而大盘也随着人气的回落而翻绿,
低空经济,AI模型,短剧游戏依旧是涨停的主力

请点击右上角的【...】按钮

选择【浏览器】打开

×