微信扫码登录
自选
APP下载
扫一扫,下载

【互联网服务】计算机行业周报:英伟达推出全新CPU和GPU AI处理器,IDEA研究院发布通用视觉大模型DINO-X

原文出处: 华鑫证券   贡献者:研报专业户

投资要点


算力:算力租赁价格平稳,英伟达推出全新CPU和GPU AI处理器


Nvidia发布了两款产品:具有两个Grace CPU的四通道B200GPU模块——GB200NVL4,以及针对风冷数据中心的H200NVL PCIe GPU。具体介绍如下:


1)GB200Grace Blackwell NVL4超级芯片是标准(非NVL4)双GPU变体的更有效的变体,具有多达四个与NVLink相连的B200Blackwell GPU和两个基于Grace ARM的CPU,全部位于一个主板上。该解决方案针对HPC和AI混合工作负载,具有高达1.3TB的一致性内存。Nvidia宣传GB200NVL4的模拟性能是Nvidia GH200NVL4的2.2倍,训练是1.8倍,推理性能是Nvidia GH200NVL4的1.8倍,是其直接前身。英伟达表示,GB200NVL4超级芯片将于2024年下半年从各种供应商处提供,例如微星、华硕、技嘉、纬创资通、和硕、华擎机架、联想、惠普企业等。


2)H200NVL是一款双插槽风冷GPU,具有PCIe5.0连接(128GB/s)。该冷却器针对机架安装解决方案进行了优化,采用流通式设计,其中进气从右向左流动;没有鼓风机式风扇。其性能比Nvidia即将推出的SXM外形尺寸的H200略差。H200NVL的额定FP64为30TFLOPS,FP32的额定值为60TFLOPS。Tensor核心性能的额定值为FP64的60TFLOPS、TF32的835TFLOPS、BFLOAT16的1671TFLOPS、FP16的1671TFLOPS、FP8的3341TFLOPS和INT8的3341TFLOP。但Nvidia表示H200NVL比它所取代的H100NVL快得多。它具有1.5倍的内存容量和1.2倍的内存带宽,为HPC工作负载提供高达1.7倍的推理性能和1.3倍的性能。Nvidia还快速与Ampere进行了比较,指出H200NVL比Ampere的同等GPU快2.5倍。


IDEA研究院发布通用视觉大模型DINO-X


IDEA研究院发布最新成果通用视觉大模型DINO-X。它实现视觉任务大一统,支持各种开发世界感知和目标理解任务,包括开放世界对象检测与分割、短语定位、视觉提示计数、姿态估计、无提示对象检测与识别、密集区域字幕等。这背后得益于,他们构建了超过一亿高质量样本的大型数据集Grounding-100M。与之前DINO家族中Grounding DINO1.5类似,DINO-X也分为DINO-X Pro模型和DINO-X Edge模型。前者可为各种场景提供更强的感知能力,后者经过优化,推理速度更快,更适合部署在边缘设备上。


实验结果表明,DINO-X Pro模型在COCO、LVIS-minival和LVIS-val零镜头物体检测基准测试中分别获得了56.0AP、59.8AP和52.4AP的成绩。尤其是在LVIS-minival和LVIS-val这两个罕见类别的基准测试中实现新SOTA——分别获得了63.3AP和56.5AP的成绩,都比之前的SOTA性能提高了5.8AP。


DINO-X的万物识别能力,让其拥有了对开放世界(OpenWorld)的视觉感知,可以轻松应对真实世界中的众多不确定性和开放环境。IDEA研究院创院理事长沈向洋提到了具身智能、大规模多模态数据的自动标注、视障人士服务等这几个场景。


目前,IDEA研究院与多家企业联合开展视觉大模型及应用场景的探索研究工作,在视觉大模型的落地方面取得了实质性进展。一方面,有别于市场上的以语言为基础的多模态大模型基于全图理解的方法,通过在物体级别的理解上加入语言模块优化大模型幻觉问题。另一方面结合自研的“视觉提示优化”方法,无需更改模型结构,不用重新训练模型,实现小样本下的场景化定制。


AI融资动向:xAI获50亿美元融资,目前估值达500亿美元


本期AI初创公司的融资中,xAI融资额排名第一,获50亿美元融资。xAI成立于2023年的7月12日,虽然成立的时间不长,但xAI在人工智能领域已有不错的进展,在成立次月的18日,他们就宣布完成了首个旗舰模型Grok-0的训练,有330亿参数;两个多月后的11月3日,他们宣布了Grok-1模型;在今年的3月17日,他们宣布将Grok-1的权重和架构开源;3月28日宣布的Grok-1.5模型,增加了长文本能力;4月12日推出的Grok-1.5V,则是增加了视觉能力,可以根据交错的自然语言和图像进行推理;而在今年8月15日,他们推出了推理能力更强的大语言模型Grok-2,更小但能力不俗的Grok-2mini也在当天一并推出,Grok-2和Grok-2mini在测试中的部分能力,超过了Anthropic旗下的Claude3.5Sonnet和OpenAI旗下的GPT-4Turbo。xAI截至今年已打造有10万块英伟达H100的算力集群,是当前全球最大的AI训练系统。


投资建议


海外应用侧最重要场景已具雏形,国内政策持续支持。海外方面,当地时间11月19日,在“Microsoft ignite2024”全球开发者大会上,围绕AI Agent/AI智能体,微软更新了多款AI产品。微软的目的在于建立完善的AI智能体生态,自推出以来,该生态联盟已有超过10万家组织通过其Copilot Studio创建或编辑过AI助理。国内方面,近日,人工智能辅助诊断首次被列入价格构成。国家医保局分析人工智能潜在的应用场景,在放射检查、超声检查、康复类项目中设立“人工智能辅助”扩展项,即同样的价格水平下,医院可以选择培养医务人员进行诊疗,也可以选择使用人工智能参与诊疗行为,但现阶段不重复收费。预计该政策将大幅加快人工智能辅助技术进入临床应用速度。


我们坚定持续看好AI软硬件机会,建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)、高速通信连接器业务或显著受益于GB200放量的鼎通科技(688668.SH)。


风险提示


1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。


24678.98 -0.42% -103.15

TA关联分析

  • 买入
    操作
  • --
    趋势
  • --
    基本面
你建议本股当前如何操作?
  • 买入
  • 观望
  • 卖出
表情
同时转发

【互联网服务】计算机行业周报:OpenDay,展示Agent全新进展

【互联网服务】计算机行业点评报告:医保数据要素实践和展望

【互联网服务】计算机行业定期报告:智谱AI Agent全面升级,合肥举办量子科技和产业大会

【互联网服务】中美互联网的平行时空:割裂与摩擦——当前时点,如何选择?

【电子元件】电子:关注卫星互联网产业机会

【互联网服务】计算机行业周报:周观点:AI应用迎来精彩时刻

价值与成长:华尔街技术分析师关注的分歧路径

博通公司在人工智能领域具有优势——分析师强调2024年增长

等同于暂停IPO!本周一(3月25号),大盘或将继续下跌?

低空经济概念,估计炒不了多远。
1、民用无人机,强如大疆,一年也就300多亿产值,和卖10万台30万的汽车差不多,也就是这个行业总规模也就相当于一个理想汽车。
2、飞行汽车,一个试验性的细分行业。
3、通用航空,在美国规模挺大,咱们有遍地的高铁和高速公路网啊,民航飞机还是弱项,机场也不多,发展天花板太低。
低空经济发展是要发展,预期可撑不起爆炒股票,挣点钱得了,憋着你信进去了

开局本来是不错的,但金融三马车,石油,酿酒,电信运营等巨无霸一发力,
双创直接被绿,而大盘也随着人气的回落而翻绿,
低空经济,AI模型,短剧游戏依旧是涨停的主力

请点击右上角的【...】按钮

选择【浏览器】打开

×