近期,美国芯片初创公司Groq推出新一代AI推理芯片,采用全球首个LPU方案,大幅提升大模型推理速度。据媒体报道,该公司的芯片推理速度较英伟达GPU提高10倍,成本只有其1/10。极限情况下,Groq的Llama2 7B推理速度能够达到每秒750 tokens,为GPT-3.5的18倍。推理速度的加快意味着用户与AI对话的延迟和等待时长将大幅降低,有望进一步推动AI应用普及。
国海证券表示,从2022年11月30日的ChatGPT,到2024年2月16日的Sora,短短1年3个月我们见证了LLM到多模态的迭代,模型迭代速度远超预期。我们有理由相信OpenAI具备更多的“杀手锏”模型积累,持续看好未来多模态大模型加速迈向AGI,以及由此不断增长的算力需求。
关联产品:
人工智能ETF(159819),场外联接(A类:012733;C类:012734):人工智能核心标的,一键打包AI各细分环节龙头公司,产业分布均衡。截至2月20日,人工智能ETF规模46.62亿元,近一个月日均成交额3.06亿元。
云计算ETF(516510),场外联接(A类:017853;C类:017854):聚焦产业中游,数字经济时代算力基石。截至2月20日,云计算ETF规模11.68亿元,近一个月日均成交额0.79亿元