原文:
2080 Ti就能跑70B大模型,让LLM推理增速11倍
4090成A100平替?token生成速度只比A100低18%,上交大推理引擎火了
天承办公室 阅3
比GPT-4快18倍,最快大模型Groq登场!自研LPU是英伟达GPU的10倍
你好122 阅22
Nature:AI模型越大越好吗?
520jefferson 阅15
英伟达要革“计算光刻”的命 CPU大厂尬住:那我走?
开米蓝 阅9 转2
PyTorch官方认可!斯坦福博士新作:长上下文LLM推理速度提8倍
黄爸爸好 阅21
史上首个100%开源大模型重磅登场!破纪录公开代码/权重/数据集/训练全过程,AMD都能训
dbn9981 阅34 转3
LLM推理提速2.8倍,CMU清华姚班校友提出「投机式推理」引擎SpecInfer,小模型撬动大模型高效推理
小飞侠cawdbof0 阅10
大模型“涌现”的思维链,究竟是一种什么能力?
脑极体 阅14
免费的大模型长文本来了,但要多久才能彻底改变我们的生活?
独角戏jlahw6jw 阅5
AI Comic Factory:AI(连环)漫画生成器
奥莉芙小异 阅1755
首页
留言交流
联系我们
回顶部