量子位

电子技术应用专栏作家——量子位。追踪人工智能新趋势,关注科技行业新突破!

AIGC算力全景与趋势报告发布!一文解读AIGC算力构成、产业链条,还有五新趋势判断

AI算力从没有任何一个时刻,比现在更受瞩目。

国内首个网文大模型来了!「阅文妙笔」:我最懂网文

写网文,现在也要以大模型的“姿势”打开了。网络文学巨头阅文集团就打响了这么一枪: 正式发布国内首个网文大模型——阅文妙笔。 

清华造了个游戏公司!十余个ChatGPT上岗,7分钟开发一款游戏

清华用ChatGPT打造了个「零人工含量」的「游戏公司」,从老板到员工都是AI的那种!  只要你提出想法,从设计到测试的完整流程,都由AI帮忙搞定。 

华为天才少年透露研究课题!背后存储团队发布两大新品,均面向大模型

华为最新揭秘的大模型领域最新动作,剑指AI存储,一口气发布两产品:OceanStor A310深度学习数据湖存储与FusionCube A3000训/推超融合一体机

极少数据就能微调大模型,一文详解LoRA等方法的运作原理

最火的大模型微调方法,又要属LoRA。但包括LoRA在内,这类方法的核心原理究竟是什么?它和大模型之间的关系又是什么?我们具体来看。

大模型挑选指南来了!涵盖六种情况下的选择方案,为你匹配最佳模型|来自沃顿商学院教授

大模型发布一波接着一波,但五花八门,没有一个可解决所有问题。所以不同任务到底该用哪一个?

斯坦福博士独作!大模型训练速度再翻倍,还官宣加入明星创业公司当首席科学家

现有大语言模型的训练和推理速度,还能再快一点——快多少?2-4倍。

Transformer后继有模!MSRA提出全新大模型基础架构:推理速度8倍提升,内存占用减少70%

微软大模型新架构,正式向Transformer发起挑战!

650亿参数大模型预训练方案开源可商用!LLaMA训练加速38%,来自明星开源项目

650亿参数大模型的预训练方案,发布即开源。