国内首个网文大模型来了!「阅文妙笔」:我最懂网文
写网文,现在也要以大模型的“姿势”打开了。网络文学巨头阅文集团就打响了这么一枪: 正式发布国内首个网文大模型——阅文妙笔。
发表于 2023/7/20 16:20:28
阅读(876)
清华造了个游戏公司!十余个ChatGPT上岗,7分钟开发一款游戏
清华用ChatGPT打造了个「零人工含量」的「游戏公司」,从老板到员工都是AI的那种! 只要你提出想法,从设计到测试的完整流程,都由AI帮忙搞定。
发表于 2023/7/20 15:47:49
阅读(1126)
华为天才少年透露研究课题!背后存储团队发布两大新品,均面向大模型
华为最新揭秘的大模型领域最新动作,剑指AI存储,一口气发布两产品:OceanStor A310深度学习数据湖存储与FusionCube A3000训/推超融合一体机
发表于 2023/7/20 15:41:12
阅读(1191)
极少数据就能微调大模型,一文详解LoRA等方法的运作原理
最火的大模型微调方法,又要属LoRA。但包括LoRA在内,这类方法的核心原理究竟是什么?它和大模型之间的关系又是什么?我们具体来看。
发表于 2023/7/19 13:59:19
阅读(1089)
大模型挑选指南来了!涵盖六种情况下的选择方案,为你匹配最佳模型|来自沃顿商学院教授
大模型发布一波接着一波,但五花八门,没有一个可解决所有问题。所以不同任务到底该用哪一个?
发表于 2023/7/19 13:48:36
阅读(905)
斯坦福博士独作!大模型训练速度再翻倍,还官宣加入明星创业公司当首席科学家
现有大语言模型的训练和推理速度,还能再快一点——快多少?2-4倍。
发表于 2023/7/19 13:38:19
阅读(1142)
Transformer后继有模!MSRA提出全新大模型基础架构:推理速度8倍提升,内存占用减少70%
微软大模型新架构,正式向Transformer发起挑战!
发表于 2023/7/19 13:30:20
阅读(1398)