了解更多新鲜事
单张GPU搞定GPT-3超参数!先训练小模型,再“一键迁移” | 已开源
“一个GPU没法训练GPT-3,更别提在上面调整超参数了。”不不不,现在情况有变——在单个GPU上完全可以调整大规模模型的超参数。怎么说?原来有人发现了一种新的调参方法,无论模型规模怎么变化,所得的最
so导航站2025-04-12 发布
“高校在大模型领域是不太可能跟企业竞争的” | CCF C³@联想
高校在大模型(领域)是不太可能跟企业竞争。多模态大模型用起来,成本依然会很高,肯定离不开云。企业做视觉大模型,要么是双目立体视觉,要么是多传感器融合。未来,大模型将与元宇宙深度结合。在最新CCF C³
so导航站2025-04-12 发布
李开复「关门弟子」创业!AI助手一站搞定,入局大模型另一种选择
大模型长驱直入,所到之处,有头有脸的技术大牛争相下场创业。在AI技术周期一度成为高地的上海 ,也有蜻蜓立上头,名叫澜码科技。创始人周健,ACM-ICPC全球赛冠军首个亚洲团队成员,依图科技10号员工,
so导航站2025-04-12 发布
万亿大模型究竟怎么用?达摩院&浙大&上海人工智能实验室联手推出洛犀平台:大小模型端云协同进化
AI领域这股大模型之风,可谓是席卷全球,越吹越劲。单说2021年下半年,前有微软英伟达联手推出5300亿参数NLP模型,后又见阿里达摩院一口气将通用预训练模型参数推高至10万亿。而就在最近,扎克伯格还
so导航站2025-04-11 发布
昆仑万维官宣「天工」大模型4月17日启动邀测
4月10日,昆仑万维宣布「天工」大模型4月17日启动邀测。以下内容转载自昆仑万维官方微信公众号:我们今天骄傲的宣布一件事:由昆仑万维和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型——「
so导航站2025-04-11 发布
512张GPU炼出10万亿参数巨模型!5个月后达摩院模型再升级,今年双十一已经用上了
超大规模的预训练模型的参数量级又双叒被刷爆了!100000亿!(没错,是10万亿)而且还是用512张GPU,训练了10天搞出来的!这就是达摩院最新推出的超大规模通用性人工智能大模型,M6-10T。它在
so导航站2025-04-11 发布
字节跳动推荐平台技术公开,项亮:底层架构有时比上层算法更重要
字节跳动已正式吹响进军云计算市场号角。12月2日,火山引擎全系列云产品亮相,共推出了78项云产品服务,涵盖云基础、视频及内容分发、数据中台、开发中台、人工智能等五大类。火山引擎云产品以性价比、提升业务
so导航站2025-04-11 发布
美团20亿100%收购光年之外!王兴接住清华上铺兄弟,账上资本2.8亿美元
刚刚,美团官宣,将以超20 58亿元收购光年之外。收购完成后,美团将持有光年之外100%的权益。除此之外,港交所公告里还透露了以下信息:总代价超20 58亿元(包括现金2 33亿美元,债务承担人民币3
so导航站2025-04-11 发布
用大模型“百度一下”,是种什么体验?
百度最擅长、最知名的搜索,要“变味”了。因为这一次,他们决定把大火的大模型也丢进去做成产品了。这个大模型,就是百度自家的“最强兵器”——文心大模型。AI大模型应用在搜索场景,带来的新产品则叫做文心百中
so导航站2025-04-11 发布
北大新成果!首次成功地将CNN解码器用于代码生成|论文+代码
想象一下。直接说你想干什么,就能生成相应的代码,会是多么“功德无量”一件事。最直接受益的,就是程序员群体。再也不用饱受“996”的折磨,也不用摸着不断后退的发际线而黯然神伤。现在,这一天又近了一些。最
so导航站2025-04-11 发布
首个开源中文金融大模型来了!解释授信额度、计算收益率、决策参考样样通,来自度小满|附下载
金融行业正迎来大模型时代。近日,度小满正式发布千亿级中文对话大模型轩辕,集中文、金融、开源特色于一身。基于BLOOM-176B研发的轩辕大模型,在金融场景中的任务评测中,效果相较于通用大模型大幅提升,
so导航站2025-04-11 发布
大模型学好编程,常识逻辑能力一起提升!网友:GPT-4更强的关键所在?
大模型代码能力强,顺便还能提升其他能力?最近CMU的一项研究突然在网上火了起来。因为它提出了一个结论,模型掌握好代码能力后,在一些非代码任务上也能表现出色。类比于:学好数理化走遍天下都不怕的感觉。这一
so导航站2025-04-11 发布
WAIC启明创投“生成式AI与大模型:变革与创新”论坛成功举办
7月7日,由启明创投主办的2023世界人工智能大会—生成式AI与大模型:变革与创新论坛在上海世博展览馆成功举办。人工智能等技术前沿领域的著名专家与学者,顶级投资人和领军创业者汇聚一堂,共同探索中国科技
so导航站2025-04-10 发布
国产乾元2大模型来了:可编程金融文生图,120亿参数,超对称联手复旦出品
国产大模型队伍正当“百模大战”之际,现在又添一员——BBT-2,全称BigBang Tansformer-2(乾元2),120亿参数的通用大模型。以其为基础,项目团队还训练出了代码、金融、文生图等专业
so导航站2025-04-10 发布
电脑CPU依然得看英特尔酷睿:新一代性能提升20%,AI能力翻5倍;网友:感谢AMD
英特尔第十一代「酷睿家族」终于登场了!代号Tiger Lake,10nm SuperFin 工艺,针对移动平台,英特尔还放话:性能方面也有较大的提升——CPU性能提升20%,核显性能翻倍,AI性能则提
so导航站2025-04-10 发布
苏妈AMD全力押注AI:MI300对标英伟达超芯,研发增长近四倍,AI早已成财报关键词
而上一次这么证明,还要回到AMD水深火热之时,正是由她一己之力实现了硅谷史上最伟大的转机之一。2014年,已经诞生了45年的AMD陷入崩溃边缘:产品不能按期交付,笔记本市场被英特尔占据,新兴的智能手机
so导航站2025-04-10 发布
参数跑分真那么重要?大模型评价标准该变变了
预训练大模型,自诞生以来不断刷新AI能力,成为业界竞争的焦点。参数规模突破千亿直奔万亿,开发难度和成本也随之增大。到了这个份上,大模型的开发与应用似乎成了“巨头专属”,效果越来越惊艳,离普通人却越来越
so导航站2025-04-10 发布
模型越大表现越差还能得百万奖金?纽约大学博士百万重金悬赏“反规模效应”的任务
模型越大、表现越差反而能获奖?奖金总计25万美金(折合人民币167万)?这样“离谱”的事情还真就发生了,一个名叫Inverse Scaling Prize(反规模效应奖)的比赛在推特上引发热议。该比赛
so导航站2025-04-10 发布