集合全网最新AI技术资讯与教程一键查询-so导航站

全部

单张GPU搞定GPT-3超参数！先训练小模型，再“一键迁移” | 已开源

“一个GPU没法训练GPT-3，更别提在上面调整超参数了。”不不不，现在情况有变——在单个GPU上完全可以调整大规模模型的超参数。怎么说？原来有人发现了一种新的调参方法，无论模型规模怎么变化，所得的最

so导航站2025-04-12 发布
“高校在大模型领域是不太可能跟企业竞争的” | CCF C³@联想

高校在大模型（领域）是不太可能跟企业竞争。多模态大模型用起来，成本依然会很高，肯定离不开云。企业做视觉大模型，要么是双目立体视觉，要么是多传感器融合。未来，大模型将与元宇宙深度结合。在最新CCF C³

so导航站2025-04-12 发布
李开复「关门弟子」创业！AI助手一站搞定，入局大模型另一种选择

大模型长驱直入，所到之处，有头有脸的技术大牛争相下场创业。在AI技术周期一度成为高地的上海，也有蜻蜓立上头，名叫澜码科技。创始人周健，ACM-ICPC全球赛冠军首个亚洲团队成员，依图科技10号员工，

so导航站2025-04-12 发布
万亿大模型究竟怎么用？达摩院&浙大&上海人工智能实验室联手推出洛犀平台：大小模型端云协同进化

AI领域这股大模型之风，可谓是席卷全球，越吹越劲。单说2021年下半年，前有微软英伟达联手推出5300亿参数NLP模型，后又见阿里达摩院一口气将通用预训练模型参数推高至10万亿。而就在最近，扎克伯格还

so导航站2025-04-11 发布
昆仑万维官宣「天工」大模型4月17日启动邀测

4月10日，昆仑万维宣布「天工」大模型4月17日启动邀测。以下内容转载自昆仑万维官方微信公众号：我们今天骄傲的宣布一件事：由昆仑万维和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型——「

so导航站2025-04-11 发布
512张GPU炼出10万亿参数巨模型！5个月后达摩院模型再升级，今年双十一已经用上了

超大规模的预训练模型的参数量级又双叒被刷爆了！100000亿！（没错，是10万亿）而且还是用512张GPU，训练了10天搞出来的！这就是达摩院最新推出的超大规模通用性人工智能大模型，M6-10T。它在

so导航站2025-04-11 发布
字节跳动推荐平台技术公开，项亮：底层架构有时比上层算法更重要

字节跳动已正式吹响进军云计算市场号角。12月2日，火山引擎全系列云产品亮相，共推出了78项云产品服务，涵盖云基础、视频及内容分发、数据中台、开发中台、人工智能等五大类。火山引擎云产品以性价比、提升业务

so导航站2025-04-11 发布
美团20亿100%收购光年之外！王兴接住清华上铺兄弟，账上资本2.8亿美元

刚刚，美团官宣，将以超20 58亿元收购光年之外。收购完成后，美团将持有光年之外100%的权益。除此之外，港交所公告里还透露了以下信息：总代价超20 58亿元（包括现金2 33亿美元，债务承担人民币3

so导航站2025-04-11 发布
用大模型“百度一下”，是种什么体验？

百度最擅长、最知名的搜索，要“变味”了。因为这一次，他们决定把大火的大模型也丢进去做成产品了。这个大模型，就是百度自家的“最强兵器”——文心大模型。AI大模型应用在搜索场景，带来的新产品则叫做文心百中

so导航站2025-04-11 发布
北大新成果！首次成功地将CNN解码器用于代码生成｜论文+代码

想象一下。直接说你想干什么，就能生成相应的代码，会是多么“功德无量”一件事。最直接受益的，就是程序员群体。再也不用饱受“996”的折磨，也不用摸着不断后退的发际线而黯然神伤。现在，这一天又近了一些。最

so导航站2025-04-11 发布
首个开源中文金融大模型来了！解释授信额度、计算收益率、决策参考样样通，来自度小满｜附下载

金融行业正迎来大模型时代。近日，度小满正式发布千亿级中文对话大模型轩辕，集中文、金融、开源特色于一身。基于BLOOM-176B研发的轩辕大模型，在金融场景中的任务评测中，效果相较于通用大模型大幅提升，

so导航站2025-04-11 发布
大模型学好编程，常识逻辑能力一起提升！网友：GPT-4更强的关键所在？

大模型代码能力强，顺便还能提升其他能力？最近CMU的一项研究突然在网上火了起来。因为它提出了一个结论，模型掌握好代码能力后，在一些非代码任务上也能表现出色。类比于：学好数理化走遍天下都不怕的感觉。这一

so导航站2025-04-11 发布
WAIC启明创投“生成式AI与大模型：变革与创新”论坛成功举办

7月7日，由启明创投主办的2023世界人工智能大会—生成式AI与大模型：变革与创新论坛在上海世博展览馆成功举办。人工智能等技术前沿领域的著名专家与学者，顶级投资人和领军创业者汇聚一堂，共同探索中国科技

so导航站2025-04-10 发布
国产乾元2大模型来了：可编程金融文生图，120亿参数，超对称联手复旦出品

国产大模型队伍正当“百模大战”之际，现在又添一员——BBT-2，全称BigBang Tansformer-2（乾元2），120亿参数的通用大模型。以其为基础，项目团队还训练出了代码、金融、文生图等专业

so导航站2025-04-10 发布
电脑CPU依然得看英特尔酷睿：新一代性能提升20%，AI能力翻5倍；网友：感谢AMD

英特尔第十一代「酷睿家族」终于登场了！代号Tiger Lake，10nm SuperFin 工艺，针对移动平台，英特尔还放话：性能方面也有较大的提升——CPU性能提升20%，核显性能翻倍，AI性能则提

so导航站2025-04-10 发布
苏妈AMD全力押注AI：MI300对标英伟达超芯，研发增长近四倍，AI早已成财报关键词

而上一次这么证明，还要回到AMD水深火热之时，正是由她一己之力实现了硅谷史上最伟大的转机之一。2014年，已经诞生了45年的AMD陷入崩溃边缘：产品不能按期交付，笔记本市场被英特尔占据，新兴的智能手机

so导航站2025-04-10 发布
参数跑分真那么重要？大模型评价标准该变变了

预训练大模型，自诞生以来不断刷新AI能力，成为业界竞争的焦点。参数规模突破千亿直奔万亿，开发难度和成本也随之增大。到了这个份上，大模型的开发与应用似乎成了“巨头专属”，效果越来越惊艳，离普通人却越来越

so导航站2025-04-10 发布
模型越大表现越差还能得百万奖金？纽约大学博士百万重金悬赏“反规模效应”的任务

模型越大、表现越差反而能获奖？奖金总计25万美金（折合人民币167万）？这样“离谱”的事情还真就发生了，一个名叫Inverse Scaling Prize（反规模效应奖）的比赛在推特上引发热议。该比赛

so导航站2025-04-10 发布

AI教程资讯