训练 - 极客

网站首页 > 训练

极客 2025-05-03 模式运动训练

小米推出米家智能跳绳 2，众筹价 95 元

极客 5 月 3 日消息，米家智能跳绳 2 现已上架小米有品，众筹价 95 元，活动时间 5 月 7 日 10:00-5 月 14 日 10:00。商品页面显示，这款新品支持连接米家 App 或小米运动健康 App，提供...

科技

1查看

0评论
极客 2025-05-01 模型学习训练

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述

极客报道编辑：Panda 现如今，微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。近日，一份围绕 LLM 后训练的综述报告收获了不少好评，其整理相关论文和工具的资源库已经收获了超过 700 star。...

科技

1查看

0评论
极客 2025-05-01 模型数据训练

DeepSeek开源Prover-V2强推理模型，网友：奥数从没这么简单过

极客报道编辑：大盘鸡、泽南 DeepSeek R2 的前奏？五一劳动节到了，DeepSeek 的新消息可没停下来。前些天到处都在流传着 DeepSeek-R2 即将发布的传言，DeepSeek 确实有新动作，不过大...

科技

4查看

0评论
极客 2025-04-30 训练模型

南京大学李武军教授课题组分布式训练算法，大模型训练加速3.8倍

李武军教授为通讯作者，硕士生林昊（已毕业，现工作于阿里巴巴）、吴轲、李杰为共同第一作者，博士生李俊为参与作者。训练成本高昂已经成为大模型和人工智能可持续发展的主要障碍之一。大模型的训练往往采用多机多卡的分布式训练，大模型...

科技

1查看

0评论
极客 2025-04-30 模型推理训练

只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍

极客报道编辑：刘欣在人工智能领域，语言模型的发展日新月异，推理能力作为语言模型的核心竞争力之一，一直是研究的焦点，许多的 AI 前沿人才对 AI 推理的效率进行研究。高昂的计算成本和复杂的硬件需求一直是制约 AI 推理...

科技

1查看

0评论
极客 2025-04-30 训练推理开源

小米开源“Xiaomi MiMo”大模型：以7B参数超越OpenAI o1-mini

极客 4 月 30 日消息，小米大模型团队通过“Xiaomi MiMo”公众号宣布，今天，小米开源首个“为推理而生”的大模型 Xiaomi MiMo，联动预训练到后训练，全面提升推理能力。据介绍，MiMo 是来自全新成立不久...

科技

1查看

0评论
极客 2025-04-29 模型数据训练

猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型

极客报道编辑：Panda、杜伟今天凌晨，从昨晚开始预热、备受全球 AI 圈关注的 Qwen3 系列模型终于正式亮相了！ Qwen3 模型依旧采用宽松的 Apache2.0 协议开源，全球开发者、研究机构和企业均可免费在...

科技

1查看

0评论
极客 2025-04-29 模型能力训练

阿里开源 Qwen3 系列“混合”推理模型，据称全面超越 Llama 4

备受关注的Qwen3 终于来了。此前就陆续有消息宣称阿里将于4 月更新其 Qwen 系列模型，终于，在四月的最后两天，阿里巴巴 Qwen Team 对外发布了其 Qwen 系列大型语言模型的新成员——Qwen3。此次发布...

科技

1查看

0评论
极客 2025-04-29 模型数据训练

阿里通义千问大模型 Qwen3 发布并开源：支持两种思考模式

极客 4 月 29 日消息，今日凌晨，阿里巴巴发布了新一代通义千问 Qwen3 模型，一举登顶全球最强开源模型。 Models Layers Heads (Q / KV Tie Embedding Context Leng...

科技

1查看

0评论
极客 2025-04-28 训练

字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀

极客报道编辑：杜伟最近，DeepSeek-R1 和 OpenAI o1/03 等推理大模型在后训练阶段探索了长度扩展（length scaling），通过强化学习（比如 PPO、GPRO）训练模型生成很长的推理链（CoT...

科技

1查看

0评论

1 2 3 4 5