极客 5 月 1 日消息,科技媒体 marktechpost 昨日(4 月 30 日)发布博文,报道称 Meta AI 推出 ReasonIR-8B 模型,专为推理密集型检索设计,不仅在检索精度上取得突破,其低成本和高效率也...
极客 5 月 1 日消息,科技媒体 marktechpost 昨日(4 月 30 日)发布博文,报道称 Meta AI 推出 ReasonIR-8B 模型,专为推理密集型检索设计,不仅在检索精度上取得突破,其低成本和高效率也...
极客 5 月 1 日消息,微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量“可教导”提示数据集训练,专为复杂推理任务设计。 极客援...
极客报道 编辑:大盘鸡、泽南 DeepSeek R2 的前奏? 五一劳动节到了,DeepSeek 的新消息可没停下来。 前些天到处都在流传着 DeepSeek-R2 即将发布的传言,DeepSeek 确实有新动作,不过大...
极客报道 编辑:刘欣 在人工智能领域,语言模型的发展日新月异,推理能力作为语言模型的核心竞争力之一,一直是研究的焦点,许多的 AI 前沿人才对 AI 推理的效率进行研究。 高昂的计算成本和复杂的硬件需求一直是制约 AI 推理...
极客报道 编辑:Sia 好消息!还记得「AutoGLM 沉思」吗?短短 14 天、孵化出一个 5000 多个粉丝的小红书账号,还接到了商单! 相比 OpenAI 的 Deep Research , 「AutoGLM 沉思」不...
极客 4 月 30 日消息,小米大模型团队通过“Xiaomi MiMo”公众号宣布,今天,小米开源首个“为推理而生”的大模型 Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。据介绍,MiMo 是来自全新成立不久...
极客发布 极客编辑部 当前 AI 领域呈现「端云并发」的发展态势,端侧与云侧大模型各展所长,共同推动着智能发展与应用落地的边界。端侧模型实现本地毫秒级实时响应,云侧模型依托强大算力支持复杂大规模推理,而两者都离不开高效的推理...
本文由华东师范大学和小红书联合完成,共同第一作者是华东师范大学在读硕士、小红书 NLP 团队实习生黄文轩和翟子杰,通讯作者是小红书 NLP 团队负责人曹绍升,以及华东师范大学林绍辉研究员。 多模态大模型(MLLMs)在视觉理...
一觉醒来,全球开源的王座更替了,不是 R2。好消息是,中国用户依然是最大的受益者。 今天凌晨,阿里开源了新一代自研模型 Qwen 3(千问 3),性能全面超越 DeepSeek-R1、OpenAI o1 模型,一上线就登顶全...
极客报道 编辑:Panda、杜伟 今天凌晨,从昨晚开始预热、备受全球 AI 圈关注的 Qwen3 系列模型终于正式亮相了! Qwen3 模型依旧采用宽松的 Apache2.0 协议开源,全球开发者、研究机构和企业均可免费在...