推理 - 极客

网站首页 > 推理

极客 2025-05-01 模型推理

Meta 发布 ReasonIR-8B：破解复杂推理检索难题

极客 5 月 1 日消息，科技媒体 marktechpost 昨日（4 月 30 日）发布博文，报道称 Meta AI 推出 ReasonIR-8B 模型，专为推理密集型检索设计，不仅在检索精度上取得突破，其低成本和高效率也...

科技

1查看

0评论
极客 2025-05-01 模型推理通过

微软重磅发布Phi-4推理模型，小型AI挑战大模型霸主

极客 5 月 1 日消息，微软昨日（4 月 30 日）发布 Phi-4-reasoning 系列推理模型，通过监督微调 Phi-4，并利用 o3-mini 生成的高质量“可教导”提示数据集训练，专为复杂推理任务设计。极客援...

科技

1查看

0评论
极客 2025-05-01 模型数据训练

DeepSeek开源Prover-V2强推理模型，网友：奥数从没这么简单过

极客报道编辑：大盘鸡、泽南 DeepSeek R2 的前奏？五一劳动节到了，DeepSeek 的新消息可没停下来。前些天到处都在流传着 DeepSeek-R2 即将发布的传言，DeepSeek 确实有新动作，不过大...

科技

4查看

0评论
极客 2025-04-30 模型推理训练

只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍

极客报道编辑：刘欣在人工智能领域，语言模型的发展日新月异，推理能力作为语言模型的核心竞争力之一，一直是研究的焦点，许多的 AI 前沿人才对 AI 推理的效率进行研究。高昂的计算成本和复杂的硬件需求一直是制约 AI 推理...

科技

1查看

0评论
极客 2025-04-30 模型推理体验

智谱深夜开源新一代GLM模型，推理速度快DeepSeek-R1八倍

极客报道编辑：Sia 好消息！还记得「AutoGLM 沉思」吗？短短 14 天、孵化出一个 5000 多个粉丝的小红书账号，还接到了商单！相比 OpenAI 的 Deep Research ，「AutoGLM 沉思」不...

科技

1查看

0评论
极客 2025-04-30 训练推理开源

小米开源“Xiaomi MiMo”大模型：以7B参数超越OpenAI o1-mini

极客 4 月 30 日消息，小米大模型团队通过“Xiaomi MiMo”公众号宣布，今天，小米开源首个“为推理而生”的大模型 Xiaomi MiMo，联动预训练到后训练，全面提升推理能力。据介绍，MiMo 是来自全新成立不久...

科技

1查看

0评论
极客 2025-04-29 计算推理优化

无问芯穹开源大模型推理加速神器，加码构建新一代端、云推理系统

极客发布极客编辑部当前 AI 领域呈现「端云并发」的发展态势，端侧与云侧大模型各展所长，共同推动着智能发展与应用落地的边界。端侧模型实现本地毫秒级实时响应，云侧模型依托强大算力支持复杂大规模推理，而两者都离不开高效的推理...

科技

2查看

0评论
极客 2025-04-29 推理视觉

首个动态视觉-文本稀疏化框架来了，计算开销直降50%-75%

本文由华东师范大学和小红书联合完成，共同第一作者是华东师范大学在读硕士、小红书 NLP 团队实习生黄文轩和翟子杰，通讯作者是小红书 NLP 团队负责人曹绍升，以及华东师范大学林绍辉研究员。多模态大模型（MLLMs）在视觉理...

科技

1查看

0评论
极客 2025-04-29 模型一个推理

我在通义 APP 体验了全球最强开源模型 Qwen 3，它改变了我对国产 AI 的期待

一觉醒来，全球开源的王座更替了，不是 R2。好消息是，中国用户依然是最大的受益者。今天凌晨，阿里开源了新一代自研模型 Qwen 3(千问 3），性能全面超越 DeepSeek-R1、OpenAI o1 模型，一上线就登顶全...

科技

1查看

0评论
极客 2025-04-29 模型数据训练

猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型

极客报道编辑：Panda、杜伟今天凌晨，从昨晚开始预热、备受全球 AI 圈关注的 Qwen3 系列模型终于正式亮相了！ Qwen3 模型依旧采用宽松的 Apache2.0 协议开源，全球开发者、研究机构和企业均可免费在...

科技

1查看

0评论

1 2 3 4