从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
You need Tablerone to import collection to your browser
Add to Chrome
Send reminder
Download .txt file instead
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
This page will go offline in:
( ? )
8 hand-picked links
Save collection
Import collection
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
mp.weixin.qq.com
为什么说DeepSeek的R1-Zero比R1更值得关注?
mp.weixin.qq.com
CVPR 2025 | 扩散模型炼出新绝技!注意力蒸馏技术:图像生成效果全面碾压传统方法
mp.weixin.qq.com
从Deepseek R1和NSA算法谈谈个人的一些反思
mp.weixin.qq.com
清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神
mp.weixin.qq.com
全新注意力机制!华为诺亚提出ESA:高效选择注意力架构
mp.weixin.qq.com
R1-Zero’s “Aha Moment” in Visual Reasoning on a 2B Non-SFT Model
turningpointai.notion.site
全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理
mp.weixin.qq.com