标签归档:DeepSeek

DeepSeek正在加速推出R2模型,预计在5月初发布

上个月,人工智能初创公司深度求索DeepSeek推出人工智能推理模型R1,表现优于许多西方竞争对手,在全球股市引发了超过 1 万亿美元的抛售。据三位熟悉该公司的人士透露,现在DeepSeek正在加速推出R2模型,预计在5月初发布。 继续阅读

清华大学开源项目KTransformers DeepSeek-R1部署教程

KTransformers 是一个灵活的、以 Python 为中心的框架,其设计核心是可扩展性、通过用一行代码实现和注入一个优化模块,用户就能访问兼容 Transformers 的界面、符合 OpenAI 和 Ollama 标准的 RESTful API,甚至是类似 ChatGPT 的简化网页用户界面。 继续阅读

清华大学开源项目KTransformers突破算力瓶颈,4090 单卡跑DeepSeek-R1 满血运行

清华大学 KVCache.AI 团队与趋境科技联合发布 KTransformers开源项目本周宣布迎来重大更新,成功破解千亿级大模型本地部署难题。

KTransformers 团队于 2 月 10 日成功在 24 GB 显存 + 382 GB 内存的 PC 上实现本地运行 DeepSeek-R1、V3 的 671B 满血版,速度提高 3~28 倍。 继续阅读