上个月,人工智能初创公司深度求索DeepSeek推出人工智能推理模型R1,表现优于许多西方竞争对手,在全球股市引发了超过 1 万亿美元的抛售。据三位熟悉该公司的人士透露,现在DeepSeek正在加速推出R2模型,预计在5月初发布。 继续阅读
DeepSeek正在加速推出R2模型,预计在5月初发布
发表评论
上个月,人工智能初创公司深度求索DeepSeek推出人工智能推理模型R1,表现优于许多西方竞争对手,在全球股市引发了超过 1 万亿美元的抛售。据三位熟悉该公司的人士透露,现在DeepSeek正在加速推出R2模型,预计在5月初发布。 继续阅读
KTransformers 是一个灵活的、以 Python 为中心的框架,其设计核心是可扩展性、通过用一行代码实现和注入一个优化模块,用户就能访问兼容 Transformers 的界面、符合 OpenAI 和 Ollama 标准的 RESTful API,甚至是类似 ChatGPT 的简化网页用户界面。 继续阅读
清华大学 KVCache.AI 团队与趋境科技联合发布 KTransformers开源项目本周宣布迎来重大更新,成功破解千亿级大模型本地部署难题。
KTransformers 团队于 2 月 10 日成功在 24 GB 显存 + 382 GB 内存的 PC 上实现本地运行 DeepSeek-R1、V3 的 671B 满血版,速度提高 3~28 倍。 继续阅读
DeepSeek 是一个由国内团队研发的大模型,类似于 ChatGPT,专注于中文理解和生成。它在编程、数学和逻辑推理方面表现较好,也支持代码生成和优化。 继续阅读
中国媒体报道,以中国人工智能(AI)新贵深度求索(DeepSeek)为名的两家公司,星期三在香港成立,企业类型均为私人股份有限公司。 继续阅读