正文内容 评论(224)
DeepSeek的热,还在持续ing。
就在刚刚过去的周末,DeepSeek反超ChatGPT,一举登顶美区苹果应用商店免费App排行第一!
其热度之高,有网友甚至这样描述:
我甚至都不喜欢AI助手应用,但我已经下载了DeepSeek。
至于原因,正是DeepSeek在前几天开源的推理模型R1,引发了一阵又一阵的舆论热潮。
仅仅花费560万美元训练的R1,在很多AI基准测试中已经达到甚至超越OpenAI o1模型。
而且DeepSeek是真的免费,而ChatGPT虽然在免费榜上,但要是想解锁它的完全体,还是要掏上200美元……
现在要是在X上搜“DeepSeek”,目之所及,处处都是“使用DeepSeek构建一切”、“Goodbye ChatGPT”这样的话题:
并且不止是科技圈的人在关注,例如风险投资家Marc Andreessen就高度称赞道:
DeepSeek R1是我见过最令人惊叹的突破之一。
就连回应“DeepSeek将如何盈利”这个问题中的一句话——“DeepSeek是一个小项目”,也是被网友们转疯了……
嗯,火,着实是有点火。也刚引发一波复现热潮。
作为本身就是开源模型的DeepSeek R1,就在昨天还引发了一股复现热潮。
这个项目就是由HuggingFace在GitHub上发起的Open R1。
项目仅仅发布2天,已经斩获4.2K个Star。
联合创始人兼CEO Clem Delangue表示:
我们的科学团队已经开始致力于完全复制和开源R1,包括训练数据、训练脚本……
我们希望能充分发挥开源AI的力量,让全世界每个人都能受益于AI的进步!我相信这也有助于揭穿一些神话。
而在Open R1的项目文档中,官方进一步表示:
这个项目的目的是构建R1 pipeline中缺失的部分,以便所有人都能在此之上复制和构建R1。
HuggingFace表示,将以DeepSeek-R1的技术报告为指导,分3个步骤完成这个项目:
第1步:用DeepSeek-R1蒸馏高质量语料库,来复制R1-Distill模型。
第2步:复制DeepSeek用来构建R1-Zero的纯强化学习(RL)pipeline。这可能涉及为数学、推理和代码整理新的大规模数据集。
第3步:通过多阶段训练,从基础模型过渡到RL版本。
除了复现潮之外,网友们分享的玩法也是层出不穷。
例如一个小哥分享的《用DeepSeek R1构建一切》,手把手教你怎么做游戏、开发编程等等。
而从DeepSeek的热度延伸出来,国货之光的含金量还在上升:
先是DeepSeek,现在是Kimi k1.5……中国(大模型)的发展速度非常快。
对于DeepSeek引爆的热点话题,LeCun则站出来表示:
我们要关注的真正的点,应该是开源模型正在超越专有模型。
DeepSeek接下来还会引发怎样的热潮,是值得继续关注一波。
- 热门文章
- 换一波
- 1小米SU7过坑断轴车主:承认欺瞒网友 我爸是事故后才喝的酒
- 2GB/T 19266标准:五稻田五常大米10斤39.9元(70元大额券)
- 3老外酸!美国排片少 欧洲封杀《哪吒2》:我们就不看抵制
- 4比DeepSeek更强!马斯克宣布地球上最聪明AI:2月18日发布
- 5首发1.8nm级工艺!酷睿Ultra 300功耗首最高只有64W
- 6AMD Zen6终于升级单CCD 12核心!还有最革命性变化
- 7Win11 24H2支持清单删除Intel 8/9/10代酷睿:官方回应
- 8龙芯新一代8核CPU宣布!媲美12/13代酷睿 首款入门显卡来也
- 9iPhone神话在中国破灭!
- 10你给腾讯贡献多少!马化腾登顶中国富豪榜:钱多到不忍看
- 好物推荐
- 换一波
-
-
安比斯短袖款睡衣套装到手59元:吸湿透气 男女款都有
2025-02-11 0 -
JJJJ级超级巨无霸:智利车厘子28.9元/斤(京东/顺丰包邮)
2025-02-08 7
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...