24小时内容咨询信息客服在线解答内容
蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)

更新时间: 浏览次数: 258

比我老公大很多的色彩艺术:美食与色彩的视觉盛宴各服务《今日汇总》
比我老公大很多的色彩艺术:美食与色彩的视觉盛宴各客服服务2024已更新 蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约) 蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约) 是一部围绕友谊、爱情和成长的青春电影。故事延续了第一部的情节,讲述了几位性格各异的闺蜜在生活的转折点上相互支持、共同面对挑战的历程。影片通过幽默与感人的桥段,展现了她们在事业、感情上的烦恼与挣扎。每位角色都在友情的滋养下实现自我成长,寻找真爱。影片不仅充满了青春的气息,也传递了对生活的不同思考,尤其是对女性友谊的深刻理解。全片情节紧凑,笑点与泪点并存,值得观众细细品味。(2024已更新)
比我老公大很多的色彩艺术:美食与色彩的视觉盛宴咨询服务信息-——24h在线咨询信息:
比我老公大很多的色彩艺术:美食与色彩的视觉盛宴咨询服务服务信息:


蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)是什么公司

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)是一款专为商家和消费者打造的高效工具,旨在提升企业的曝光率和客户获取能力。通过简单易用的界面,商家可以快速注册并发布自己的产品和服务信息,吸引更多潜在客户。消费者能够方便地查找本地商家,获取评价和联系方式,提升购物体验。该APP还提供精准的搜索功能和分类浏览,帮助用户快速找到所需服务。无论是小型创业者还是大型企业,黄页网站推广APP都是拓展市场、增加销售的理想选择。

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)官网ios下载

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)是一款高效实用的工具,专为追求简约和高性能的用户设计。它拥有简洁的界面和快速的操作响应,让用户在使用过程中能够专注于任务本身。软件占用内存小,适合低配置设备,确保流畅运行。Pailpail轻量版还支持多种文件格式的处理,满足用户不同的需求。无论是日常办公还是个人项目管理,Pailpail轻量版都能提供出色的支持,助您更轻松地完成工作。立即下载,体验高效办公的新选择!

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)-2

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)在线

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)是一部关于人权与正义的电影,它讲述了一位律师为被冤枉的被告人辩护的故事。影片中的剧情紧张刺激,让人感受到了正义的力量与勇气。

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)吃瓜合集

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)一部充满黑色幽默与讽刺意味的喜剧片。影片以一块珍贵的翡翠为线索,展开了一系列荒诞不经的故事。让人在笑声中反思社会的种种现象。




蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)



蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)-3

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)


蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)


蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)


蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)电影坐标

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)越来越多的平台提供了丰富多样的内容,以满足用户的不同需求。根据最新数据,夜间直播的最大尺寸下载排行显示,内容涵盖了游戏直播、音乐表演、互动聊天等多个领域,吸引了大量观众。其中,游戏直播以其刺激的竞争和即时的互动,位列榜首;而音乐类直播则以其独特的氛围和现场感紧随其后。与此互动性强的聊天节目也逐渐受到欢迎,成为用户交流的热门选择。这些直播内容不仅丰富了夜间娱乐,也为创作者提供了新的机遇和挑战。

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)合集

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)以独特的视角和幽默的故事,探讨了人类与机器人的关系以及环保的重要性。影片中的瓦力和伊娃让人印象深刻,它们的爱情也让人感动。

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)带你另眼看世界

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)是一部青春爱情题材的电视剧,讲述了女主角春花与男主角秋月之间的甜蜜浪漫故事。两人在机缘巧合下相识,共同经历了成长与挑战,逐渐打破误会,收获真爱。该剧不仅展现了年轻人的追梦过程,也反映了友情、亲情的温暖。精美的画面、动人的音乐和细腻的情感描写,使得这部剧受到观众的喜爱。想要免费观看全集的观众,可以在西瓜视频等平台寻找资源,感受这段充满激情与感动的爱情故事。


蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)官网ios下载

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)是一个集信息发布与查询的平台,致力于为用户提供精准的商家和服务信息。在这里,用户可以轻松找到各类行业的企业,包括餐饮、酒店、医疗、教育等。黄页网站支持商家注册和推广,帮助他们提升知名度和客户流量。通过便捷的搜索功能,用户可以按照地理位置、行业类别和服务类型进行筛选,迅速获取所需信息。黄页网站还提供用户评价和反馈功能,帮助其他消费者做出明智的选择。无论是寻找服务还是提升商机,黄页网站都是一个不可或缺的工具。







蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)





服务服务中心不求利润多少,只求服务更好,全天为您服务服务范围: 蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约) 蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约) 是一部备受期待的韩国悬疑犯罪剧,续集延续了前作的精彩故事。剧集围绕着检察官和警察之间的复杂关系展开,他们共同调查一系列扑朔迷离的案件。在新一季中,主角们面临更大的挑战和道德困境,揭示了权力与腐败的暗面。通过紧凑的节奏和引人入胜的剧情,观众将跟随角色深度探索人性及正义的界限。《秘密森林2》不仅保留了前作的悬疑氛围,还在角色发展和情感深度上做了更深入的挖掘,注定让人欲罢不能。
北京市(东城区、西城区、崇文区、宣武区、朝阳区、丰台区、石景山区、海淀区、门头沟区
房山区、通州区、顺义区、昌平区、大兴区)
天津市(和平区、河东区、河西区、南开区、河北区、红桥区、塘沽区、汉沽区、大港区、东丽区、西青区、津南区、北辰区、武清区、宝坻区)
石家庄市(长安区、桥东区、桥西区、新华区、郊区、井陉矿区)
唐山市( 路南区、路北区、古治区、开平区、新区)
秦皇岛(海港区、山海关区、北戴河区)
保定市(莲池区、竞秀区)
张家口市(桥东区、桥西区、宜化区、下花园区)

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)






蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)


蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)

承德市(双桥区、双滦区)
沧州市(新华区、运河区)
廊坊市(安次区、广阳区)
太原市(小店区、迎泽区、杏花岭区、尖草坪区、万柏林区、晋源区)
大同市(城区、矿区、南郊区、新荣区) 蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约) 蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约) 一部充满创意与激情的科幻电影。它以其独特的虚拟世界和精彩的战斗场面让人在震撼中感受到科技的魅力与未来。
朔州市(朔城区、平鲁区)
包头市(东河区、昆都伦区、青山区、石拐矿区、白云矿区、九原区)
赤峰市(红山区、元宝山区、松山区)

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)






蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)


沈阳市(和平区、沈河区、大东区、皇姑区、苏家屯区、东陵区、新城子区、于洪区)
大连市(中山区、西岗区、沙河口区、甘井子区、旅顺口区、金州区)
长春市(南关区、宽城区、朝阳区、二道区、绿园区、双阳区)
辽源市(龙山区、 区)
松原市(宁江区)
昆山市、太仓市
哈尔滨市(道里区、南岗区、道外区、松北区、香坊区、阿城区、平房区、呼兰区)
大庆市(萨尔图区、龙凤区、让胡路区、红岗区、大同区)

蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)

上海市(浦东新区、徐汇区、黄浦区、杨浦区、虹口区、闵行区、长宁区、普陀区、宝山区、静安区、闸北区、卢湾区、松江区、嘉定区、南汇区、金山区、青浦区、奉贤区)
南京市(玄武区、白下区、秦淮区、建邺区、下关区、浦口区、栖霞区、雨花台区、江宁区、区)
市(梁溪区、滨湖区、惠山区、新吴区、锡山区)
徐州市(鼓楼区、云龙区、贾汪区、泉山区、铜山区)
常州市(天宁区、钟楼区、新北区、武进区、金坛区)







苏州市(虎丘区、吴中区、相城区、姑苏区、吴江区)
南通市(崇州区、港闸区、通州区)
扬州市(广陵区、邗江区、江都区)
杭州市(临安区、上城区、下城区、江干区、拱野区、西湖区、滨江区、余杭区)
宁波市(海曙区、江东区、江北区、北仑区、镇海区)
温州市(鹿城区、龙湾区、瓯海区、洞头区)
嘉兴市(南湖区、秀洲区)
湖州市(吴兴区、南浔区)
绍兴市(越城区、柯桥区、上虞区)
金华市(金东区)
舟山市(定海区、普陀区)
台州市(椒江区、黄岩区、路桥区)
合肥市(瑶海区、庐阳区、蜀山区、包河区)
芜湖市(镜湖区、戈江区、鸠江区、三山区)
蚌埠市(龙子湖区、蚌山区、禹会区、淮上区)
马鞍山市(花山区、雨山区)
安庆市(迎江区、大观区、宜秀区)
宿州市(埇桥区)
六安市(金安区、裕安区、叶集区)
福州市(鼓楼区、台江区、仓山区、马尾区、晋安区、长乐区)
厦门市(思明区、海沧区、湖里区、集美区、同安区、翔安区)
莆田市(城厢区、涵江区、秀屿区)
泉州市(鲤城区、丰泽区、洛江区、泉港区)
漳州市(芗城区、龙文区)
南昌市(东湖区、西湖区、青云谱区、湾里区、青山湖区、新建区)
景德镇市(昌江区、珠山区)
萍乡市(安源区、湘东区)
九江市(莲溪区、浔阳区)








宜春市(袁州区)
济南市(历下区、市中区、槐荫区、天桥区、历城区、长清区)蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)
烟台市(芝罘区、福山区、开发区、莱山区)
威海市(环翠区)
郑州市(中原区、二七区、管城区、金水区、上街区、惠济区)蓝奏云资源共享吧“这款应用的定位功能很准确,找朋友、找地点都很方便。”(在线预约)
洛阳市(老城区、西工区、涧西区、吉利区、洛龙区)
新乡市(红旗区、卫滨区、凤泉区、牧野区)
焦作市(解放区、中站区、马村区、山阳区)
周口市(川江区)
武汉市(江岸区、江汉区、硚口区、汉阳区、武昌区、青山区)
黄石市(黄石港区、西寨山区、下陆区、铁山区)
十堰市(茅箭区、张湾区)
郑州市(芙蓉区、天心区、岳麓区、开福区、雨花区、望城区)
郴州市(北湖区、苏仙区)
怀化市(鹤城区)
娄底市(娄星区)
广州市(荔湾区、越秀区、海珠区、天河区、白云区、黄浦区)
深圳市(罗湖区、福田区、南山区、宝安区、龙岗区、盐田区)
茂名市(茂南区、茂港区)
河源市(源城区)
东莞市、中山市、潮州市、揭阳市
南宁市(兴宁区、青秀区、西乡塘区、江南区、良庆区)
桂林市(秀峰区、叠彩区、象山区、七星区、雁山区)
玉林市(玉州区)
重庆市(万州区、涪陵区、渝中区、大渡口区、江北区、沙坪坝区、九龙坡区、南岸区、北培区、万盛区、双桥区、渝北区、巴南区)
成都市(锦江区、青羊区、金牛区、武侯区、成华区、龙泉驿区、青白江区、双流区、新都区)
绵阳市(培城区、游仙区)
内江市(市中区、东兴区)
乐山市(市中区、沙湾区、五通桥区、金口河区)






贵阳市(南明区、云岩区、花溪区、乌当区、白云区、小河区)
遵义市(红花岗区、汇川区)
昆明市(五华区、盘龙区、官渡区、西山区、东川区、呈贡区)
咸阳市(秦都区、杨凌区、渭城区)
渭南市(临渭区、华州区)
西安市(新城区、碑林区、莲湖区、灞桥区、未央区、雁塔区)
宝鸡市(渭滨区、金台区)
兰州市(城关区、七里河区、西固区、安宁区、红古区)

DeepSeek 被误读的 5 个真相,AI 大佬亲自揭秘

让我们再复习一遍:小红靠捧,大红靠命。

DeepSeek 已经爆火了一个春节,红起来自然是非就多。尤其在海外局势变化错综复杂的情况下,DeepSeek 的中国血统,给它招来了许多谣言。

Stability AI 曾经的研究主管 Tanishq Mathew Abraham 昨天挺身而出,以自己业内人士的身份下场,指出了 DeepSeek 极为特殊的几点:

1.性能实际上与 OpenAI 的 o1 一样好,这是一个前沿模型,标志着开源真正赶上了闭源

2.与其他前沿模型相比,DeepSeek 以相对较低的训练费用完成

3.易于使用的界面,结合其网站和应用程序中可见的思维链,吸引了数百万新用户加入

除此之外,他更是针对几大流行的谣言,写了长长一篇博文,分析解释了围绕在 DeepSeek 四周的(离谱)言论。

以下为博客文章,内容有所编辑:

2025 年 1 月 20 日,一家名为 DeepSeek 的中国 AI 公司开源并发布了他们的推理模型 R1。鉴于 DeepSeek 是一家中国公司,美国及其 AGI 公司存在各种「国家安全担忧」。由于这一点,**关于它的错误信息已经广泛传播。**

这篇文章的目的是反驳自 DeepSeek 发布以来,许多关于 DeepSeek 的极端糟糕的 AI 相关观点。同时,作为一个在生成式 AI 前沿工作的 AI 研究人员,提供更有平衡性的观点。

谣言 1:可疑!DeepSeek 是一家突然冒出来的中国公司

完全错误,到 2025 年 1 月,几乎所有生成式 AI 研究人员都已经听说过 DeepSeek。DeepSeek 甚至在完整发布前几个月就发布了 R1 的预览!

任何传播这种谣言的人,很可能并不从事人工智能工作——如果你不涉足该领域,却以为自己了解这个领域的一切,是荒谬且极其自负的。

DeepSeek 的首个开源模型 DeepSeek-Coder,于 2023 年 11 月发布。当时是业界领先的代码 LLMs(编者注:专注于理解和生成代码的语言模型)。正如下面的图表所示,DeepSeek 在一年内持续发货,达到 R1:

这不是一夜之间的成功,他们进步的速度也没有什么可疑之处。在人工智能发展如此迅速,且他们拥有一个明显高效的团队的情况下,一年内取得这样的进步在我看来是非常合理的。

如果您想知道哪些公司在公众视野之外,但 AI 领域内备受看好,我会推荐关注 Qwen(阿里巴巴)、YI(零一万物)、Mistral、Cohere、AI2。需要注意的是,它们没有像 DeepSeek 那样持续发布 SOTA 模型,但它们都**有潜力发布出色的模型**,正如它们过去所展示的那样。

谣言 2:撒谎!这个模型的成本不是 600 万美元

这是一个有趣的问题。这类谣言认为 DeepSeek 想避免承认他们有非法的幕后交易来获取他们不应获得的计算资源(由于出口管制),从而在关于模型训练成本的真实性上撒谎。

首先,600 万美元这个数字值得好好研究。它在 DeepSeek-V3 论文中有提及,该论文是在 DeepSeek-R1 论文发布前一个月发布的:

DeepSeek-V3 是 DeepSeek-R1 的基础模型,这意味着 DeepSeek-R1 是 DeepSeek-V3 加上一些额外的强化学习训练。所以在某种程度上,成本已经不准确,因为强化学习训练的额外成本没有被计算在内。但那可能只会花费几十万美元。

好的,那么 DeepSeek-V3 论文中提到的 550 万美元,是不正确的吗?基于 GPU 成本、数据集大小和模型大小的众多分析,已经得出了类似的估计。请注意,虽然 DeepSeek V3/R1 是一个 671B 参数的模型,但它是一个专家混合模型,这意味着模型的任何函数调用/前向传递只使用约 37B 参数,这是计算训练成本所使用的值。

然而,DeepSeek 的成本,是基于当前市场价格估计的这些 GPU 的成本。我们实际上并不知道他们的 2048 个 H800 GPU 集群(注意:不是 H100s,这是一个常见的误解和混淆!)的成本。通常,连续的 GPU 集群在批量购入时成本会更低,因此甚至可能更便宜。

但是这里有个问题,这是最终运行的成本。在这成功之前,可能进行了许多在小规模的实验和消融,这一部分会需要相当大的成本,但这些并未在此处报告。

除此之外,可能还有许多其他成本,如研究员薪资。SemiAnalysis 报告称,DeepSeek 的研究员薪资传闻约为 100 万美元。这相当于 AGI 前沿实验室如 OpenAI 或 Anthropic 的高薪水平。

通常,当报道和比较不同模型的训练成本时,最终的训练运行成本是最受关注的。但由于糟糕的论调和错误信息的传播,人们一直在争论额外的成本使 DeepSeek 的低成本和高效运营性质受到质疑。这是极其不公平的。无论是从消融/实验的角度,还是从其他 AGI 前沿实验室的研究人员薪酬的角度来看,成本都非常显著,但这些通常在这样的讨论中没有被提及!

谣言 3:这么便宜?所有美国 AGI 公司都在浪费钱,看跌英伟达

我认为这又是一个相当愚蠢的看法。与许多其他 LLM 相比,DeepSeek 在训练中确实效率更高。是的,许多美国前沿实验室在计算上效率低下是非常可能的。然而,这并不一定意味着拥有更多的计算资源是坏事。

老实说,每当听到这样的观点,我就清楚地知道他们不懂 scaling laws,也不懂 AGI 公司 CEO(以及任何被视为 AI 专家的人)的心态。让我就这个话题发表一些看法。

Scaling laws 表明,只要我们继续将更多的计算能力投入到模型中,我们就能获得更好的性能。当然,AI 扩展的确切方法和方面随着时间的推移而发生了变化:最初是模型大小,然后是数据集大小,现在是推理时间计算和合成数据。

自 2017 年原始 Transformer 以来,更多的计算能力等于更好的性能的整体趋势似乎仍在持续。

更高效的模型意味着您可以在给定的计算预算下获得更高的性能,但更多的计算资源仍然更好。更高效的模型意味着你可以用更少的计算资源做更多的事情,但使用更多的计算资源,可以做到更多!

你可能有自己的关于 scaling laws 的看法。你可能认为即将出现一个平台期。你可能认为过去的表现并不能预示未来的结果,正如金融界所说。

但如果所有最大的 AGI 公司都在押注 scaling laws 能够持续足够长的时间,以实现 AGI 和 ASI。这是他们的坚定信念,那么唯一合理的行动就是获取更多的计算能力。

现在你可能认为「NVIDIA 的 GPU 很快就会过时,看看 AMD、Cerebras、Graphcore、TPUs、Trainium 等」,blabla。有数百万种针对 AI 的硬件产品,都在试图与 NVIDIA 竞争。其中之一可能在将来获胜。在这种情况下,也许这些 AGI 公司会转向它们——但这与 DeepSeek 的成功完全无关。

个人而言,我认为没有强有力的证据表明其他公司会撼动 NVIDIA 在 AI 加速芯片领域的统治地位,鉴于 NVIDIA 目前的市场统治地位和持续的创新水平。

总体而言,我看不出为什么 DeepSeek 意味着你应该看跌 NVIDIA。你可能有其他理由看跌 NVIDIA,这些理由可能非常合理且正确,但 DeepSeek 似乎不是我认为合适的理由。

谣言 4:模仿罢了!DeepSeek 没有做出任何有意义的创新

错误。**语言模型的设计和训练方法有很多创新,其中一些比其他更重要**。以下是一些(不是完整的列表,可以阅读 DeepSeek-V3 和 DeepSeek-R1 论文以获取更多详细信息):

多头潜注意力 (MLA) – LLMs 通常是指利用所谓的多头注意力(MHA)机制的 Transformer。DeepSeek 团队开发了一种 MHA 机制的变体,它既更节省内存,又提供更好的性能。

GRPO 与可验证奖励 – 自从 o1 发布以来,AI 从业者一直在尝试复制它。由于 OpenAI 对它的工作方式一直相当保密,大家不得不探索各种不同的方法来实现类似 o1 的结果。有各种尝试,如蒙特卡洛树搜索(谷歌 DeepMind 在围棋中获胜所采用的方法),结果证明不如最初预期的那样有希望。

DeepSeek 展示了一个非常简单的强化学习(RL)管道实际上可以实现类似 o1 的结果。除此之外,他们还开发了自己变种的常见 PPO RL 算法,称为 GRPO,它更高效且性能更好。我想 AI 社区中的许多人都在想,我们为什么之前没有尝试过这种方法呢?

DualPipe – 在多个 GPU 上训练 AI 模型时,有许多效率方面需要考虑。你需要弄清楚模型和数据集如何在所有 GPU 之间分配,数据如何通过 GPU 流动等。你还需要减少 GPU 之间任何数据传输,因为它非常慢,最好尽可能在每个单独的 GPU 上处理。无论如何,有许多设置此类多 GPU 训练的方法,DeepSeek 团队设计了一种新的、效率更高且速度更快的解决方案,称为 DualPipe。

我们非常幸运,DeepSeek 完全开源了这些创新,并写了详细的介绍,这与美国 AGI 公司不同。现在,每个人都可以受益,用这些创新的办法来提高他们自己的 AI 模型训练。

谣言 5:DeepSeek 正在「汲取」ChatGPT 的知识

戴维·萨克斯(美国政府的 AI 和加密巨头)和 OpenAI 声称,DeepSeek 使用一种称为蒸馏的技术「汲取」ChatGPT 的知识。

首先,这里的「蒸馏」一词使用得非常奇怪。通常,蒸馏指的是在所有可能的下一个词(token)的全概率(logits)上进行训练,但这个信息甚至不能通过 ChatGPT 暴露出来。

但是好吧,就假设我们在讨论如何使用 ChatGPT 生成的文本进行训练,尽管这并不是该术语的典型用法。

OpenAI 及其员工声称 DeepSeek 自己使用 ChatGPT 生成文本并在此基础上进行训练。他们没有提供证据,但如果这是真的,那么 DeepSeek 显然违反了 ChatGPT 的服务条款。我认为这对一家中国公司来说,法律后果尚不明确,但我对此了解不多。

请注意,这仅限于 DeepSeek 自己生成了用于训练的数据。如果 DeepSeek 使用了来自其他来源的 ChatGPT 生成数据(目前有许多公开数据集),我的理解是这种「蒸馏」或合成数据训练并未被 TOS 禁止。

尽管如此,在我看来,这并不减少 DeepSeek 的成就。与 DeepSeek 的效率方面相比,作为研究人员,让我印象更深刻的是他们对 o1 的复制。我非常怀疑对 ChatGPT 进行「蒸馏」有任何帮助,这种怀疑完全是出于 o1 的 CoT 思维过程从未公开过,那么 DeepSeek 如何能够学习它呢?

此外,许多 LLMs 确实在 ChatGPT(以及其他 LLM)上进行了训练,而且在新抓取的任何互联网内容中自然也会有 AI 文本。

总体而言,认为 DeepSeek 的模型表现良好仅仅是因为它简单提炼了 ChatGPT 的观点,是忽略了 DeepSeek 在工程、效率和架构创新方面的现实。

应该担心中国在人工智能领域的霸权吗?

或许有一点?坦白说,现在和两个月前相比,中美 AI 竞赛在实质上并没有太多变化。相反,外界的反应相当激烈,这确实可能通过资金、监管等方面的变化影响整体 AI 格局。

中国人一直都在人工智能领域具有竞争力,DeepSeek 现在让他们变得无法忽视。

关于开源的典型论点是,由于中国落后,我们不应该公开分享我们的技术,让他们赶上。但显然,中国已经赶上了,他们实际上很久以前就已经赶上了,他们在开源方面实际上处于领先地位,因此不清楚进一步收紧我们的技术,实际上的帮助是否有那么大。

请注意,像 OpenAI、Anthropic 和 Google DeepMind 这样的公司肯定有比 DeepSeek R1 更好的模型。例如,OpenAI 的 o3 模型的基准测试结果相当令人印象深刻,他们可能已经有一个后续模型正在开发中。

在此基础上,随着像星门项目以及 OpenAI 即将到来的融资轮等重要额外投资,OpenAI 和其他美国前沿实验室将拥有充足的计算能力,以保持他们的领先地位。

当然,中国将向人工智能发展投入大量额外资金。所以总的来说,竞争正在升温!但我认为,美国 AGI 前沿实验室保持领先的道路仍然相当有希望。

结论

一方面,一些 AI 人士,尤其是 OpenAI 的一些人,试图淡化 DeepSeek。而另一方面,一些评论家和自称专家对 DeepSeek 又反应过度。

需要指出的是,OpenAI/Anthropic/Meta/Google/xAI/NVIDIA 等并没有就此完蛋。不,DeepSeek (很可能)没有在说他们所做的事情上撒谎。无论如何必须承认的是:DeepSeek 应得到认可,R1 是一个令人印象深刻的模型。

xtt一攻多受H嗯啊巨肉的绿色环保行动:守护地球,从美食开始原来是真的!

吊死男士2真是太棒了!它帮我规划了整天的行程,让我效率大增。”靠谱推荐
不可撤销 百度影音的特效很逼真,让我仿佛置身于电影中的时空世界。(在线预约)
地域风味的密码:解锁火力少年王3动画版第二部行业的地域特色靠谱推荐
两女 一杯原版的匠心传承:手艺人的坚守与传承(在线预约)
奔跑吧第九季2021的社交新平台:美食成为连接你我他的桥梁在线上门服务
查看更多评价 ∨
服务信息