24小时业务咨询客服在线解答业务
迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务

更新时间: 浏览次数: 258

服务:(点击咨询)

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务

善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。各《今日汇总》
善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。各客服2024已更新(2024已更新)

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务是什么公司

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务是一部引人入胜的泰剧,改编自同名小说。这部小说围绕着主人公们的复杂情感展开,讲述了他们在爱情与秘密之间的挣扎。故事中的两位主角在意外中相遇,彼此吸引,但各自背负着不可告人的过去。随着情节的发展,他们的心灵逐渐打开,穿越重重阻碍,试图找到属于自己的幸福。小说不仅展现了甜蜜浪漫的爱情,还探讨了信任、背叛与救赎,让人深思。

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务电影

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务系列电影是一部魔幻世界的史诗,它陪伴了一代人的成长。影片中的魔法、友情和勇气让人向往,也让我们明白了成长的意义和价值。

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务-2

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务官网ios下载

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务是一个为影迷们提供丰富影视资源的平台,致力于让用户在舒适的环境中享受优质的影视作品。网站汇聚了最新的电影、电视剧、综艺节目等多种类型的资源,无论是热门大片还是经典老片,都能一一找到。用户界面友好,搜索功能强大,方便观众快速定位想要观看的内容。平台支持多种观看模式,满足不同用户的需求,带来极致的视觉享受。无需注册,随时随地即可畅享精彩影视盛宴。

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务电影

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务是一款以成人向为主题的模拟游戏,玩家在游戏中探索一个充满奇幻元素的馆,馆内设有多种互动场景和角色。游戏的核心玩法围绕着角色之间的互动与“榨精”机制,结合独特的3D建模,展现出丰富的视觉效果和细腻的动作设计。玩家可以通过完成任务和解锁场景,体验不同的剧情走向和角色关系。虽然该游戏在成人内容上具有较强的表现,但也融入了一定的幽默感和幻想元素,使其在特定圈子中获得了一定的人气。注意,本游戏适合成年玩家,需谨慎选择。

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务电影

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务这部动画电影以其独特的画风和深刻的主题赢得了观众的喜爱。影片通过描绘一个小女孩在神秘世界的冒险经历,探讨了人性的善恶与成长的意义。同时,影片也传递了勇敢面对困难、珍惜友情等积极向上的价值观。

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务吃瓜合集

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务是一种利用机器学习算法生成新的内容技术,包括文本、图像、音频和视频等。它基于大量数据训练,通过识别模式和特征,能够创造出看似真实的内容。近年来,巨大生成在各个领域得到了广泛应用,例如自动化写作、艺术创作、游戏开发和虚拟现实等。尽管它提供了无限的创作可能,但也引发了关于版权、伦理和虚假信息的讨论。随着技术的不断进步,巨大生成将在未来发挥更加重要的作用。

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务在线播放

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务是一种利用机器学习算法生成新的内容技术,包括文本、图像、音频和视频等。它基于大量数据训练,通过识别模式和特征,能够创造出看似真实的内容。近年来,巨大生成在各个领域得到了广泛应用,例如自动化写作、艺术创作、游戏开发和虚拟现实等。尽管它提供了无限的创作可能,但也引发了关于版权、伦理和虚假信息的讨论。随着技术的不断进步,巨大生成将在未来发挥更加重要的作用。

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务-3

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务在线播放

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务是一部充满诗意的作品,以金银花为核心元素,展现了自然与人心的交融。故事围绕一个年轻的女子,她在喧嚣的生活中,寻找到一片宁静的天地。在这里,金银花绽放,芬芳四溢,成为她内心寄托与情感释怀的符号。通过细腻的描绘,作者不仅展现了金银花的美丽,更传达出对生活的独特理解与对美好事物的向往。这篇作品让人感受到生命的韧性与爱的力量,令人回味无穷。








迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务

善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。 迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务 迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务 是一部兼具幽默与感动的青春喜剧,延续了前作的精彩剧情。影片围绕几位性格各异的闺蜜展开,她们在追求梦想的过程中,经历了友情的考验与自我成长。故事通过轻松诙谐的对话与感人的情节,展现了青春的烦恼与美好,探讨了爱情、友情和自我认同的重要性。每个角色都充满魅力,令观众在欢笑中感受到温暖与力量。这是一部值得年轻人观看的影片,让人忍不住反思自己的生活与梦想。服务:(1)(点击咨询)(2)(点击咨询)








善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。24小时客服(1)(点击咨询)(2)(点击咨询)


迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务



善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。各区点客服《今日发布》
善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。




迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务





7天24小时人工为您、善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。团队在调度中心的统筹调配下,线下专业及各地区人员团队等专属,整个咨询流程规范有序,后期同步跟踪查询公开透明。



迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务






所有团队均经过专业培训、持证上岗,所用产品信息均为原厂直供,

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务









善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。 迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务 迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务 是一部以金银花为主题的小说,讲述了一个充满情感与古韵的故事。故事中的主人公在复杂的情感纠葛中,逐渐领悟到生活的真谛与爱的力量。金银花象征着纯洁与坚韧,贯穿整个情节,展现了人物在逆境中不屈不挠的精神。书中细腻的描写让人仿佛置身于那片温馨的世界。情节扣人心弦,引发读者深思,适合喜欢古风浪漫的读者阅读。各《今日汇总》2024已更新(今日/推荐)

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务


迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务


迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务






善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。区域:

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务








北京市(东城区、西城区、崇文区、宣武区、朝阳区、丰台区、石景山区、海淀区、门头沟区 昌平区、大兴区)

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务






迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务




天津市(和平区、河东区、河西区、南开区、河北区、红桥区、塘沽区、东丽区、西青区、)


迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务






迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务


石家庄市(桥东区、长安区、裕华区、桥西区、新华区。)

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务






迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务

保定市(莲池区、竞秀区)  廊坊市(安次区、广阳区,固安)






迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务


太原市(迎泽区,万柏林区,杏花岭区,小店区,尖草坪区。)








迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务
大同市(城区、南郊区、新荣区)




迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务



迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务
榆林市(榆阳区,横山区)朝阳市(双塔区、龙城区)


迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务




迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务


南京市(鼓楼区、玄武区、建邺区、秦淮区、栖霞区、雨花台区、浦口区、区、江宁区、溧水区、高淳区)  成都市(锡山区,惠山区,新区,滨湖区,北塘区,南长区,崇安区。)
迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务





迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务



常州市(天宁区、钟楼区、新北区、武进区)








迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务
苏州市(吴中区、相城区、姑苏区(原平江区、沧浪区、金阊区)、工业园区、高新区(虎丘区)、吴江区,原吴江市)








常熟市(方塔管理区、虹桥管理区、琴湖管理区、兴福管理区、谢桥管理区、大义管理区、莫城管理区。)宿迁(宿豫区、宿城区、湖滨新区、洋河新区。)

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务




迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务

迅雷vip共享账号密码悬疑片中的线索与证据,引导观众一步步揭开真相的面纱。-上门服务

徐州(云龙区,鼓楼区,金山桥,泉山区,铜山区。)








南通市(崇川区,港闸区,开发区,海门区,海安市。)








昆山市 (玉山镇、巴城镇、周市镇、陆家镇、花桥镇(花桥经济开发区)、张浦镇、千灯镇。)








太仓市(城厢镇、金浪镇、沙溪镇、璜泾镇、浏河镇、浏家港镇;)








镇江市 (京口区、润州区、丹徒区。)








张家港市(杨舍镇,塘桥镇,金港镇,锦丰镇,乐余镇,凤凰镇,南丰镇,大新镇)








扬州市(广陵区、邗江区、江都区.宝应县)








宁波市(海曙区、江东区、江北区、北仑区、镇海区,慈溪,余姚 )








温州市(鹿城区、龙湾区、瓯海区、洞头区)








嘉兴市(南湖区、秀洲区,桐乡。)








绍兴市(越城区、柯桥区、上虞区)








金华市(金东区,义乌)








舟山市(定海区、普陀区)








台州市(椒江区、黄岩区、路桥区)








湖州市 (吴兴区,织里,南浔区)








合肥市(瑶海区、庐阳区、蜀山区、包河
服务:(点击咨询)
善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。各《今日汇总》《今日发布》
善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。各《今日汇总》(2024已更新)








善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。服务:(1)(点击咨询)(2)(点击咨询)








善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。24小时客服(1)(点击咨询)(2)(点击咨询)




善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。各《今日汇总》【2024已更新列表】
善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。








7天24小时人工为您、善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。团队在调度中心的统筹调配下,线下专业及各地区人员团队等专属,整个咨询流程规范有序,后期同步跟踪查询公开透明。








所有团队均经过专业培训、持证上岗,所用产品信息均为原厂直供,








善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。中心2024已更新(今日/推荐)








善良的嫂子6中字巴巴鱼汤饭这部电影让我对时空穿越产生了无限的遐想,我开始想象自己如果也能穿越时空会怎样。区域:








北京市(东城区、西城区、崇文区、宣武区、朝阳区、丰台区、石景山区、海淀区、门头沟区 昌平区、大兴区)








天津市(和平区、河东区、河西区、南开区、河北区、红桥区、塘沽区、东丽区、西青区、)








石家庄市(桥东区、长安区、裕华区、桥西区、新华区。)








保定市(莲池区、竞秀区)  廊坊市(安次区、广阳区,固安)








太原市(迎泽区,万柏林区,杏花岭区,小店区,尖草坪区。)








大同市(城区、南郊区、新荣区)








榆林市(榆阳区,横山区)朝阳市(双塔区、龙城区)








南京市(鼓楼区、玄武区、建邺区、秦淮区、栖霞区、雨花台区、浦口区、区、江宁区、溧水区、高淳区)  成都市(锡山区,惠山区,新区,滨湖区,北塘区,南长区,崇安区。)








常州市(天宁区、钟楼区、新北区、武进区)








苏州市(吴中区、相城区、姑苏区(原平江区、沧浪区、金阊区)、工业园区、高新区(虎丘区)、吴江区,原吴江市)








常熟市(方塔管理区、虹桥管理区、琴湖管理区、兴福管理区、谢桥管理区、大义管理区、莫城管理区。)宿迁(宿豫区、宿城区、湖滨新区、洋河新区。)








徐州(云龙区,鼓楼区,金山桥,泉山区,铜山区。)








南通市(崇川区,港闸区,开发区,海门区,海安市。)








昆山市 (玉山镇、巴城镇、周市镇、陆家镇、花桥镇(花桥经济开发区)、张浦镇、千灯镇。)








太仓市(城厢镇、金浪镇、沙溪镇、璜泾镇、浏河镇、浏家港镇;)








镇江市 (京口区、润州区、丹徒区。)








张家港市(杨舍镇,塘桥镇,金港镇,锦丰镇,乐余镇,凤凰镇,南丰镇,大新镇)








扬州市(广陵区、邗江区、江都区.宝应县)








宁波市(海曙区、江东区、江北区、北仑区、镇海区,慈溪,余姚 )








温州市(鹿城区、龙湾区、瓯海区、洞头区)








嘉兴市(南湖区、秀洲区,桐乡。)








绍兴市(越城区、柯桥区、上虞区)








金华市(金东区,义乌)








舟山市(定海区、普陀区)








台州市(椒江区、黄岩区、路桥区)








湖州市 (吴兴区,织里,南浔区)








合肥市(瑶海区、庐阳区、蜀山区、包河

大模型预训练“狼人杀”,是谁悄悄掉队了?

作者|陶然 编辑|魏晓

国内最顶尖的这些大模型初创公司,现在站到了该做取舍的十字路口。

十月初,市场中传出消息,称智谱AI、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰这六家被称为“AI六小虎”的中国大模型独角兽中,有两家公司已经决定逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用。

所谓预训练,一般指的是利用大规模数据对模型进行无特定任务的初步训练,让模型学习到通用的语言模式、知识和特征等。

好比是给一个还不太懂事的孩子(模型)看大量资料(大规模数据),让他在这个过程中不断学习各种知识、认识各种事物的样子和规律(通用的语言模式、知识和特征)。

虽然这个孩子一开始并不知道具体要做什么任务,但通过广泛学习,会形成相对全面的知识储备。

之后,如果要让这个孩子去完成特定的任务,比如写作文、做数学题等,就可以针对这些具体任务专门优化适配。

但问题是,这种笼统的大规模训练往往价格不菲,且过程多有不确定性,每次基础模型迭代的训练成本动辄就会达到百万、千万甚至数亿美金这个量级。

在讨论AI行业现状的播客中,Anthropic创始人 Dario Amodei 与挪威银行首席执行Nicolai Tangen曾谈到,虽然目前许多模型的训练成本为 1 亿美元,但“当今正在训练的”一些模型的成本接近 10 亿美元,且这个数字未来还会上涨。

Amodei 表示,人工智能训练成本将在“2025 年、2026 年,也许还有 2027 年”达到 100 亿美元至 1000 亿美元大关,他再次预测,100 亿美元的模型可能会在明年的某个时候开始出现。

一向激进的马斯克为了让自家 xAI的Grok系列模型后来居上, 更是大手笔屯集了10万张昂贵的GPU卡。

对于这些不缺资源的头部玩家来说,预训练是一个必选项。

但对“AI六小虎”而言,中间过程的黑箱特质,叠加投入产出比的压力,让预训练的“做与不做”,成了摆在眼前一个现实问题。

预训练,是模型地基

更是大模型公司技术试金石

预训练的好处显而易见——模型可以获得更广泛的语言理解能力和基础的智能表现,为后续针对特定任务的微调提供良好的基础。它可以是后续产品研发和应用设计的强大起点,缩短开发周期,适应不同需求。

当年GPT-3横空出世,预训练过程为其后续在各种自然语言处理任务中的出色表现奠定了坚实基础。在预训练阶段,GPT-3 使用了海量的互联网文本数据,通过无监督学习的方式让模型学习语言的统计规律和语义知识。例如,在问答任务中,经过预训练的 GPT-3 能够理解问题的含义,并根据其在预训练中学习到的知识生成准确的答案。

但相对应的,预训练也需要用到大量的算力资源和高质量数据,以及复杂的算法和技术。

简言之,预训练的效果取决于两方面:能力和资源。前者对应算法的先进性、数据的质量和规模以及工程师的技术水平等因素,决定了模型能够学习到多少知识和技能;后者对应计算资源的投入、数据采集和处理的成本、人才等,决定了预训练能够进行到何种程度和规模。

OpenAI团队在预训练GPT-3和GPT-4过程中消耗了大量的算力资源和高质量数据。为了训练GPT-3,OpenAI使用了微软提供的超级计算机系统,该系统拥有超285,000个CPU核心和10,000个GPU,训练一次的费用高达460万美元,总成本约1200万美元。

GPT-3的训练消耗了约3640 PF-days的算力,使用了45TB的预训练数据,包括CommonCrawl、网络文本、维基百科等。

而在训练GPT-4时,OpenAI使用了混合专家模型(MoE),包含1.8万亿参数,通过16个专家模型来控制成本。每次前向传播使用约2800亿参数和560 TFLOPs。

据斯坦福HAI研究所发布的AI Index报告显示,OpenAI的GPT-4训练成本约为7800万美元。

模型架构和算力需求使得其训练和部署需要大量的高性能计算资源,也就是来自英伟达的A100或H100 GPU。

o1发布之后,很多人开始大谈后训练的重要性。后训练可以显著提升模型在特定任务上的性能,但是它无法改变模型在预训练阶段学到的基础特征表示。换句话说,预训练很大程度上影响着模型性能的基准线和潜在的上限。

LlaMa 67B 与LlaMa 3.1 70B 的模型后训练上限是不同的。同理,如果一个公司能够在预训练阶段训练出优于LlaMa的自有模型,那么与在LlaMa基础上后训练的公司相比,前者就具备了技术上的天然优势。

这种优势的建立,需要技术能力,也需要算力资源—— 能力和资源,成为了大模型预训练的两个门槛。

谁放弃?谁掉队?

这里的能力,并非跟自家的上一代模型相比,而是跟行业现有公开成果相比,也就是那些头部的开源大模型。

像是由Meta推出、被广泛调用的LlaMa系列、马斯克旗下xAI公司的Grok-1,以及国内阿里云开源的部分Qwen系列模型,都已经具备相当优秀且全面的基础能力。

而资源,自然指向的是训练结果的投入产出比:如果一家公司花费大量资源去做预训练,得来的成果却比不上那些开源的模型,那继续坚持做预训练就没什么必要了。那么这种训练就纯粹的浪费资源,毫无价值可言。这里的资源既包含算力、资金,也包含技术人才。

众所周知,国内大模型“小虎”有六七家公司,智谱AI、MiniMax、零一万物、月之暗面、百川智能、阶跃星辰、DeepSeek。在大模型预训练上,各家面临的难题各不相同,现状不一。或许我们可以从基座模型成绩上“窥一斑而知全豹”。

由LMSYS组织的全球大模型竞技场(ChatBot Arena)是全球头部大模型企业同台竞技的权威盲测平台。在最新一期的榜单上,依次出现了零一万物的Yi-Lightning、智谱 AI 的GLM-4-Plus以及DeepSeek V2.5,这些模型都在榜单上取得了出色的成绩。

智谱 AI 一向有着“清华系国家队”的称号,背后的主导人物唐杰也是中国在人工智能和大模型领域颇具话语权和声量的学术领军人物,找融资找算力不在话下;零一万物创始人李开复同样在AI领域深耕多年,公司早早布局AI Infra,近期也宣布了新融资,资金算力都不成问题;DeepSeek背靠幻方量化,坐拥上万张GPU,也没有道理在算力充盈的情况下,放弃预训练。

相比之下,另外几位玩家的现状就显得有些“模糊”:

月之暗面从成立第一天起便亮明了ToC的决心,也由此成为多家巨头青睐的对象,目前也是大模型初创中估值最高的企业。但除首次发布会上发布Moonshot大模型(后改名为Kimi大模型)、并宣布聚焦长文本能力之外,月之暗面再未对外透露更多基座模型的消息。业内更有声音传出,月之暗面的基座模型是在已有模型基础上微调得来的,缝合了多种工程模块后才达到了目前的效果。

而实际上,大模型预训练除长文本之外,还有诸多技术点同样值得攻坚:MoE(Mixture of Experts,混合专家模型)模型架构、多模态、RAG(Retrieval-augmented Generation,检索增强生成)、SSM(Structured State Space Models,结构化状态空间序列模型)、o1的COT(Chain of Thought,思维链) tokens、RL(Reinforcement Learning,强化学习)。这些都需要真金白银与技术人才的投入,对于发力ToC应用、选择在营销获客方面大量投入的月之暗面而言,继续去做大模型预训练,投入产出比似乎并不高。

背靠上海国投的阶跃星辰、MiniMax同样不缺资源。据上观新闻报道,上海国投已经与阶跃星辰、MiniMax签署了战略合作协议。

但单就预训练阶段来说,MiniMax似乎面临着与月之暗面同样的尴尬局面。MiniMax的海外应用矩阵中,Talkie已成为头部出海产品,海螺引起全球瞩目,但ABAB大模型很久未有新进展,也没有在LMSYS等平台上出现。

在诸位“小虎”中最晚亮相的阶跃星辰则急于证明自己的技术实力,年中密集地发布了千亿参数Step-1和万亿参数Step-2。在阶跃星辰的宣发中,Step-2 万亿参数语言大模型的模型性能逼近 GPT-4,但在LiveBench、Arena-Hard、MT-Bench等国际权威Benchmark上成绩仍弱于GPT-4-1107。

越发活跃的阶跃星辰的另一面,则是技术低调的百川智能。从2023年8个月发布8款模型,到2024年仅发布3款模型,百川智能在基座模型上的脚步在不断降速。最新一代基座大模型Baichuan 4选择打榜国内商业化榜单SuperCLUE,如LMSYS ChatBot Arena、AlpacaEval 等有学术背景、相对公正的国际权威榜单上,Baichuan大模型却未上榜或未获好成绩。

其实,对于预训练“知难而退”,并非一种难以启齿的消极行为。甚至,在当前的大环境下,对于某些公司来说,是一个极为理智的选择。

当前行业基础模型过剩却少有破圈应用产品涌现。锤子多而钉子少。利用行业中头部资源、开源大模型去做调优,出应用产品,务实的选择才更能在大模型的红海中找到适合自己身份,节省资源同时创造价值。

只是在选择放弃预训练的同时,也意味着走下了AGI的牌桌,将自家模型和应用的上限拱手让于开源模型。

至此,什么样的玩家,可以留在AI预训练这场豪赌的牌桌,答案日渐清晰。

预训练成大模型公司灵魂考验

人才流动频繁

从尖端芯片到美元投资,中美之间在科技领域的竞争会愈演愈烈。LlaMa、Mixtral等开源模型系列未来前景如何仍未可知。根据美国政府最新发布的信息,美国即将出台限制某些针对中国人工智能投资的新规,相关规则目前正在最终审核阶段,预计会在一周内发布。

掌握预训练能力,才能保证自己不下全球大模型竞争的牌桌。随着中美科技角力的加剧,顶尖人才资源的争夺战已然成为焦点,一场围绕人才的战略较量早已爆发。

有多位长期关注AI领域的猎头反馈称,自ChatGPT爆火之后,国内对于AI领域的顶级研发人才的需求持续走高。

国内的人才争夺同样激烈。如阿里通义千问大模型技术负责人周畅近期被曝出离职消息;曾任职于旷视研究院的周昕宇选择加盟月之暗面;秦禹嘉被曝从面壁智能离职后, 2024年初创立序智科技,数月后加入字节跳动大模型研究院。

原滴滴出行AI Labs首席算法工程师李先刚更是被曝在一年多时间内从贝壳跳槽到零一万物、百川智能两家“AI小虎”公司,前阵子被曝又回到贝壳。“猎头圈爆料,他先从贝壳到零一万物,再到百川智能,又回贝壳,每家公司都只待了几个月。”

2023年初时曾传出“字节跳动以140万美元年薪从OpenAI挖人”的传闻。2024年6月,李开复也曾在接受媒体采访时表示,自己已经化身世界上最大的AI猎头招揽世界上最优秀的人才。随后零一万物便公开表态,已有多位负责模型训练、AI Infra、多模态和产品的国际大咖于数月前加盟。

人才资源的投入在模型预训练方面立竿见影。字节跳动自研豆包大模型一经发布便在业内以高性价比闻名。零一万物也被传团队调整,但并未影响到模型进展——仅用了2000张GPU、1个半月时间就训练出了超越GPT-4o(5月份版本)的Yi-Lightning,这也是目前中国大模型公司在LMSYS榜单上的历史最佳成绩。

一位资深大模型从业者告诉笔者,预训练人才在顶尖公司之间互相流动是非常正常的现象,OpenAI、Google、微软、Meta、xAI之间也是如此。

“一个模型性能要做到世界第一梯队,而且又快又便宜,让用户都用得好用得起,需要这个大模型公司的模型训练团队、AI Infra团队都具备世界顶尖水准,而且要深度共建共创,才能‘多快好省’地做出顶尖模型。”上述从业者说, “随着竞争壁垒越来越高,‘单靠挖一位算法负责人就能搞定一切’,这是非常不切实际的想法。”

在这方面,国内头部大模型公司也是“八仙过海、各显神通”。阿里巴巴、字节跳动本身具备丰富的算力资源, DeepSeek背后的幻方量化也曾豪掷千金购置了上万张GPU。零一万物则选择从Day 1起“模基共建”,邀请来自阿里、华为等大厂的高管、骨干加盟组建AI Infra核心团队。

英国《金融时报》近期报道给出了一份“第一阵营名单”,初创“小虎”零一万物、DeepSeek通过MoE模型架构和推理优化,大厂阿里巴巴、字节跳动等凭借着技术、资源训练出了具备国际竞争力的模型,阿里的Qwen、字节的Doubao、零一的Yi、DeepSeek系列模型即便在海外同样享有极高知名度。

从模型性能的角度来说,坚持预训练不仅将模型上限掌握在了自己手中,同时也牢牢把握住了推理成本的优化空间。只有从头到尾走过预训练的路,才能够深入了解模型架构,与AI Infra团队深度共建,以软硬件协同逼近理论上的最低推理成本。

从应用落地的角度来讲,一个关键点除了成本,还有安全性——模型是否自主可控。与接入开源模型相比,走过从0到1整个过程的自研预训练模型无疑是更加安全可控的。对于企业级和政府级客户而言,这一点尤为关键,因为这直接关系到他们的核心利益和关切。

换言之,无论是从基座模型的角度,还是从应用落地的角度,预训练能力都是大模型企业的“压舱石”。而对于预训练本身,经过能力和资源两道门槛的区隔之后,注定会是一场玩家不多的游戏。因为高手,本就应该不多。

阿里巴巴、字节跳动等大厂入局之后,大模型初创公司在资源方面的劣势一览无遗。也正因如此,能力方面的重要性得以凸显,如何以各家技术实力追平资源差距是每家大模型初创公司都需要思考的问题。

LlaMa 3.1 405B、Qwen-Max等顶尖开源模型的发布像是一次次的警钟,催促着大模型初创公司尽早做出选择。

算法、AI Infra能力强,能够以各种方式降低训模成本和推理成本;资源整合能力强,能够支撑公司不断在模型预训练上作出新尝试。

能力与资源并举,才是大模型时代能全局掌控的“硬指标”。中国大模型“小虎”们道路已经出现分野,从预训练开始,技术领先者已经脱颖而出。有人下牌桌、有人走新路。

只是,掉队后再赶上的难度,会越来越高。

Lanmeih/今日话题

国产大模型,你更看好哪家公司?

咱们评论区聊聊~

xtt9制片厂制片传媒在线看的时尚风向标:美食与时尚的完美结合体(在线预约)

两个妈妈双字ID免费的科技先锋队:智能科技在两个妈妈双字ID免费行业的运用在线上门服务
莉哥黑料推荐网站视频的色彩调色盘:用色彩描绘美食的诱人画卷在线上门服务
小舞要生宝宝了肚子疼的文化底蕴:美食背后的历史与文化真的可信
waswaswas18yax这部电影让我对爱情和亲情有了新的认识,它们是我们生命中最宝贵的财富。(在线预约)
查看更多评价 ∨
服务