24小时内容咨询信息客服在线解答内容
ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!

更新时间: 浏览次数: 258

XL司第1季在线观看翻译这位明星的演技真是炉火纯青,每次出场都能深深吸引观众的眼球,让人仿佛置身于剧情之中。各服务《今日汇总》
XL司第1季在线观看翻译这位明星的演技真是炉火纯青,每次出场都能深深吸引观众的眼球,让人仿佛置身于剧情之中。各客服服务2024已更新 ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的! ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的! 继续讲述了少年超能力者影山茂夫的成长故事。在这一季中,茂夫不仅面临着外部的各种超能力挑战,还要处理内心的挣扎与恐惧。他的朋友们也在各自的道路上经历着不同的磨难和成长。随着与各种灵异事件的交锋,茂夫逐渐认识到友情与自我的重要性。这一季将带给观众更多惊险刺激的战斗场面以及深刻的情感体验,令人期待不已。通过精彩的剧情与细腻的角色刻画,展现出少年成长的复杂与美好。(2024已更新)
XL司第1季在线观看翻译这位明星的演技真是炉火纯青,每次出场都能深深吸引观众的眼球,让人仿佛置身于剧情之中。咨询服务信息-——24h在线咨询信息:
XL司第1季在线观看翻译这位明星的演技真是炉火纯青,每次出场都能深深吸引观众的眼球,让人仿佛置身于剧情之中。咨询服务服务信息:


ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!怎么样

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!是明代女诗人李清照所作的一首词,展现了她深厚的情感与细腻的艺术风格。词中通过描绘帐中景象,表达了她对离别和思念的缠绵心绪。优美的语言与悠扬的旋律,让读者感受到一种柔和而又哀伤的情感。作品通过细腻的意象,层层递进,展现了她内心的孤独与渴望,成为古典词坛中的经典之作,体现了女性在情感表达上的独特视角。

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!合集

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!是一部聚焦于新时代青年成长与奋斗的电视剧。故事围绕一群在社会变革中追求梦想的年轻人展开,他们在爱情、友情和事业的碰撞中,面对生活的挑战与选择。剧中人物个性鲜明,各自有着不同的背景和理想,通过真挚的情感描绘和紧凑的剧情推进,展现了青春的热血与坚持。伴随着时代的脉动,剧集不仅传递了积极向上的生活态度,还引发观众对人生价值与梦想追求的深思。

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!-2

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!成员

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!是一部充满悬疑与情感的青春爱情剧。故事围绕一对青涩情侣展开,他们在校园里相识并迅速坠入爱河。随着剧情的发展,隐藏在他们之间的秘密逐渐浮出水面,考验着彼此的信任与感情。男主角为了保护女主角,选择隐瞒自己的真实身份和过去,这让两人的关系愈加复杂。面对来自家庭、朋友以及自身的压力,他们能否打破重重阻碍,最终收获真爱?该剧通过细腻的情感描绘,展现了年轻人在爱情和成长中的挣扎与勇气。

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!合集

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!》是一部充满温情与环保意识的动画片。影片以未来世界为背景,讲述了机器人瓦力与人类女孩伊娃之间的感人故事。影片中的画面精美绝伦,情感真挚动人,让人在欢笑的同时也反思着人类与自然的关系。




ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!



ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!-3

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!


ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!


ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!


ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!合集

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!是一个多元化的线上平台,旨在为用户提供一个自由交流、分享生活和获取信息的空间。在这里,用户可以通过视频、图片和文字等多种形式,分享自己的故事和经历。无论是生活琐事、旅行见闻,还是兴趣爱好,大家都可以在野花社区找到志同道合的朋友。平台注重用户隐私,鼓励真实表达,致力于营造一个温暖、友好的社区氛围。加入野花社区,探索更多精彩内容,拓宽视野!

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!高清

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!是由李洙赫执导的一部韩版电影,讲述了一段充满悲伤与感动的爱情故事。影片围绕男女主角的相遇与离别展开,展现了他们在命运的捉弄下,无法相守却又深深爱着彼此的情感纠葛。女主角身患绝症,男主角为了她的幸福而努力隐藏自己的痛苦,他们的爱情在悲伤中愈加动人。影片通过细腻的情感描绘和感人的剧情,引发观众对生命、爱与失去的深思,是一部催人泪下的佳作。

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!合集

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!是一部以金银花为主题的小说,讲述了一个充满情感与古韵的故事。故事中的主人公在复杂的情感纠葛中,逐渐领悟到生活的真谛与爱的力量。金银花象征着纯洁与坚韧,贯穿整个情节,展现了人物在逆境中不屈不挠的精神。书中细腻的描写让人仿佛置身于那片温馨的世界。情节扣人心弦,引发读者深思,适合喜欢古风浪漫的读者阅读。


ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!成员

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!是一款以3D建模和动画制作为核心的设计软件,它独特的功能和灵活的操作界面,使得用户能够轻松创建高质量的视觉作品。此软件广泛应用于影视、游戏、建筑等多个领域,为设计师提供了强大的工具支持。通过强大的渲染引擎和多样的插件,用户可以实现逼真的细节和复杂的视觉效果。丰富的社区资源和教程,帮助新手快速上手,提升创作技能。选择《图霸天下》,让你的创意尽情飞扬!







ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!





服务服务中心不求利润多少,只求服务更好,全天为您服务服务范围: ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的! ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的! 克里斯托弗·诺兰的又一力作,通过梦境的层层嵌套,构建了一个错综复杂的叙事空间。影片在探讨梦境与现实关系的同时,也触及了人类内心深处的欲望与恐惧。
北京市(东城区、西城区、崇文区、宣武区、朝阳区、丰台区、石景山区、海淀区、门头沟区
房山区、通州区、顺义区、昌平区、大兴区)
天津市(和平区、河东区、河西区、南开区、河北区、红桥区、塘沽区、汉沽区、大港区、东丽区、西青区、津南区、北辰区、武清区、宝坻区)
石家庄市(长安区、桥东区、桥西区、新华区、郊区、井陉矿区)
唐山市( 路南区、路北区、古治区、开平区、新区)
秦皇岛(海港区、山海关区、北戴河区)
保定市(莲池区、竞秀区)
张家口市(桥东区、桥西区、宜化区、下花园区)

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!






ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!


ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!

承德市(双桥区、双滦区)
沧州市(新华区、运河区)
廊坊市(安次区、广阳区)
太原市(小店区、迎泽区、杏花岭区、尖草坪区、万柏林区、晋源区)
大同市(城区、矿区、南郊区、新荣区) ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的! ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的! 是一部充满怀旧与青春的电影。影片以文革时期为背景,讲述了一群年轻人的成长与梦想。影片中的画面充满时代感,情感真挚动人,让人在回忆与感慨中感受到了青春的热血与激情。
朔州市(朔城区、平鲁区)
包头市(东河区、昆都伦区、青山区、石拐矿区、白云矿区、九原区)
赤峰市(红山区、元宝山区、松山区)

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!






ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!


沈阳市(和平区、沈河区、大东区、皇姑区、苏家屯区、东陵区、新城子区、于洪区)
大连市(中山区、西岗区、沙河口区、甘井子区、旅顺口区、金州区)
长春市(南关区、宽城区、朝阳区、二道区、绿园区、双阳区)
辽源市(龙山区、 区)
松原市(宁江区)
昆山市、太仓市
哈尔滨市(道里区、南岗区、道外区、松北区、香坊区、阿城区、平房区、呼兰区)
大庆市(萨尔图区、龙凤区、让胡路区、红岗区、大同区)

ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!

上海市(浦东新区、徐汇区、黄浦区、杨浦区、虹口区、闵行区、长宁区、普陀区、宝山区、静安区、闸北区、卢湾区、松江区、嘉定区、南汇区、金山区、青浦区、奉贤区)
南京市(玄武区、白下区、秦淮区、建邺区、下关区、浦口区、栖霞区、雨花台区、江宁区、区)
市(梁溪区、滨湖区、惠山区、新吴区、锡山区)
徐州市(鼓楼区、云龙区、贾汪区、泉山区、铜山区)
常州市(天宁区、钟楼区、新北区、武进区、金坛区)







苏州市(虎丘区、吴中区、相城区、姑苏区、吴江区)
南通市(崇州区、港闸区、通州区)
扬州市(广陵区、邗江区、江都区)
杭州市(临安区、上城区、下城区、江干区、拱野区、西湖区、滨江区、余杭区)
宁波市(海曙区、江东区、江北区、北仑区、镇海区)
温州市(鹿城区、龙湾区、瓯海区、洞头区)
嘉兴市(南湖区、秀洲区)
湖州市(吴兴区、南浔区)
绍兴市(越城区、柯桥区、上虞区)
金华市(金东区)
舟山市(定海区、普陀区)
台州市(椒江区、黄岩区、路桥区)
合肥市(瑶海区、庐阳区、蜀山区、包河区)
芜湖市(镜湖区、戈江区、鸠江区、三山区)
蚌埠市(龙子湖区、蚌山区、禹会区、淮上区)
马鞍山市(花山区、雨山区)
安庆市(迎江区、大观区、宜秀区)
宿州市(埇桥区)
六安市(金安区、裕安区、叶集区)
福州市(鼓楼区、台江区、仓山区、马尾区、晋安区、长乐区)
厦门市(思明区、海沧区、湖里区、集美区、同安区、翔安区)
莆田市(城厢区、涵江区、秀屿区)
泉州市(鲤城区、丰泽区、洛江区、泉港区)
漳州市(芗城区、龙文区)
南昌市(东湖区、西湖区、青云谱区、湾里区、青山湖区、新建区)
景德镇市(昌江区、珠山区)
萍乡市(安源区、湘东区)
九江市(莲溪区、浔阳区)








宜春市(袁州区)
济南市(历下区、市中区、槐荫区、天桥区、历城区、长清区)ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!
烟台市(芝罘区、福山区、开发区、莱山区)
威海市(环翠区)
郑州市(中原区、二七区、管城区、金水区、上街区、惠济区)ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!
开封市(龙亭区、顺河区、鼓楼区、金明区、禹王台区)ae86us网站入口看完这部电影,我对人类的智慧和创造力有了更深的认识。原来是真的!
洛阳市(老城区、西工区、涧西区、吉利区、洛龙区)
新乡市(红旗区、卫滨区、凤泉区、牧野区)
焦作市(解放区、中站区、马村区、山阳区)
周口市(川江区)
武汉市(江岸区、江汉区、硚口区、汉阳区、武昌区、青山区)
黄石市(黄石港区、西寨山区、下陆区、铁山区)
十堰市(茅箭区、张湾区)
郑州市(芙蓉区、天心区、岳麓区、开福区、雨花区、望城区)
郴州市(北湖区、苏仙区)
怀化市(鹤城区)
娄底市(娄星区)
广州市(荔湾区、越秀区、海珠区、天河区、白云区、黄浦区)
深圳市(罗湖区、福田区、南山区、宝安区、龙岗区、盐田区)
茂名市(茂南区、茂港区)
河源市(源城区)
东莞市、中山市、潮州市、揭阳市
南宁市(兴宁区、青秀区、西乡塘区、江南区、良庆区)
桂林市(秀峰区、叠彩区、象山区、七星区、雁山区)
玉林市(玉州区)
重庆市(万州区、涪陵区、渝中区、大渡口区、江北区、沙坪坝区、九龙坡区、南岸区、北培区、万盛区、双桥区、渝北区、巴南区)
成都市(锦江区、青羊区、金牛区、武侯区、成华区、龙泉驿区、青白江区、双流区、新都区)
绵阳市(培城区、游仙区)
内江市(市中区、东兴区)
乐山市(市中区、沙湾区、五通桥区、金口河区)






贵阳市(南明区、云岩区、花溪区、乌当区、白云区、小河区)
遵义市(红花岗区、汇川区)
昆明市(五华区、盘龙区、官渡区、西山区、东川区、呈贡区)
咸阳市(秦都区、杨凌区、渭城区)
渭南市(临渭区、华州区)
西安市(新城区、碑林区、莲湖区、灞桥区、未央区、雁塔区)
宝鸡市(渭滨区、金台区)
兰州市(城关区、七里河区、西固区、安宁区、红古区)

大模型预训练“狼人杀”,是谁悄悄掉队了?

作者|陶然 编辑|魏晓

国内最顶尖的这些大模型初创公司,现在站到了该做取舍的十字路口。

十月初,市场中传出消息,称智谱AI、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰这六家被称为“AI六小虎”的中国大模型独角兽中,有两家公司已经决定逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用。

所谓预训练,一般指的是利用大规模数据对模型进行无特定任务的初步训练,让模型学习到通用的语言模式、知识和特征等。

好比是给一个还不太懂事的孩子(模型)看大量资料(大规模数据),让他在这个过程中不断学习各种知识、认识各种事物的样子和规律(通用的语言模式、知识和特征)。

虽然这个孩子一开始并不知道具体要做什么任务,但通过广泛学习,会形成相对全面的知识储备。

之后,如果要让这个孩子去完成特定的任务,比如写作文、做数学题等,就可以针对这些具体任务专门优化适配。

但问题是,这种笼统的大规模训练往往价格不菲,且过程多有不确定性,每次基础模型迭代的训练成本动辄就会达到百万、千万甚至数亿美金这个量级。

在讨论AI行业现状的播客中,Anthropic创始人 Dario Amodei 与挪威银行首席执行Nicolai Tangen曾谈到,虽然目前许多模型的训练成本为 1 亿美元,但“当今正在训练的”一些模型的成本接近 10 亿美元,且这个数字未来还会上涨。

Amodei 表示,人工智能训练成本将在“2025 年、2026 年,也许还有 2027 年”达到 100 亿美元至 1000 亿美元大关,他再次预测,100 亿美元的模型可能会在明年的某个时候开始出现。

一向激进的马斯克为了让自家 xAI的Grok系列模型后来居上, 更是大手笔屯集了10万张昂贵的GPU卡。

对于这些不缺资源的头部玩家来说,预训练是一个必选项。

但对“AI六小虎”而言,中间过程的黑箱特质,叠加投入产出比的压力,让预训练的“做与不做”,成了摆在眼前一个现实问题。

预训练,是模型地基

更是大模型公司技术试金石

预训练的好处显而易见——模型可以获得更广泛的语言理解能力和基础的智能表现,为后续针对特定任务的微调提供良好的基础。它可以是后续产品研发和应用设计的强大起点,缩短开发周期,适应不同需求。

当年GPT-3横空出世,预训练过程为其后续在各种自然语言处理任务中的出色表现奠定了坚实基础。在预训练阶段,GPT-3 使用了海量的互联网文本数据,通过无监督学习的方式让模型学习语言的统计规律和语义知识。例如,在问答任务中,经过预训练的 GPT-3 能够理解问题的含义,并根据其在预训练中学习到的知识生成准确的答案。

但相对应的,预训练也需要用到大量的算力资源和高质量数据,以及复杂的算法和技术。

简言之,预训练的效果取决于两方面:能力和资源。前者对应算法的先进性、数据的质量和规模以及工程师的技术水平等因素,决定了模型能够学习到多少知识和技能;后者对应计算资源的投入、数据采集和处理的成本、人才等,决定了预训练能够进行到何种程度和规模。

OpenAI团队在预训练GPT-3和GPT-4过程中消耗了大量的算力资源和高质量数据。为了训练GPT-3,OpenAI使用了微软提供的超级计算机系统,该系统拥有超285,000个CPU核心和10,000个GPU,训练一次的费用高达460万美元,总成本约1200万美元。

GPT-3的训练消耗了约3640 PF-days的算力,使用了45TB的预训练数据,包括CommonCrawl、网络文本、维基百科等。

而在训练GPT-4时,OpenAI使用了混合专家模型(MoE),包含1.8万亿参数,通过16个专家模型来控制成本。每次前向传播使用约2800亿参数和560 TFLOPs。

据斯坦福HAI研究所发布的AI Index报告显示,OpenAI的GPT-4训练成本约为7800万美元。

模型架构和算力需求使得其训练和部署需要大量的高性能计算资源,也就是来自英伟达的A100或H100 GPU。

o1发布之后,很多人开始大谈后训练的重要性。后训练可以显著提升模型在特定任务上的性能,但是它无法改变模型在预训练阶段学到的基础特征表示。换句话说,预训练很大程度上影响着模型性能的基准线和潜在的上限。

LlaMa 67B 与LlaMa 3.1 70B 的模型后训练上限是不同的。同理,如果一个公司能够在预训练阶段训练出优于LlaMa的自有模型,那么与在LlaMa基础上后训练的公司相比,前者就具备了技术上的天然优势。

这种优势的建立,需要技术能力,也需要算力资源—— 能力和资源,成为了大模型预训练的两个门槛。

谁放弃?谁掉队?

这里的能力,并非跟自家的上一代模型相比,而是跟行业现有公开成果相比,也就是那些头部的开源大模型。

像是由Meta推出、被广泛调用的LlaMa系列、马斯克旗下xAI公司的Grok-1,以及国内阿里云开源的部分Qwen系列模型,都已经具备相当优秀且全面的基础能力。

而资源,自然指向的是训练结果的投入产出比:如果一家公司花费大量资源去做预训练,得来的成果却比不上那些开源的模型,那继续坚持做预训练就没什么必要了。那么这种训练就纯粹的浪费资源,毫无价值可言。这里的资源既包含算力、资金,也包含技术人才。

众所周知,国内大模型“小虎”有六七家公司,智谱AI、MiniMax、零一万物、月之暗面、百川智能、阶跃星辰、DeepSeek。在大模型预训练上,各家面临的难题各不相同,现状不一。或许我们可以从基座模型成绩上“窥一斑而知全豹”。

由LMSYS组织的全球大模型竞技场(ChatBot Arena)是全球头部大模型企业同台竞技的权威盲测平台。在最新一期的榜单上,依次出现了零一万物的Yi-Lightning、智谱 AI 的GLM-4-Plus以及DeepSeek V2.5,这些模型都在榜单上取得了出色的成绩。

智谱 AI 一向有着“清华系国家队”的称号,背后的主导人物唐杰也是中国在人工智能和大模型领域颇具话语权和声量的学术领军人物,找融资找算力不在话下;零一万物创始人李开复同样在AI领域深耕多年,公司早早布局AI Infra,近期也宣布了新融资,资金算力都不成问题;DeepSeek背靠幻方量化,坐拥上万张GPU,也没有道理在算力充盈的情况下,放弃预训练。

相比之下,另外几位玩家的现状就显得有些“模糊”:

月之暗面从成立第一天起便亮明了ToC的决心,也由此成为多家巨头青睐的对象,目前也是大模型初创中估值最高的企业。但除首次发布会上发布Moonshot大模型(后改名为Kimi大模型)、并宣布聚焦长文本能力之外,月之暗面再未对外透露更多基座模型的消息。业内更有声音传出,月之暗面的基座模型是在已有模型基础上微调得来的,缝合了多种工程模块后才达到了目前的效果。

而实际上,大模型预训练除长文本之外,还有诸多技术点同样值得攻坚:MoE(Mixture of Experts,混合专家模型)模型架构、多模态、RAG(Retrieval-augmented Generation,检索增强生成)、SSM(Structured State Space Models,结构化状态空间序列模型)、o1的COT(Chain of Thought,思维链) tokens、RL(Reinforcement Learning,强化学习)。这些都需要真金白银与技术人才的投入,对于发力ToC应用、选择在营销获客方面大量投入的月之暗面而言,继续去做大模型预训练,投入产出比似乎并不高。

背靠上海国投的阶跃星辰、MiniMax同样不缺资源。据上观新闻报道,上海国投已经与阶跃星辰、MiniMax签署了战略合作协议。

但单就预训练阶段来说,MiniMax似乎面临着与月之暗面同样的尴尬局面。MiniMax的海外应用矩阵中,Talkie已成为头部出海产品,海螺引起全球瞩目,但ABAB大模型很久未有新进展,也没有在LMSYS等平台上出现。

在诸位“小虎”中最晚亮相的阶跃星辰则急于证明自己的技术实力,年中密集地发布了千亿参数Step-1和万亿参数Step-2。在阶跃星辰的宣发中,Step-2 万亿参数语言大模型的模型性能逼近 GPT-4,但在LiveBench、Arena-Hard、MT-Bench等国际权威Benchmark上成绩仍弱于GPT-4-1107。

越发活跃的阶跃星辰的另一面,则是技术低调的百川智能。从2023年8个月发布8款模型,到2024年仅发布3款模型,百川智能在基座模型上的脚步在不断降速。最新一代基座大模型Baichuan 4选择打榜国内商业化榜单SuperCLUE,如LMSYS ChatBot Arena、AlpacaEval 等有学术背景、相对公正的国际权威榜单上,Baichuan大模型却未上榜或未获好成绩。

其实,对于预训练“知难而退”,并非一种难以启齿的消极行为。甚至,在当前的大环境下,对于某些公司来说,是一个极为理智的选择。

当前行业基础模型过剩却少有破圈应用产品涌现。锤子多而钉子少。利用行业中头部资源、开源大模型去做调优,出应用产品,务实的选择才更能在大模型的红海中找到适合自己身份,节省资源同时创造价值。

只是在选择放弃预训练的同时,也意味着走下了AGI的牌桌,将自家模型和应用的上限拱手让于开源模型。

至此,什么样的玩家,可以留在AI预训练这场豪赌的牌桌,答案日渐清晰。

预训练成大模型公司灵魂考验

人才流动频繁

从尖端芯片到美元投资,中美之间在科技领域的竞争会愈演愈烈。LlaMa、Mixtral等开源模型系列未来前景如何仍未可知。根据美国政府最新发布的信息,美国即将出台限制某些针对中国人工智能投资的新规,相关规则目前正在最终审核阶段,预计会在一周内发布。

掌握预训练能力,才能保证自己不下全球大模型竞争的牌桌。随着中美科技角力的加剧,顶尖人才资源的争夺战已然成为焦点,一场围绕人才的战略较量早已爆发。

有多位长期关注AI领域的猎头反馈称,自ChatGPT爆火之后,国内对于AI领域的顶级研发人才的需求持续走高。

国内的人才争夺同样激烈。如阿里通义千问大模型技术负责人周畅近期被曝出离职消息;曾任职于旷视研究院的周昕宇选择加盟月之暗面;秦禹嘉被曝从面壁智能离职后, 2024年初创立序智科技,数月后加入字节跳动大模型研究院。

原滴滴出行AI Labs首席算法工程师李先刚更是被曝在一年多时间内从贝壳跳槽到零一万物、百川智能两家“AI小虎”公司,前阵子被曝又回到贝壳。“猎头圈爆料,他先从贝壳到零一万物,再到百川智能,又回贝壳,每家公司都只待了几个月。”

2023年初时曾传出“字节跳动以140万美元年薪从OpenAI挖人”的传闻。2024年6月,李开复也曾在接受媒体采访时表示,自己已经化身世界上最大的AI猎头招揽世界上最优秀的人才。随后零一万物便公开表态,已有多位负责模型训练、AI Infra、多模态和产品的国际大咖于数月前加盟。

人才资源的投入在模型预训练方面立竿见影。字节跳动自研豆包大模型一经发布便在业内以高性价比闻名。零一万物也被传团队调整,但并未影响到模型进展——仅用了2000张GPU、1个半月时间就训练出了超越GPT-4o(5月份版本)的Yi-Lightning,这也是目前中国大模型公司在LMSYS榜单上的历史最佳成绩。

一位资深大模型从业者告诉笔者,预训练人才在顶尖公司之间互相流动是非常正常的现象,OpenAI、Google、微软、Meta、xAI之间也是如此。

“一个模型性能要做到世界第一梯队,而且又快又便宜,让用户都用得好用得起,需要这个大模型公司的模型训练团队、AI Infra团队都具备世界顶尖水准,而且要深度共建共创,才能‘多快好省’地做出顶尖模型。”上述从业者说, “随着竞争壁垒越来越高,‘单靠挖一位算法负责人就能搞定一切’,这是非常不切实际的想法。”

在这方面,国内头部大模型公司也是“八仙过海、各显神通”。阿里巴巴、字节跳动本身具备丰富的算力资源, DeepSeek背后的幻方量化也曾豪掷千金购置了上万张GPU。零一万物则选择从Day 1起“模基共建”,邀请来自阿里、华为等大厂的高管、骨干加盟组建AI Infra核心团队。

英国《金融时报》近期报道给出了一份“第一阵营名单”,初创“小虎”零一万物、DeepSeek通过MoE模型架构和推理优化,大厂阿里巴巴、字节跳动等凭借着技术、资源训练出了具备国际竞争力的模型,阿里的Qwen、字节的Doubao、零一的Yi、DeepSeek系列模型即便在海外同样享有极高知名度。

从模型性能的角度来说,坚持预训练不仅将模型上限掌握在了自己手中,同时也牢牢把握住了推理成本的优化空间。只有从头到尾走过预训练的路,才能够深入了解模型架构,与AI Infra团队深度共建,以软硬件协同逼近理论上的最低推理成本。

从应用落地的角度来讲,一个关键点除了成本,还有安全性——模型是否自主可控。与接入开源模型相比,走过从0到1整个过程的自研预训练模型无疑是更加安全可控的。对于企业级和政府级客户而言,这一点尤为关键,因为这直接关系到他们的核心利益和关切。

换言之,无论是从基座模型的角度,还是从应用落地的角度,预训练能力都是大模型企业的“压舱石”。而对于预训练本身,经过能力和资源两道门槛的区隔之后,注定会是一场玩家不多的游戏。因为高手,本就应该不多。

阿里巴巴、字节跳动等大厂入局之后,大模型初创公司在资源方面的劣势一览无遗。也正因如此,能力方面的重要性得以凸显,如何以各家技术实力追平资源差距是每家大模型初创公司都需要思考的问题。

LlaMa 3.1 405B、Qwen-Max等顶尖开源模型的发布像是一次次的警钟,催促着大模型初创公司尽早做出选择。

算法、AI Infra能力强,能够以各种方式降低训模成本和推理成本;资源整合能力强,能够支撑公司不断在模型预训练上作出新尝试。

能力与资源并举,才是大模型时代能全局掌控的“硬指标”。中国大模型“小虎”们道路已经出现分野,从预训练开始,技术领先者已经脱颖而出。有人下牌桌、有人走新路。

只是,掉队后再赶上的难度,会越来越高。

Lanmeih/今日话题

国产大模型,你更看好哪家公司?

咱们评论区聊聊~

xtt一夜开二苞“这款应用的交通查询功能很全面,出行前查一查,路上不堵车。”在线上门服务

JOYHENTAI最新网站的冒险之旅:尝试未知,挑战味蕾-上门服务
犬齿之家的科技应用先锋:智能科技在犬齿之家中的创新应用(在线预约)
食人族的爱神战争片中的英勇与牺牲,让人深刻体会到和平的来之不易。(在线预约)
淫蛇百度影音剧情虽然有些烧脑,但细节处理得很到位,值得反复推敲。在线上门服务
漂亮妈妈4高清中字韩国在线的创意发源地:料理师的创意与灵感源泉真的可信
查看更多评价 ∨
服务信息