您的位置:主页 > 公司动态 > 每日行情 > 每日行情

2天发了10余款,百模大战开打了

01、卷数量

7月6日至7日,在上海2023年国际人工智能大会举办的2地利间里,据记者不完全核算,有10多款大模型新品发布或宣告行将发布。发布的公司有互联网科技公司、创业公司,还有通讯公司;而在大模型新品中,有通用大模型,也有专心细分职业的职业大模型。

现已发布的包含:阿里巴巴的绘画大模型“通义万相”、我国电信的类ChatGPT产品“TeleChat大模型”商汤科技联合香港中文大学和清华大学等推出的“墨客通用大模型系统”、第四范式专心企业软件范畴的“式说”大模型。

7月7日下午,华为宣告发布盘古大模型3.0。华为常务董事、华为云CEO张平安在PPT最显眼方位写着“不作诗只干事”,他说,盘古大模型聚集价值场景,致力于深耕政务、金融、制造、煤矿、铁路、制药、气候等职业。比方气候职业,盘古气候大模型可以在相同的空间分辨率下,比欧洲气候中心的operational IFS速度进步10000倍以上,一起坚持极高的精准度。

而行将发布的首要大模型产品也有不少。京东将在7月13日发布的千亿级“言犀大模型”,我国移动将于近期发布“九霄”1 N大模型,医渡科技称正在研制医疗大模型,并将于近期针对部分方针场景推出小范围约请测验。奇安信集团董事长齐向东表明,正在研制安全职业大模型,面向政府和企业客户;10月24日,科大讯飞将发布通用大模型,全面临标ChatGPT。

在5月底举办的中关村论坛上,有专家发表,据其核算到其时停止,我国10亿级参数规划以上大模型已发布了79个。现在,跟着国际人工智能大会上批量发布的一批大模型,百模大战也现已正式打响。

02、卷笔直

年头ChatGPT在国内爆火后,大模型的热度继续至今。中金公司一位高管在大会论坛上说,他曩昔3个月参与的一半以上的会都是人工智能相关的,“好像不谈ChatGPT,我们就要玩完了似的。”

这种热度可以解说为何直到现在,仍有许多公司还在继续发布大模型。不过,跟着人们对大模型认知的增加,大模型的问题也逐步凸显,成为需求直面的应战。

图灵奖得主、我国科学院院士、清华大学穿插信息研讨院院长姚期智以为,未来大模型运用中最直接影响的便是文书工作,作为生产力东西,许多文书工作可以交由大模型来完结。

作为文书范畴的重要玩家,金山工作也发布了他们根据大模型的AI工作产品“WPS AI”,可以润饰文章,主动制造表格和PPT。用户可以让AI把一篇提纲制造成PPT,并能随意替换PPT风格。

“WPS AI”树立在MiniMax、百度文心、智谱AI等大模型之上。金山工作CEO章庆元在大会现场表明,金山工作将WPS AI定位为大言语模型的运用方,未来锚定AIGC(内容创造)、Copilot(才智帮手)、Insight(常识洞悉)三个战略方向开展。

同样在7月7日当天,言语智能科技企业蜜度发布了专门针对校正笔直职业的大模型,名为“蜜度文修”。蜜度首席技能官刘益东告知经济观察报记者,蜜度深耕言语智能范畴已有十余年时刻,具有巨大的专业数据语料。本年ChatGPT火了后,他们测验做了一个校正范畴大模型,练习出来的作用很令人震惊,在笔直范畴的作用远远好于通用大模型。

刘益东还说到,做笔直职业大模型的本钱比通用大模型低许多。他们的校正模型,只拿百余张卡训了一个多月的时刻,做了几轮比对试验,作用就现已到达可以发布的程度了。

03、卷进展

新的大模型不断涌现,之前现已发布的大模型公司也不甘示弱,在7月6日、7月7日发布了最新进展。

本年4月10日,商汤发布了通用大模型产品“日日新”。7月7日,“日日新”更新到2.0版,商汤集团联合创始人、董事长兼CEO徐立现场展现了大模型新才能。

徐立用他自己的相片做事例,生成了“一个戴眼镜的男人,弹吉他”的图片,这是他没有做过的工作,生成后发给家人朋友,许多人都信以为真。这些AI生成图片的细节到达了相片级。他还展现了AI绘画的功用,现在商汤大模型可以帮用户弥补提示词,比方,一个用户输入了“我国龙,蓝色摆件,珠宝风格”关键词后,AI生成了一条龙的一般图片,大模型可以主动把提示词弥补为“一个我国龙的3D烘托图,具有极端精密的图画,龙站在一个蓝色玛瑙海上,增加深度和神秘感……”,AI生成的新图片艺术感增强了许多。

徐立说,4月发布大模型后,商汤每周都在对大模型做迭代。此外,针对职业需求,他们也在大模型根底上推出了小模型。

作为国内*发布大模型的互联网大厂,百度也在人工智能大会上发布了“文心一言”最新进展。百度首席技能官、深度学习技能及运用国家工程研讨中心主任王海峰称,文心大模型3.5作用、功用、功能全面进步,完成了根底模型晋级、精调技能立异、常识点增强、逻辑推理增强等,模型作用进步50%,练习速度进步2倍,推理速度进步30倍。

此外,做大模型的公司们,当下也正在尽力树立生态,树立规范。7月7日,百度、华为、阿里巴巴等企业被工信部我国电子技能规范化研讨院(简称“电子规范院”)颁发“国家人工智能规范化整体组大模型专题组”组长单位,正在活跃推进大模型国家规范系统建造,助力我国大模型工业开展。

04、卷算力

与3、4月份人们充溢等待的科幻幻想比较,当下做大模型的人,重视的论题更挨近实际。他们发现,数据是难题,算力也是难题,大模型这条路,远景夸姣但实际困难。

“算力是人工智能工业立异的根底,大模型的继续立异,驱动算力需求的爆破式增加。可以说,大模型练习的功率或者是立异的速度,根本上取决于算力的巨细。”华为轮值董事长胡厚崑判别,随同大模型带来的生成式 AI 打破,人工智能正在进入一个新的年代,算力现已成为越来越稀缺的资源。

华为现在正在着手处理算力问题。7月6日,华为宣告旗下算力处理方案昇腾AI集群全面晋级,集群规划从开始的4000卡集群扩展至16000卡,为业界*万卡AI集群。此前,腾讯云也面向大模型发布新一代高功能核算集群,算力功能较前代进步高达3倍。

不过,当时的算力仍有很大应战。一位大模型创业公司人士告知记者,大模型的研制本钱十分昂扬。仅算力一个范畴,做练习、推理、数据处理,就需求数千卡并行的才能,这是一套十分复杂,也十分费钱的系统工程。

清华大学电子工程系系主任汪玉举了一个比方,若一起处理14亿人的推理恳求,需求10*24 FLOPs(模型核算力),这个数字超越我国数据中心总算力的3个数量级。

“现有GPU硬件渠道的算力仍难满意大模型的需求。”汪玉说。即便现有的*的芯片,想处理算力问题也仍有很大应战。

算力之外,大模型数据也有应战。一位做智能轿车的创始人苦恼于数据量太大,他们公司刚卖了1万辆轿车,但发生的数据现已让他觉得很巨大了,他不敢幻想卖到10万辆车时会怎样。硬币的另一面,也有人由于数据不行而感到困难,一位用大模型做生物医药研制的人士说,他们最缺的便是数据,这阻止了他们研制医药的速度。

腾讯高档履行副总裁汤道生表明,通用大模型一般根据揭露信息来练习,在许多专业常识和职业数据堆集缺乏。在战略上,通用大模型有点像“把大海煮沸”,不行聚集,可以处理80%的问题,但未必可以满意企业某个场景的详细需求。

徐立也说到,大模型的错觉性问题仍很严重,是需求处理的问题。错觉性问题是自然言语处理范畴中的根底问题之一,指文本生成模型的生成成果中含有与输入事实上抵触的内容。这些问题造成了大模型“不苟言笑的胡言乱语”现象。

除此之外,清华大学智能工业研讨院院长、我国工程院院士张亚勤说到,当下大模型仍有自己的局限性。比方ChatGPT会有时效性问题,你问它它是什么时候发布的,它不知道,由于它运用的是2021年9月前的数据。别的,大模型还有功率低、涉嫌侵略隐私和常识产权维护问题等,这些问题都将影响大模型的商用。张亚勤以为,大模型功率至少还要进步10倍,才有大规划商用的可能性。