日发期货-香港日发金融期货-官网

您的位置：主页 > 公司动态 > 每日行情 > 每日行情

2天发了10余款，百模大战开打了

2023-07-10 16:09 来源：日发期货作者：日发期货点击：次

01、卷数量

7月6日至7日，在上海2023年国际人工智能大会举办的2地利间里，据记者不完全核算，有10多款大模型新品发布或宣告行将发布。发布的公司有互联网科技公司、创业公司，还有通讯公司；而在大模型新品中，有通用大模型，也有专心细分职业的职业大模型。

现已发布的包含：阿里巴巴的绘画大模型“通义万相”、我国电信的类ChatGPT产品“TeleChat大模型”商汤科技联合香港中文大学和清华大学等推出的“墨客通用大模型系统”、第四范式专心企业软件范畴的“式说”大模型。

7月7日下午，华为宣告发布盘古大模型3.0。华为常务董事、华为云CEO张平安在PPT最显眼方位写着“不作诗只干事”，他说，盘古大模型聚集价值场景，致力于深耕政务、金融、制造、煤矿、铁路、制药、气候等职业。比方气候职业，盘古气候大模型可以在相同的空间分辨率下，比欧洲气候中心的operational IFS速度进步10000倍以上，一起坚持极高的精准度。

而行将发布的首要大模型产品也有不少。京东将在7月13日发布的千亿级“言犀大模型”，我国移动将于近期发布“九霄”1 N大模型，医渡科技称正在研制医疗大模型，并将于近期针对部分方针场景推出小范围约请测验。奇安信集团董事长齐向东表明，正在研制安全职业大模型，面向政府和企业客户；10月24日，科大讯飞将发布通用大模型，全面临标ChatGPT。

在5月底举办的中关村论坛上，有专家发表，据其核算到其时停止，我国10亿级参数规划以上大模型已发布了79个。现在，跟着国际人工智能大会上批量发布的一批大模型，百模大战也现已正式打响。

02、卷笔直

年头ChatGPT在国内爆火后，大模型的热度继续至今。中金公司一位高管在大会论坛上说，他曩昔3个月参与的一半以上的会都是人工智能相关的，“好像不谈ChatGPT，我们就要玩完了似的。”

这种热度可以解说为何直到现在，仍有许多公司还在继续发布大模型。不过，跟着人们对大模型认知的增加，大模型的问题也逐步凸显，成为需求直面的应战。

图灵奖得主、我国科学院院士、清华大学穿插信息研讨院院长姚期智以为，未来大模型运用中最直接影响的便是文书工作，作为生产力东西，许多文书工作可以交由大模型来完结。

作为文书范畴的重要玩家，金山工作也发布了他们根据大模型的AI工作产品“WPS AI”，可以润饰文章，主动制造表格和PPT。用户可以让AI把一篇提纲制造成PPT，并能随意替换PPT风格。

“WPS AI”树立在MiniMax、百度文心、智谱AI等大模型之上。金山工作CEO章庆元在大会现场表明，金山工作将WPS AI定位为大言语模型的运用方，未来锚定AIGC（内容创造）、Copilot（才智帮手）、Insight（常识洞悉）三个战略方向开展。

同样在7月7日当天，言语智能科技企业蜜度发布了专门针对校正笔直职业的大模型，名为“蜜度文修”。蜜度首席技能官刘益东告知经济观察报记者，蜜度深耕言语智能范畴已有十余年时刻，具有巨大的专业数据语料。本年ChatGPT火了后，他们测验做了一个校正范畴大模型，练习出来的作用很令人震惊，在笔直范畴的作用远远好于通用大模型。

刘益东还说到，做笔直职业大模型的本钱比通用大模型低许多。他们的校正模型，只拿百余张卡训了一个多月的时刻，做了几轮比对试验，作用就现已到达可以发布的程度了。

03、卷进展

新的大模型不断涌现，之前现已发布的大模型公司也不甘示弱，在7月6日、7月7日发布了最新进展。

本年4月10日，商汤发布了通用大模型产品“日日新”。7月7日，“日日新”更新到2.0版，商汤集团联合创始人、董事长兼CEO徐立现场展现了大模型新才能。

徐立用他自己的相片做事例，生成了“一个戴眼镜的男人，弹吉他”的图片，这是他没有做过的工作，生成后发给家人朋友，许多人都信以为真。这些AI生成图片的细节到达了相片级。他还展现了AI绘画的功用，现在商汤大模型可以帮用户弥补提示词，比方，一个用户输入了“我国龙，蓝色摆件，珠宝风格”关键词后，AI生成了一条龙的一般图片，大模型可以主动把提示词弥补为“一个我国龙的3D烘托图，具有极端精密的图画，龙站在一个蓝色玛瑙海上，增加深度和神秘感……”，AI生成的新图片艺术感增强了许多。

徐立说，4月发布大模型后，商汤每周都在对大模型做迭代。此外，针对职业需求，他们也在大模型根底上推出了小模型。

作为国内*发布大模型的互联网大厂，百度也在人工智能大会上发布了“文心一言”最新进展。百度首席技能官、深度学习技能及运用国家工程研讨中心主任王海峰称，文心大模型3.5作用、功用、功能全面进步，完成了根底模型晋级、精调技能立异、常识点增强、逻辑推理增强等，模型作用进步50%，练习速度进步2倍，推理速度进步30倍。

此外，做大模型的公司们，当下也正在尽力树立生态，树立规范。7月7日，百度、华为、阿里巴巴等企业被工信部我国电子技能规范化研讨院（简称“电子规范院”）颁发“国家人工智能规范化整体组大模型专题组”组长单位，正在活跃推进大模型国家规范系统建造，助力我国大模型工业开展。

04、卷算力

与3、4月份人们充溢等待的科幻幻想比较，当下做大模型的人，重视的论题更挨近实际。他们发现，数据是难题，算力也是难题，大模型这条路，远景夸姣但实际困难。

“算力是人工智能工业立异的根底，大模型的继续立异，驱动算力需求的爆破式增加。可以说，大模型练习的功率或者是立异的速度，根本上取决于算力的巨细。”华为轮值董事长胡厚崑判别，随同大模型带来的生成式 AI 打破，人工智能正在进入一个新的年代，算力现已成为越来越稀缺的资源。

华为现在正在着手处理算力问题。7月6日，华为宣告旗下算力处理方案昇腾AI集群全面晋级，集群规划从开始的4000卡集群扩展至16000卡，为业界*万卡AI集群。此前，腾讯云也面向大模型发布新一代高功能核算集群，算力功能较前代进步高达3倍。

不过，当时的算力仍有很大应战。一位大模型创业公司人士告知记者，大模型的研制本钱十分昂扬。仅算力一个范畴，做练习、推理、数据处理，就需求数千卡并行的才能，这是一套十分复杂，也十分费钱的系统工程。

清华大学电子工程系系主任汪玉举了一个比方，若一起处理14亿人的推理恳求，需求10*24 FLOPs(模型核算力)，这个数字超越我国数据中心总算力的3个数量级。

“现有GPU硬件渠道的算力仍难满意大模型的需求。”汪玉说。即便现有的*的芯片，想处理算力问题也仍有很大应战。

算力之外，大模型数据也有应战。一位做智能轿车的创始人苦恼于数据量太大，他们公司刚卖了1万辆轿车，但发生的数据现已让他觉得很巨大了，他不敢幻想卖到10万辆车时会怎样。硬币的另一面，也有人由于数据不行而感到困难，一位用大模型做生物医药研制的人士说，他们最缺的便是数据，这阻止了他们研制医药的速度。

腾讯高档履行副总裁汤道生表明，通用大模型一般根据揭露信息来练习，在许多专业常识和职业数据堆集缺乏。在战略上，通用大模型有点像“把大海煮沸”，不行聚集，可以处理80%的问题，但未必可以满意企业某个场景的详细需求。

徐立也说到，大模型的错觉性问题仍很严重，是需求处理的问题。错觉性问题是自然言语处理范畴中的根底问题之一，指文本生成模型的生成成果中含有与输入事实上抵触的内容。这些问题造成了大模型“不苟言笑的胡言乱语”现象。

除此之外，清华大学智能工业研讨院院长、我国工程院院士张亚勤说到，当下大模型仍有自己的局限性。比方ChatGPT会有时效性问题，你问它它是什么时候发布的，它不知道，由于它运用的是2021年9月前的数据。别的，大模型还有功率低、涉嫌侵略隐私和常识产权维护问题等，这些问题都将影响大模型的商用。张亚勤以为，大模型功率至少还要进步10倍，才有大规划商用的可能性。

上一篇：扎克伯格「狙击」马斯克，Threads 野心不止仿制

下一篇：阿斯巴甜疑似致癌，想吃口甜太难了