当前位置：首页 > 软件资讯 > 消息称华为版ChatGPT“盘古 Chat”7月7日发布，面向To B/G政企端客户

消息称华为版ChatGPT“盘古 Chat”7月7日发布，面向To B/G政企端客户

分区：软件资讯

6月5日，钛媒体从华为独家获悉，华为将发布一款名为“盘古聊”的多模态千亿级大模型产品，直接针对ChatGPT。

据介绍，盘古模型于2020年11月在华为云成功建立。这个“盘古聊天”预计将在华为云开发者大会(HDC)上发布和测试。云2023)今年7月7日举行。该产品主要针对B/G政府和企业客户。

根据华为公布的一篇论文的数据，华为盘古-σ模型的参数最多1.085万亿，是基于华为自研的MindSpore框架开发的。整体来看，盘古-σ模型在对话方面可能接近GPT-3.5的水平。

公开资料显示，华为盘古机型于2021年4月正式发布，后于2022年4月升级至2.0版本。目前AI大模型中的NLP大模型、CV大模型、科学计算大模型(气象大模型)都已经标注上线。

据介绍，这是首个千亿参数的大型中文预训练模型，CV模型首次达到30亿参数。盘古CV模型是业内最大的CV模型，首次实现区分能力和生成能力兼备，在ImageNet上小样本学习能力行业第一；盘古气象模型提供秒级天气预报；紫东台初是世界上第一个拥有图形、文字、声音三种模式的大型模型。

对于盘古模型的定位，华为内部团队确立了三个关键的核心设计原则:一是模型要足够大，能够吸收海量数据；二是网络结构强，能真正发挥模型的性能；第三，需要具备优秀的概括能力，能够真正落地在各行各业的工作场景中。

根据华为云高管演讲的PPT信息，目前华为“盘古系列AI大模型”的基础层主要包括NLP大模型、CV大模型、科学计算大模型，上层是与合作伙伴共同开发的华为行业大模型。

华为云官网显示，盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等组成。通过模型泛化，可以解决传统AI workshop开发模式下无法解决的AI规模化、产业化问题，可以支持多种自然语言处理任务，包括文本生成、文本分类、问答系统等。

具体来说，盘古NLP模型首次采用编解码架构，兼顾了NLP模型的理解能力和生成能力，保证了模型嵌入不同系统的灵活性。在下游应用中，只需要少量样本和可学习的参数，就可以完成千亿规模大模型的快速微调和下游适配，在智能舆情和智能营销方面都有不错的表现。

盘古NLP大模型

盘古CV大模型首次是业内最大的CV大模型，首次实现了区分和生成的能力。基于模型规模和运行速度的要求，可以自适应提取不同尺度的模型，AI应用的发展迅速落地。通过使用分层语义对齐和语义调整算法，在浅层特征中获得更好的可分性，小样本学习能力显著提升，达到业界第一。该模型在智能巡检和智能物流方面有很好的表现。

盘古CV大模型

盘古气象模型提供秒级天气预报。借助创新的3DEST网络结构和分层时间聚合算法，天气预报准确率高于目前最先进的预报方法，速度比传统方法提高1000倍以上。同时，盘古气象模型支持多种下游预报方案。例如，与传统数值天气预报方法相比，盘古气象模型在台风路径预报任务中可以减少20%以上的位置误差。

盘古气象模型

根据浙商证券此前披露的信息，华为在训练盘古模型千亿参数时，使用了2000多颗腾盛910芯片，进行了2个多月的数据训练能力。据华为介绍，每年大规模模型训练需要调用4000多块GPU/TPU卡，大规模模型三年的计算成本高达9.6亿元。

东吴证券在华为盘古大模的产业链研究报告中指出，华为盘古大模的优势在于人才储备和算力自主可控，有望成为国内领先的大模，其生态产业链标的有望加速发展，包括韦陀信息、四川长虹、麒麟软件(中国软件)、同心软件(澄迈科技)、麒麟信安等华为生态公司。郭盛证券认为，华为盘古是首款多模态千亿级机型，有望赋能各行各业。