当前位置:首页 > 软件资讯 > 消息称华为版ChatGPT“盘古 Chat”7月7日发布,面向To B/G政企端客户

消息称华为版ChatGPT“盘古 Chat”7月7日发布,面向To B/G政企端客户

分区:软件资讯

6月5日,钛媒体从华为独家获悉,华为将发布一款名为“盘古聊”的多模态千亿级大模型产品,直接针对ChatGPT。

据介绍,盘古模型于2020年11月在华为云成功建立。这个“盘古聊天”预计将在华为云开发者大会(HDC)上发布和测试。云2023)今年7月7日举行。该产品主要针对B/G政府和企业客户。

根据华为公布的一篇论文的数据,华为盘古-σ模型的参数最多1.085万亿,是基于华为自研的MindSpore框架开发的。整体来看,盘古-σ模型在对话方面可能接近GPT-3.5的水平。

公开资料显示,华为盘古机型于2021年4月正式发布,后于2022年4月升级至2.0版本。目前AI大模型中的NLP大模型、CV大模型、科学计算大模型(气象大模型)都已经标注上线。

据介绍,这是首个千亿参数的大型中文预训练模型,CV模型首次达到30亿参数。盘古CV模型是业内最大的CV模型,首次实现区分能力和生成能力兼备,在ImageNet上小样本学习能力行业第一;盘古气象模型提供秒级天气预报;紫东台初是世界上第一个拥有图形、文字、声音三种模式的大型模型。

对于盘古模型的定位,华为内部团队确立了三个关键的核心设计原则:一是模型要足够大,能够吸收海量数据;二是网络结构强,能真正发挥模型的性能;第三,需要具备优秀的概括能力,能够真正落地在各行各业的工作场景中。

根据华为云高管演讲的PPT信息,目前华为“盘古系列AI大模型”的基础层主要包括NLP大模型、CV大模型、科学计算大模型,上层是与合作伙伴共同开发的华为行业大模型。

华为云官网显示,盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等组成。通过模型泛化,可以解决传统AI workshop开发模式下无法解决的AI规模化、产业化问题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等。

具体来说,盘古NLP模型首次采用编解码架构,兼顾了NLP模型的理解能力和生成能力,保证了模型嵌入不同系统的灵活性。在下游应用中,只需要少量样本和可学习的参数,就可以完成千亿规模大模型的快速微调和下游适配,在智能舆情和智能营销方面都有不错的表现。

盘古NLP大模型

盘古CV大模型首次是业内最大的CV大模型,首次实现了区分和生成的能力。基于模型规模和运行速度的要求,可以自适应提取不同尺度的模型,AI应用的发展迅速落地。通过使用分层语义对齐和语义调整算法,在浅层特征中获得更好的可分性,小样本学习能力显著提升,达到业界第一。该模型在智能巡检和智能物流方面有很好的表现。

盘古CV大模型

盘古气象模型提供秒级天气预报。借助创新的3DEST网络结构和分层时间聚合算法,天气预报准确率高于目前最先进的预报方法,速度比传统方法提高1000倍以上。同时,盘古气象模型支持多种下游预报方案。例如,与传统数值天气预报方法相比,盘古气象模型在台风路径预报任务中可以减少20%以上的位置误差。

盘古气象模型

根据浙商证券此前披露的信息,华为在训练盘古模型千亿参数时,使用了2000多颗腾盛910芯片,进行了2个多月的数据训练能力。据华为介绍,每年大规模模型训练需要调用4000多块GPU/TPU卡,大规模模型三年的计算成本高达9.6亿元。

东吴证券在华为盘古大模的产业链研究报告中指出,华为盘古大模的优势在于人才储备和算力自主可控,有望成为国内领先的大模,其生态产业链标的有望加速发展,包括韦陀信息、四川长虹、麒麟软件(中国软件)、同心软件(澄迈科技)、麒麟信安等华为生态公司。郭盛证券认为,华为盘古是首款多模态千亿级机型,有望赋能各行各业。

  • 最新资讯
  • 最新软件