浪潮信息:公司源1.0大模型结构与GPT-3类似 参数量增加40%

最新信息

浪潮信息:公司源1.0大模型结构与GPT-3类似 参数量增加40%
2023-02-15 08:19:00
K图 000977_0
  2月14日,服务器厂商浪潮信息(000977)在深交所互动平台上回复投资者问题时表示,公司在AIGC(人工智能生成内容)赛道已从底层计算能力、中间层大模型算法能力和上层行业应用方面进行布局和待续研发投入,未来将会持续发布AIGC的支撑产品。
  浪潮信息还介绍,公司2021年发布的源1.0大模型是面向中文的超大规模预训练自然语言模型,模型结构与GPT-3类似,与GPT-3相比参数量增加40%,训练数据集提升10倍,达到了2457亿参数,训练使用了5TB的高质量中文数据。
  GPT-3是美国OpenAI研发的聊天机器人程序ChatGPT目前采用的模型结构。华安证券报告称,GPT3模型就需要上千片A100芯片超一个月的训练时间,其中包括1750亿个参数、45TB数据量。
  浪潮信息还表示,公司一直在推进大模型的行业应用落地,如“AI剧本杀”、“ 心理咨询AI陪练”、“AI反诈”、“金陵诗会”、企业“智能客服大脑”等应用。“ChatGPT是一款非常优秀的应用产品,对我们规划设计产品也提供了非常好的借鉴。未来我们也会持续不断地发布基于源大模型的落地应用产品。”
  有投资者提问浪潮信息,是否有能力为人工智能生成内容和对话机器人提供算力服务?浪潮信息表示,公司在人工智能服务器领域的市占率位居全球AI服务器市场第一,在中国市场份额已连续五年保持50%以上,相关AI产品对于内容生成的全流程的计算能力需求都可满足。百度、腾讯是公司重要客户。
  2月14日收盘,浪潮信息股价为33.92元,涨幅3.86%。进入2月份以来,市场对ChatGPT概念热捧,浪潮信息股价已经大幅上涨43.36%。
(文章来源:澎湃新闻)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

浪潮信息:公司源1.0大模型结构与GPT-3类似 参数量增加40%

sitemap.xml sitemap2.xml sitemap3.xml sitemap4.xml