董秘你好!请问Yan 1.0大模型有什么突出特点?他的数据来源是哪里?与其他大模型相比有什么优势?预计什么时候面向市场推广?预计会给公司收益有什么帮助?
岩山科技:
您好,感谢对公司的关注。
公司生成式AI(AIGC)业务于2024年1月发布了国内首个非Attention机制的通用大模型——“Yan 1.0模型”。Yan架构没有采用Transformer架构及Attention机制,将计算复杂度从Transformer架构标准Attention机制的O(n^2*d)(其中n表示序列长度、d表示特征维度,^2指平方)降低为O(n*d)(线性复杂度),从而提高了Yan架构模型的训练效率和收敛速度。
在对比实验情况下Yan 1.0模型拥有相较于同等参数Transformer架构Llama 2模型更高的训练推理效率、吞吐量及记忆能力,更低的机器幻觉表达,同时支持CPU无损运行并100%支持私有化应用。原生结构的Yan架构模型,在零压缩、零裁剪的情况下,依然能够流畅运行于主流消费级CPU设备。
公司生成式AI(AIGC)业务现阶段商业化的重点主要在尝试为企业客户提供本地化应用和部署,满足客户对于数据隐私、安全及低成本部署上的需求,目前尚未形成规模收益。
谢谢。
您好,感谢对公司的关注。
公司生成式AI(AIGC)业务于2024年1月发布了国内首个非Attention机制的通用大模型——“Yan 1.0模型”。Yan架构没有采用Transformer架构及Attention机制,将计算复杂度从Transformer架构标准Attention机制的O(n^2*d)(其中n表示序列长度、d表示特征维度,^2指平方)降低为O(n*d)(线性复杂度),从而提高了Yan架构模型的训练效率和收敛速度。
在对比实验情况下Yan 1.0模型拥有相较于同等参数Transformer架构Llama 2模型更高的训练推理效率、吞吐量及记忆能力,更低的机器幻觉表达,同时支持CPU无损运行并100%支持私有化应用。原生结构的Yan架构模型,在零压缩、零裁剪的情况下,依然能够流畅运行于主流消费级CPU设备。
公司生成式AI(AIGC)业务现阶段商业化的重点主要在尝试为企业客户提供本地化应用和部署,满足客户对于数据隐私、安全及低成本部署上的需求,目前尚未形成规模收益。
谢谢。
(来自 深交所互动易)
答复时间 2024-05-16 16:54:01
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》