转发
◆
◆
发表于 2024-12-24 06:29:46
发布于 山西
$岩山科技(SZ002195)$ 岩山科技的投资概念非常多,先扒一下YAN模型。
在当今的人工智能领域,大型语言模型正成为研究和商业应用的热点。这些模型以其惊人的语言理解和生成能力改变了技术景观。目前,市场上主流的大型语言模型包括OpenAI的GPT系列、Meta的LLaMa系列和Google的PaLM系列,它们都基于一种被称为Transformer的架构。Transformer架构由于其独特的自注意力机制,能够高效处理长距离的依赖关系,因此在自然语言处理(NLP)领域取得了巨大成功。
岩芯数智最近发布的YAN大模型代表了AI领域的一次重要创新,它采用了非Transformer架构,旨在解决现有Transformer模型面临的一系列挑战,如高算力消耗、训练和推理效率低下等问题。YAN模型的开发创造了这一全新的架构,期望它能成为AI领域的一项基础设施,并推动开发者生态的建设。在AI算力发展方向上看要么沿着Transformer架构跟在发达公司后面拾人牙慧,要么沿着非Transformer架构另辟蹊径做第一个吃螃蟹的大胆创新。
岩芯数智刘凡平相信,一定会有一个新的架构出现,来替代Transformer架构,这也遵循了客观规律。
《Attention is All You Need》作者Aidan Gomez今年4月曾抛出类似的观点,这个世界需要比Transformer更好的架构,我们所有人都希望它能被某种新架构所取代,将我们带到一个新的性能高原。现在,我们使用了过多的计算资源,也做了很多无用的计算。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》