第143章 太恐怖了叭。。&拿下!
⚡ 自动翻页
开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽
看到章尾自动进入下一章,追书不用一直点。
  第143章 太恐怖了叭。。&拿下!
  为什么这么说呢?
  2014年,巴拉巴拉等人在lstm基础上,提出了“注意力机制”,解决了传统“序列到序列模型”的瓶颈问题。
  这一创新,为2017年出现的transformer架构,埋下伏笔。
  而transformer架构,正是后世大模型的核心架构!
  同时,lstm在语音识別、机器翻译等领域的成功应用,推动了深度学习框架的优化,
  以及gpu加速技术的成熟,为大模型时代奠定了工程基础!
  提前布局lstm,不仅可帮助极光,在当前建立技术壁垒,更能通过持续叠代演进,为后续切入ai大模型领域,积累宝贵的算法工程经验和数据资產!
  而算法和ai,前世今生都是洛川最感兴趣的领域!
  同时,如果能提前掌握sltm和transformer架构,还可推动国內gpu厂商的研发进度。
  比如,入股一家或几家国產gpu厂商,向他们开放模型底层优化需求,推动专用定製晶片的合作研发,从而实现硬体-算法协同优化。
  同时联合中芯国际等厂商,推动国產6工艺与gpu架构同步开发。
  此时的中芯国际,已经具备生產65nm工艺的能力了。
  產品刚刚通过良率测试,还需要一段时间才能进入量產阶段。
  这也是当前全球gpu厂商,普遍採用的工艺。