时间: 2023-10-19 17:53:21 | 作者: 亚盈平台
咱们知道,面临现在的AI深度学习结构,没个好点的GPU显卡几乎都不好意思出手。要说有钱人瞧不上咱们贫民倒也罢了,就连现在的人工智能程序都或许瞧不上——假如你的显卡不行层次的话。深度学习要用强悍的GPU,而GPU又离不开CUDA运算渠道。生于斯时,深度学习的技能高度就比如CUDA这类编程的难度,不是检测你的智商便是检测你的财商。难免会把许多爱好者学习者拒之门外,让人无可奈何。
而现在,高产如那啥啥的OpenAI再次出手,这次他们推出一种新的言语和编译器——Triton。据宣称,这种新的编程言语Triton只需25行代码,就能在FP16矩阵乘法shang上到达与cuBLAS适当的功用。正如Triton项目的负责人Philippe Tillet说的,咱们的方针是使Triton成为深度学习CUDA的可行代替计划。
这个起源于2019年一次学术会议上的一篇论文中。Tillet处理的问题是怎么开发一种cuDNN更具表现力的言语,既可处理神经网络中触及的矩阵的各种操作,一起兼具可移植性且以及和cuDNN相媲美的功用。
这个就必须触及到GPU的一点常识。现代的GPU大约能分为DRAM、SRAM、ALU三个组件,而要想对这些资源进行调度办理则是很杂乱,即便是了解CUDA的程序员,也要费时吃力大伤脑细胞。而Triton的功用特点是将这些优化进程彻底自动化,让开发的人能更好地专心于并行代码的高档逻辑。
要说这个Triton能有如此杰出的功用,仍是要来自于以Triton-IR为中心的模块化体系架构,这是一种根据LLVM的中心表明。现在呢,它现已在github上开源了一个项目,有爱好的朋友能够去看看。作为一款刚诞生的小家伙,这个新出的编程言语只支撑英伟达GPU,乃至还没有CPU版别,不过官方现已表态AMD的GPU以及CPU的版别正在开发中。拭目而待吧。
备案号:粤ICP备19039425号 主要专业从事机器人系统维修,变频器维修,伺服驱动器维修,直流调速器维修,触摸屏维修, 欢迎来电咨询!