PyTorch 2.0 发布,一行代码将训练提速 76%!( 三 )
官方的目标是定义两个运算符集:
Primops包含约250个相对底层的运算符 , 因为足够底层 , 所以这些运算符更适用于编译器 , 开发者需要将这些算子进行融合 , 才能获得良好的性能 。
ATenops包含约750个典型运算符(canonicaloperator) , 适合于直接输出 。 这些运算符适用于已经在ATen级别上集成的后端 , 或者没有经过编译的后端 , 才能从底层运算符集(如Primops)恢复性能 。
动态形状
在研究支持PyTorch代码通用性的必要条件时 , 一个关键要求是支持动态形状 , 并允许模型接受不同大小的张量 , 而不会在每次形状变化时引起重新编译 。 目前为止 , 对动态形状的支持有限 , 并且正在进行中 。 它将在稳定版本中具有完整的功能 。 在不支持动态形状的情况下 , 常见的解决方法是将其填充到最接近的2次方 。 然而 , 正如我们从下面的图表中所看到的 , 它产生了大量的性能开销 , 同时也带来了明显更长的编译时间 。 现在 , 有了对动态形状的支持 , PyTorch2.0也就获得了比Eager高出了最多40%的性能 。 
文章图片
简而言之 , 就是PyTorch2.0stable版本预计明年3月发布 , PyTorch2.0在保留原有优势的同时 , 大力支持编译 , torch.compile为可选功能 , 只需一行代码即可运行编译 , 还有4项重要技术:TorchDynamo、AOTAutograd、PrimTorch以及TorchInductor , PyTorch1.x代码无需向2.0迁移 , 更多用户体验以及Q&A , 大家可以查看下方链接中原文呦~
参考链接:
【PyTorch 2.0 发布,一行代码将训练提速 76%!】https://pytorch.org/get-started/pytorch-2.0/

文章图片
??
- 2022年已经进入到了尾声|小米13刚发布,中国移动送出喜讯:5G功耗第一,综合评测第一
- 雷军宣布小米13系列将很快登陆全球市场:国外用户激动坏了在中国市场发布后|雷军宣布小米13系列很快登陆全球市场:国外用户激动坏了
- 我们成年了! 每日经济新闻创刊18周年,线上发布五大创新项目
- 12月13日消息|怒喵科技am65less键盘即将发布
- 键盘|砍掉方向键见过么?怒喵全新AM 65 Less键盘即将发布
- 在小米13系列&MIUI14新品发布会上|立减200元:小米soundpro音箱2台套装狂促开启
- 中国移动|中国移动发布2022年智能硬件质量报告:小米赢麻了!包揽多项冠军
- 苹果|iPhone 15 Ultra尚没发布,但定位奢侈品苹果用户伤不起
- 小米科技|MIUI 14 发布:关于小米 Android 13 更新的所有细节
- 处方|医疗机构可在线开具新冠处方,两地率先发布在线诊疗名单,国内在线医疗用户规模达3亿人次
