pytorch 多GPU數據並行化

04-24

如果一個模型太大，一張顯卡上放不下，或者batch size太大，一張卡放不下，那麼就需要用多塊卡一起訓練，這時候涉及到 nn. DataParallel 的實用。

這個模塊的作用，本質上來說，就是：