change callbacks

microsoft · Jun 26, 2023 · c4d6846 · c4d6846
1 parent 21d77a7
commit c4d6846
Show file tree

Hide file tree

Showing 4 changed files with 10 additions and 10 deletions.
diff --git a/mttl/models/encoder_decoder.py b/mttl/models/encoder_decoder.py
@@ -107,7 +107,7 @@ def validation_step(self, batch, batch_idx):
         self.log("val/loss", mean_loss, on_epoch=True, prog_bar=True)
         return loss, batch['task_ids']
 
-    def validation_epoch_end(self, outputs):
+    def on_validation_epoch_end(self, outputs):
         losses = torch.cat([out[0].sum(-1) for out in outputs], 0)
         task_ids = torch.cat([out[1] for out in outputs], 0)
 
@@ -229,13 +229,13 @@ def validation_step(self, batch, batch_idx):
     def test_step(self, batch, batch_idx):
         return self.inference_step(batch)
 
-    def validation_epoch_end(self, outputs):
+    def on_validation_epoch_end(self, outputs):
         return self.inference_end(outputs, self.trainer.datamodule.dataset_reader, "val")
 
-    def test_epoch_end(self, outputs):
+    def on_test_epoch_end(self, outputs):
         return self.inference_end(outputs, self.trainer.datamodule.dataset_reader, "test")
 
-    def training_epoch_end(self, losses):
+    def on_training_epoch_end(self, losses):
         avg_loss = (sum([x["loss"] for x in losses]) / len(losses)).item()
         lrs = [x["lr"] for x in self.optimizers().param_groups]
         print(f"loss : {avg_loss:.4f}\tlr {lrs}\n")
diff --git a/mttl/models/t0_encoder_decoder.py b/mttl/models/t0_encoder_decoder.py
@@ -480,7 +480,7 @@ def inference_epoch_end(self, outputs, split="val"):
             metrics = {}
         return metrics
 
-    def validation_epoch_end(self, outputs):
+    def on_validation_epoch_end(self, outputs):
         try:
             # differentiate between fine-tuning phase / zero-shot phase and
             # validation phase during training. this will raise because
@@ -502,7 +502,7 @@ def validation_epoch_end(self, outputs):
                     )
                 f.write(json.dumps(task_losses) + "\n")
 
-    def test_epoch_end(self, outputs):
+    def on_test_epoch_end(self, outputs):
         return self.inference_epoch_end(outputs, split="test")
 
     def configure_optimizers(self):

diff --git a/mttl/online_eval.py b/mttl/online_eval.py
@@ -1,6 +1,7 @@
 import copy
 import torch
-from pytorch_lightning.callbacks.base import Callback
+
+from pytorch_lightning.callbacks import Callback
 from pytorch_lightning import Trainer
 
 from mttl.datamodule.ni_data_module import NIDataModule

diff --git a/pl_train.py b/pl_train.py
@@ -105,17 +105,16 @@ def run_multitask(args):
         kwargs["enable_checkpointing"] = False
 
     trainer = Trainer(
-        gpus=-1,
+        devices=-1,
         accelerator="gpu",
         logger=loggers,
         num_sanity_val_steps=5,
-        amp_backend="native",
         default_root_dir=args.output_dir,
         max_epochs=args.num_train_epochs,
         max_steps=args.total_steps + 1 if args.total_steps != -1 else -1,
         gradient_clip_val=args.max_grad_norm,
         log_every_n_steps=50,
-        strategy=args.compute_strategy if args.compute_strategy else None,
+        strategy=args.compute_strategy if args.compute_strategy else "auto",
         callbacks=callbacks,
         accumulate_grad_batches=args.gradient_accumulation_steps,
         precision=int(args.precision)