microsoft · trajepl · Aug 29, 2024 · Sep 3, 2024 · Sep 3, 2024 · Sep 4, 2024
diff --git a/olive/auto_optimizer/config_template/opt_level_passes.yaml b/olive/auto_optimizer/config_template/opt_level_passes.yaml
@@ -17,4 +17,3 @@
   - [OnnxConversion]
   - [OrtTransformersOptimization]
   - [OrtMixedPrecision, OnnxQuantization, IncQuantization, VitisAIQuantization, OnnxMatMul4Quantizer]
-  - [OrtPerfTuning]
diff --git a/olive/auto_optimizer/regulate_mixins.py b/olive/auto_optimizer/regulate_mixins.py
@@ -110,7 +110,7 @@ def regulate_data_config(self, pass_config, pass_flows):
         if len(self.data_configs) != 1:
             raise ValueError("AutoOptimizer expects exactly one data config.")
 
-        passes_require_data_config = ["OnnxQuantization", "OrtPerfTuning"]
+        passes_require_data_config = ["OnnxQuantization", "OrtPerfTuning", "IncQuantization"]
         for p in passes_require_data_config:
             # TODO(anyone): support multi data_config for different passes, pass_flows
             p_names = self._find_pass_name_in_pass_flow(p, pass_flows)

diff --git a/olive/cli/auto_opt.py b/olive/cli/auto_opt.py
@@ -0,0 +1,230 @@
+# -------------------------------------------------------------------------
+# Copyright (c) Microsoft Corporation. All rights reserved.
+# Licensed under the MIT License.
+# --------------------------------------------------------------------------
+import json
+import logging
+import tempfile
+from argparse import ArgumentParser
+from copy import deepcopy
+from pathlib import Path
+from typing import ClassVar, Dict
+
+from olive.cli.base import BaseOliveCLICommand, add_remote_options, is_remote_run
+from olive.common.utils import set_tempdir
+
+logger = logging.getLogger(__name__)
+
+
+EVALUATE_TEMPLATE = {
+    "common_evaluator": {
+        "metrics": [
+            {
+                "name": "accuracy",
+                "type": "accuracy",
+                "sub_types": [
+                    {"name": "accuracy_score", "priority": 1, "goal": {"type": "max-degradation", "value": 0.01}},
+                    {"name": "f1_score"},
+                    {"name": "auroc"},
+                ],
+                "data_config": "data_config",
+            },
+            {
+                "name": "latency",
+                "type": "latency",
+                "sub_types": [
+                    {"name": "avg", "priority": 2, "goal": {"type": "percent-min-improvement", "value": 20}},
+                    {"name": "max"},
+                    {"name": "min"},
+                ],
+                "data_config": "data_config",
+                "user_config": {"io_bind": True},
+            },
+        ]
+    }
+}
+
+TEMPLATE = {
+    "input_model": {"type": "HfModel"},
+    "auto_optimizer_config": {},
+    "search_strategy": {"execution_order": "joint", "search_algorithm": "tpe", "num_samples": 5, "seed": 0},
+    "systems": {
+        "local_system": {
+            "type": "LocalSystem",
+            "accelerators": [{"device": "cpu", "execution_providers": ["CPUExecutionProvider"]}],
+        }
+    },
+    "host": "local_system",
+    "evaluators": EVALUATE_TEMPLATE,
+    "evaluator": "common_evaluator",
+    "target": "local_system",
+}
+
+
+class AutoOptCommand(BaseOliveCLICommand):
+    allow_unknown_args: ClassVar[bool] = True
+
+    @staticmethod
+    def register_subcommand(parser: ArgumentParser):
+        sub_parser = parser.add_parser(
+            "auto-opt",
+            help=("Automatically performance optimize input model"),
+        )
+
+        # model options
+        model_group = sub_parser.add_argument_group("model options")
+        model_group.add_argument(
+            "--model",
+            required=True,
+            help="Onnx input model path.",
+        )
+        model_group.add_argument(
+            "--task",
+            type=str,
+            default=None,
+            help="The task of the input model. Need to be specified if the input model is downloaded from huggingface.",
+        )
+        model_group.add_argument(
+            "--model_type",
+            type=str,
+            default="HfModel",
+            choices=["HfModel", "ONNXModel"],
+            help="model type, choose from HfModel and ONNXModel",
+        )
+
+        system_group = sub_parser.add_argument_group("system options")
+        system_group.add_argument(
+            "--device",
+            type=str,
+            default=None,
+            choices=["cpu", "gpu"],
+            # TODO(anyone): add more devices cpu_spr, npu, vpu, intel_myriad
+            help=(
+                "Device to use for optimization, choose from cpu and gpu. If not specified,"
+                " will deduce from the value of execution providers, CPU/VistisAi for cpu and"
+                " CUDA/Tensorrt/Dml for gpu. If both device and execution providers are not specified,"
+                " default to cpu device with CPUExecutionProvider."
+            ),
+        )
+        system_group.add_argument(
+            "--providers",
+            type=str,
+            nargs="*",
+            choices=["CPU", "CUDA", "Tensorrt", "Dml", "VitisAI"],
+            help="List of execution providers to use for optimization",
+        )
+
+        # dataset options
+        dataset_group = sub_parser.add_argument_group(
+            "dataset options, required for some optimization passes like quantization, and evaluation components"
+        )
+        dataset_group.add_argument(
+            "--data_config_path",
+            type=str,
+            required=True,
+            help="Path to the data config file. It allows to customize the data config(json/yaml) for the model.",
+        )
+
+        auto_opt_config_group = sub_parser.add_argument_group("auto optimizer options")
+        auto_opt_config_group.add_argument(
+            "--precisions",
+            type=str,
+            nargs="*",
+            choices=["fp16", "fp32", "int4", "int8"],
+            help=(
+                "The output precision of the optimized model. If not specified, "
+                "the default precision is fp32 for cpu and fp16 for gpu"
+            ),
+        )
+
+        search_strategy_group = sub_parser.add_argument_group("search strategy options")
+        search_strategy_group.add_argument(
+            "--num-samples", type=int, default=5, help="Number of samples for search algorithm"
+        )
+        search_strategy_group.add_argument("--seed", type=int, default=0, help="Random seed for search algorithm")
+        search_strategy_group.add_argument(
+            "--execution_order",
+            type=str,
+            default="joint",
+            choices=["joint", "pass-by-pass"],
+            help="Execution order for search strategy",
+        )
+        search_strategy_group.add_argument(
+            "--search_algorithm",
+            type=str,
+            default="tpe",
+            choices=["exhaustive", "tpe", "random"],
+            help="Search algorithm for search strategy",
+        )
+
+        # output options
+        output_group = sub_parser.add_argument_group("output options")
+        output_group.add_argument(
+            "--tempdir", default=None, type=str, help="Root directory for tempfile directories and files"
+        )
+        output_group.add_argument("-o", "--output_path", type=str, default="auto-opt-output", help="Output path")
+        # remote options
+        add_remote_options(sub_parser)
+        sub_parser.set_defaults(func=AutoOptCommand)
+
+    def _get_data_config(self) -> Dict:
+        with open(self.args.data_config_path) as f:
+            data_config = json.load(f)
+            data_config["name"] = "data_config"
+            return data_config
+        return None
+
+    def run(self):
+        from olive.workflows import run as olive_run
+
+        set_tempdir(self.args.output_path)
+        with tempfile.TemporaryDirectory() as tempdir:
+            run_config = self.get_run_config(tempdir)
+            olive_run(run_config)
+            if is_remote_run(self.args):
+                # TODO(jambayk): point user to datastore with outputs or download outputs
+                # both are not implemented yet
+                return
+            output_path = Path(self.args.output_path)
+            logger.info("Optimized ONNX Model is saved to %s", output_path.resolve())
+
+    def refine_args(self):
+        self.args.providers = self.args.providers or []
+        for idx, provider in enumerate(self.args.providers):
+            if not provider.endswith("ExecutionProvider"):
+                self.args.providers[idx] = f"{provider}ExecutionProvider"
+
+    def get_run_config(self, tempdir) -> Dict:
+        self.refine_args()
+        config = deepcopy(TEMPLATE)
+
+        config["input_model"]["model_path"] = self.args.model
+        config["input_model"]["type"] = self.args.model_type
+        if self.args.task:
+            config["input_model"]["task"] = self.args.task
+        config["cache_dir"] = Path(tempdir) / "cache"
+        config["output_dir"] = self.args.output_path
+
+        data_configs = self._get_data_config()
+        config["data_configs"] = [data_configs]
+
+        device = self.args.device
+        if not device:
+            device = (
+                "gpu"
+                if self.args.providers
+                and any(p[: -(len("ExecutionProvider"))] in ["CUDA", "Tensorrt", "Dml"] for p in self.args.providers)
+                else "cpu"
+            )
+        providers = self.args.providers or ["CPUExecutionProvider"] if device == "cpu" else ["CUDAExecutionProvider"]
+        config["systems"]["local_system"]["accelerators"] = [{"device": device, "execution_providers": providers}]
+        config["auto_optimizer_config"]["precisions"] = self.args.precisions
+
+        config["search_strategy"] = {
+            "execution_order": self.args.execution_order,
+            "search_algorithm": self.args.search_algorithm,
+            "num_samples": self.args.num_samples,
+            "seed": self.args.seed,
+        }
+        # TODO(anyone): add remote options to auto opt passes
+        return config
diff --git a/olive/cli/launcher.py b/olive/cli/launcher.py
@@ -6,6 +6,7 @@
 from argparse import ArgumentParser
 from warnings import warn
 
+from olive.cli.auto_opt import AutoOptCommand
 from olive.cli.capture_onnx import CaptureOnnxGraphCommand
 from olive.cli.cloud_cache import CloudCacheCommand
 from olive.cli.configure_qualcomm_sdk import ConfigureQualcommSDKCommand
@@ -26,6 +27,7 @@ def get_cli_parser(called_as_console_script: bool = True) -> ArgumentParser:
     commands_parser = parser.add_subparsers()
 
     # Register commands
+    AutoOptCommand.register_subcommand(commands_parser)
     CaptureOnnxGraphCommand.register_subcommand(commands_parser)
     WorkflowRunCommand.register_subcommand(commands_parser)
     FineTuneCommand.register_subcommand(commands_parser)

diff --git a/olive/passes/onnx/conversion.py b/olive/passes/onnx/conversion.py
@@ -54,7 +54,7 @@ def _default_config(cls, accelerator_spec: AcceleratorSpec) -> Dict[str, PassCon
             **get_user_script_data_config(),
             **get_external_data_config(),
             "target_opset": PassConfigParam(
-                type_=int, default_value=13, description="The version of the default (ai.onnx) opset to target."
+                type_=int, default_value=14, description="The version of the default (ai.onnx) opset to target."
             ),
             "use_dynamo_exporter": PassConfigParam(
                 type_=bool, default_value=False, description="Whether to use dynamo_export API to export ONNX model."

diff --git a/test/unit_test/cli/test_cli.py b/test/unit_test/cli/test_cli.py
@@ -15,7 +15,8 @@
 
 @pytest.mark.parametrize("console_script", [True, False])
 @pytest.mark.parametrize(
-    "command", ["run", "configure-qualcomm-sdk", "manage-aml-compute", "export-adapters", "tune-session-params"]
+    "command",
+    ["run", "configure-qualcomm-sdk", "manage-aml-compute", "export-adapters", "tune-session-params", "auto-opt"],
 )
 def test_valid_command(console_script, command):
     # setup