benchmarks/dynamo/huggingface.py

*da0073e9SAndroid Build Coastguard Worker#!/usr/bin/env python3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport importlib
*da0073e9SAndroid Build Coastguard Workerimport logging
*da0073e9SAndroid Build Coastguard Workerimport os
*da0073e9SAndroid Build Coastguard Workerimport re
*da0073e9SAndroid Build Coastguard Workerimport subprocess
*da0073e9SAndroid Build Coastguard Workerimport sys
*da0073e9SAndroid Build Coastguard Workerimport warnings
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workertry:
*da0073e9SAndroid Build Coastguard Worker    from .common import (
*da0073e9SAndroid Build Coastguard Worker        BenchmarkRunner,
*da0073e9SAndroid Build Coastguard Worker        download_retry_decorator,
*da0073e9SAndroid Build Coastguard Worker        load_yaml_file,
*da0073e9SAndroid Build Coastguard Worker        main,
*da0073e9SAndroid Build Coastguard Worker        reset_rng_state,
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Workerexcept ImportError:
*da0073e9SAndroid Build Coastguard Worker    from common import (
*da0073e9SAndroid Build Coastguard Worker        BenchmarkRunner,
*da0073e9SAndroid Build Coastguard Worker        download_retry_decorator,
*da0073e9SAndroid Build Coastguard Worker        load_yaml_file,
*da0073e9SAndroid Build Coastguard Worker        main,
*da0073e9SAndroid Build Coastguard Worker        reset_rng_state,
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Workerfrom torch._dynamo.testing import collect_results
*da0073e9SAndroid Build Coastguard Workerfrom torch._dynamo.utils import clone_inputs
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerlog = logging.getLogger(__name__)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# Enable FX graph caching
*da0073e9SAndroid Build Coastguard Workerif "TORCHINDUCTOR_FX_GRAPH_CACHE" not in os.environ:
*da0073e9SAndroid Build Coastguard Worker    torch._inductor.config.fx_graph_cache = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef pip_install(package):
*da0073e9SAndroid Build Coastguard Worker    subprocess.check_call([sys.executable, "-m", "pip", "install", package])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# Disable the flake warnings for the imports. Flake8 does not provide a way to
*da0073e9SAndroid Build Coastguard Worker# disable just warning for the entire file. Disabling flake8 entirely.
*da0073e9SAndroid Build Coastguard Worker# flake8: noqa
*da0073e9SAndroid Build Coastguard Workerimports = [
*da0073e9SAndroid Build Coastguard Worker    "AlbertForPreTraining",
*da0073e9SAndroid Build Coastguard Worker    "AutoConfig",
*da0073e9SAndroid Build Coastguard Worker    "AutoModelForCausalLM",
*da0073e9SAndroid Build Coastguard Worker    "AutoModelForMaskedLM",
*da0073e9SAndroid Build Coastguard Worker    "AutoModelForSeq2SeqLM",
*da0073e9SAndroid Build Coastguard Worker    "BigBirdConfig",
*da0073e9SAndroid Build Coastguard Worker    "BlenderbotForConditionalGeneration",
*da0073e9SAndroid Build Coastguard Worker    "BlenderbotModel",
*da0073e9SAndroid Build Coastguard Worker    "BlenderbotSmallForConditionalGeneration",
*da0073e9SAndroid Build Coastguard Worker    "BlenderbotSmallModel",
*da0073e9SAndroid Build Coastguard Worker    "CLIPModel",
*da0073e9SAndroid Build Coastguard Worker    "CLIPVisionModel",
*da0073e9SAndroid Build Coastguard Worker    "ElectraForPreTraining",
*da0073e9SAndroid Build Coastguard Worker    "GPT2ForSequenceClassification",
*da0073e9SAndroid Build Coastguard Worker    "GPTJForSequenceClassification",
*da0073e9SAndroid Build Coastguard Worker    "GPTNeoForSequenceClassification",
*da0073e9SAndroid Build Coastguard Worker    "HubertForSequenceClassification",
*da0073e9SAndroid Build Coastguard Worker    "LxmertForPreTraining",
*da0073e9SAndroid Build Coastguard Worker    "LxmertForQuestionAnswering",
*da0073e9SAndroid Build Coastguard Worker    "MarianForCausalLM",
*da0073e9SAndroid Build Coastguard Worker    "MarianModel",
*da0073e9SAndroid Build Coastguard Worker    "MarianMTModel",
*da0073e9SAndroid Build Coastguard Worker    "PegasusForConditionalGeneration",
*da0073e9SAndroid Build Coastguard Worker    "PegasusModel",
*da0073e9SAndroid Build Coastguard Worker    "ReformerConfig",
*da0073e9SAndroid Build Coastguard Worker    "ViTForImageClassification",
*da0073e9SAndroid Build Coastguard Worker    "ViTForMaskedImageModeling",
*da0073e9SAndroid Build Coastguard Worker    "ViTModel",
*da0073e9SAndroid Build Coastguard Worker]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef process_hf_reformer_output(out):
*da0073e9SAndroid Build Coastguard Worker    assert isinstance(out, list)
*da0073e9SAndroid Build Coastguard Worker    # second output is unstable
*da0073e9SAndroid Build Coastguard Worker    return [elem for i, elem in enumerate(out) if i != 1]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workertry:
*da0073e9SAndroid Build Coastguard Worker    mod = importlib.import_module("transformers")
*da0073e9SAndroid Build Coastguard Worker    for cls in imports:
*da0073e9SAndroid Build Coastguard Worker        if not hasattr(mod, cls):
*da0073e9SAndroid Build Coastguard Worker            raise ModuleNotFoundError
*da0073e9SAndroid Build Coastguard Workerexcept ModuleNotFoundError:
*da0073e9SAndroid Build Coastguard Worker    print("Installing HuggingFace Transformers...")
*da0073e9SAndroid Build Coastguard Worker    pip_install("git+https://github.com/huggingface/transformers.git#egg=transformers")
*da0073e9SAndroid Build Coastguard Workerfinally:
*da0073e9SAndroid Build Coastguard Worker    for cls in imports:
*da0073e9SAndroid Build Coastguard Worker        exec(f"from transformers import {cls}")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# These models contain the models present in huggingface_models_list. It is a
*da0073e9SAndroid Build Coastguard Worker# combination of models supported by HF Fx parser and some manually supplied
*da0073e9SAndroid Build Coastguard Worker# models. For these models, we already know the largest batch size that can fit
*da0073e9SAndroid Build Coastguard Worker# on A100 GPUs - 40 GB.
*da0073e9SAndroid Build Coastguard WorkerBATCH_SIZE_KNOWN_MODELS = {}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# TODO(sdym): use batch-size-file parameter of common.main, like torchbench.py
*da0073e9SAndroid Build Coastguard Worker# Get the list of models and their batch sizes
*da0073e9SAndroid Build Coastguard WorkerMODELS_FILENAME = os.path.join(os.path.dirname(__file__), "huggingface_models_list.txt")
*da0073e9SAndroid Build Coastguard Workerassert os.path.exists(MODELS_FILENAME)
*da0073e9SAndroid Build Coastguard Workerwith open(MODELS_FILENAME, "r") as fh:
*da0073e9SAndroid Build Coastguard Worker    lines = fh.readlines()
*da0073e9SAndroid Build Coastguard Worker    lines = [line.rstrip() for line in lines]
*da0073e9SAndroid Build Coastguard Worker    for line in lines:
*da0073e9SAndroid Build Coastguard Worker        model_name, batch_size = line.split(",")
*da0073e9SAndroid Build Coastguard Worker        batch_size = int(batch_size)
*da0073e9SAndroid Build Coastguard Worker        BATCH_SIZE_KNOWN_MODELS[model_name] = batch_size
*da0073e9SAndroid Build Coastguard Workerassert len(BATCH_SIZE_KNOWN_MODELS)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef get_module_cls_by_model_name(model_cls_name):
*da0073e9SAndroid Build Coastguard Worker    _module_by_model_name = {
*da0073e9SAndroid Build Coastguard Worker        "Speech2Text2Decoder": "transformers.models.speech_to_text_2.modeling_speech_to_text_2",
*da0073e9SAndroid Build Coastguard Worker        "TrOCRDecoder": "transformers.models.trocr.modeling_trocr",
*da0073e9SAndroid Build Coastguard Worker    }
*da0073e9SAndroid Build Coastguard Worker    module_name = _module_by_model_name.get(model_cls_name, "transformers")
*da0073e9SAndroid Build Coastguard Worker    module = importlib.import_module(module_name)
*da0073e9SAndroid Build Coastguard Worker    return getattr(module, model_cls_name)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef get_sequence_length(model_cls, model_name):
*da0073e9SAndroid Build Coastguard Worker    if model_name.startswith(("Blenderbot",)):
*da0073e9SAndroid Build Coastguard Worker        seq_length = 128
*da0073e9SAndroid Build Coastguard Worker    elif model_name.startswith(("GPT2", "Bart", "T5", "PLBart", "MBart")):
*da0073e9SAndroid Build Coastguard Worker        seq_length = 1024
*da0073e9SAndroid Build Coastguard Worker    elif model_name in ("AllenaiLongformerBase", "BigBird"):
*da0073e9SAndroid Build Coastguard Worker        seq_length = 1024
*da0073e9SAndroid Build Coastguard Worker    elif model_name.startswith("OPT"):
*da0073e9SAndroid Build Coastguard Worker        seq_length = 2048
*da0073e9SAndroid Build Coastguard Worker    elif "Reformer" in model_name:
*da0073e9SAndroid Build Coastguard Worker        seq_length = 4096
*da0073e9SAndroid Build Coastguard Worker    elif model_name.startswith(
*da0073e9SAndroid Build Coastguard Worker        (
*da0073e9SAndroid Build Coastguard Worker            "Albert",
*da0073e9SAndroid Build Coastguard Worker            "Deberta",
*da0073e9SAndroid Build Coastguard Worker            "Layout",
*da0073e9SAndroid Build Coastguard Worker            "Electra",
*da0073e9SAndroid Build Coastguard Worker            "XLNet",
*da0073e9SAndroid Build Coastguard Worker            "MegatronBert",
*da0073e9SAndroid Build Coastguard Worker            "Bert",
*da0073e9SAndroid Build Coastguard Worker            "Roberta",
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    ) or model_name in ("DistillGPT2", "GoogleFnet", "YituTechConvBert", "CamemBert"):
*da0073e9SAndroid Build Coastguard Worker        seq_length = 512
*da0073e9SAndroid Build Coastguard Worker    elif model_name in ("TrOCRForCausalLM"):
*da0073e9SAndroid Build Coastguard Worker        seq_length = 256
*da0073e9SAndroid Build Coastguard Worker    elif model_name.startswith("MobileBert"):
*da0073e9SAndroid Build Coastguard Worker        seq_length = 128
*da0073e9SAndroid Build Coastguard Worker    elif model_name.startswith("Wav2Vec2"):
*da0073e9SAndroid Build Coastguard Worker        # If too short, will fail with something like
*da0073e9SAndroid Build Coastguard Worker        # ValueError: `mask_length` has to be smaller than `sequence_length`,
*da0073e9SAndroid Build Coastguard Worker        # but got `mask_length`: 10 and `sequence_length`: 9`
*da0073e9SAndroid Build Coastguard Worker        seq_length = 10000  # NB: a more realistic size is 155136
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        log.info(
*da0073e9SAndroid Build Coastguard Worker            f"Sequence Length not defined for {model_name}. Choosing 128 arbitrarily"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        seq_length = 128
*da0073e9SAndroid Build Coastguard Worker    return seq_length
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef generate_inputs_for_model(
*da0073e9SAndroid Build Coastguard Worker    model_cls, model, model_name, bs, device, include_loss_args=False
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    # TODO - Check if following values are representative
*da0073e9SAndroid Build Coastguard Worker    num_choices = 3
*da0073e9SAndroid Build Coastguard Worker    num_visual_features = 42
*da0073e9SAndroid Build Coastguard Worker    seq_length = get_sequence_length(model_cls, model_name)
*da0073e9SAndroid Build Coastguard Worker    vocab_size = model.config.vocab_size
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    if model_name.startswith("Wav2Vec2"):
*da0073e9SAndroid Build Coastguard Worker        # TODO: If we add more input_values style models, try to work this
*da0073e9SAndroid Build Coastguard Worker        # into the overall control flow
*da0073e9SAndroid Build Coastguard Worker        target_length = 100
*da0073e9SAndroid Build Coastguard Worker        return {
*da0073e9SAndroid Build Coastguard Worker            "input_values": torch.randn((bs, seq_length), device=device),
*da0073e9SAndroid Build Coastguard Worker            # Added because that's what the example training script has
*da0073e9SAndroid Build Coastguard Worker            "attention_mask": rand_int_tensor(device, 0, 2, (bs, seq_length)),
*da0073e9SAndroid Build Coastguard Worker            "labels": rand_int_tensor(device, 0, vocab_size, (bs, target_length)),
*da0073e9SAndroid Build Coastguard Worker        }
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    if model_name.endswith("MultipleChoice"):
*da0073e9SAndroid Build Coastguard Worker        input = rand_int_tensor(device, 0, vocab_size, (bs, num_choices, seq_length))
*da0073e9SAndroid Build Coastguard Worker    elif model_name.startswith("Roberta"):
*da0073e9SAndroid Build Coastguard Worker        input = rand_int_tensor(device, 0, 1, (bs, seq_length))
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        input = rand_int_tensor(device, 0, vocab_size, (bs, seq_length))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    if "Bart" in model_name:
*da0073e9SAndroid Build Coastguard Worker        input[:, -1] = model.config.eos_token_id
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    input_dict = {"input_ids": input}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    if (
*da0073e9SAndroid Build Coastguard Worker        model_name.startswith("T5")
*da0073e9SAndroid Build Coastguard Worker        or model_name.startswith("M2M100")
*da0073e9SAndroid Build Coastguard Worker        or model_name.startswith("MT5")
*da0073e9SAndroid Build Coastguard Worker        or model_cls
*da0073e9SAndroid Build Coastguard Worker        in [
*da0073e9SAndroid Build Coastguard Worker            BlenderbotModel,
*da0073e9SAndroid Build Coastguard Worker            BlenderbotSmallModel,
*da0073e9SAndroid Build Coastguard Worker            BlenderbotForConditionalGeneration,
*da0073e9SAndroid Build Coastguard Worker            BlenderbotSmallForConditionalGeneration,
*da0073e9SAndroid Build Coastguard Worker            PegasusModel,
*da0073e9SAndroid Build Coastguard Worker            PegasusForConditionalGeneration,
*da0073e9SAndroid Build Coastguard Worker            MarianModel,
*da0073e9SAndroid Build Coastguard Worker            MarianMTModel,
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        input_dict["decoder_input_ids"] = input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    if model_name.startswith("Lxmert"):
*da0073e9SAndroid Build Coastguard Worker        visual_feat_dim, visual_pos_dim = (
*da0073e9SAndroid Build Coastguard Worker            model.config.visual_feat_dim,
*da0073e9SAndroid Build Coastguard Worker            model.config.visual_pos_dim,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        input_dict["visual_feats"] = torch.randn(
*da0073e9SAndroid Build Coastguard Worker            bs, num_visual_features, visual_feat_dim
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        input_dict["visual_pos"] = torch.randn(bs, num_visual_features, visual_pos_dim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    if include_loss_args:
*da0073e9SAndroid Build Coastguard Worker        if model_name.endswith("PreTraining"):
*da0073e9SAndroid Build Coastguard Worker            if model_cls in [ElectraForPreTraining, LxmertForPreTraining]:
*da0073e9SAndroid Build Coastguard Worker                input_dict["labels"] = rand_int_tensor(device, 0, 1, (bs, seq_length))
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                label_name = (
*da0073e9SAndroid Build Coastguard Worker                    "sentence_order_label"
*da0073e9SAndroid Build Coastguard Worker                    if model_cls in [AlbertForPreTraining]
*da0073e9SAndroid Build Coastguard Worker                    else "next_sentence_label"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                input_dict["labels"] = (
*da0073e9SAndroid Build Coastguard Worker                    rand_int_tensor(device, 0, vocab_size, (bs, seq_length)),
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                input_dict[label_name] = rand_int_tensor(device, 0, 1, (bs,))
*da0073e9SAndroid Build Coastguard Worker        elif model_name.endswith("QuestionAnswering"):
*da0073e9SAndroid Build Coastguard Worker            input_dict["start_positions"] = rand_int_tensor(
*da0073e9SAndroid Build Coastguard Worker                device, 0, seq_length, (bs,)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            input_dict["end_positions"] = rand_int_tensor(device, 0, seq_length, (bs,))
*da0073e9SAndroid Build Coastguard Worker        elif (
*da0073e9SAndroid Build Coastguard Worker            model_name.endswith("MaskedLM")
*da0073e9SAndroid Build Coastguard Worker            or model_name.endswith("HeadModel")
*da0073e9SAndroid Build Coastguard Worker            or model_name.endswith("CausalLM")
*da0073e9SAndroid Build Coastguard Worker            or model_name.endswith("DoubleHeadsModel")
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            input_dict["labels"] = rand_int_tensor(
*da0073e9SAndroid Build Coastguard Worker                device, 0, vocab_size, (bs, seq_length)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        elif model_name.endswith("TokenClassification"):
*da0073e9SAndroid Build Coastguard Worker            input_dict["labels"] = rand_int_tensor(
*da0073e9SAndroid Build Coastguard Worker                device, 0, model.config.num_labels - 1, (bs, seq_length)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        elif model_name.endswith("MultipleChoice"):
*da0073e9SAndroid Build Coastguard Worker            input_dict["labels"] = rand_int_tensor(device, 0, num_choices, (bs,))
*da0073e9SAndroid Build Coastguard Worker        elif model_name.endswith("SequenceClassification"):
*da0073e9SAndroid Build Coastguard Worker            input_dict["labels"] = rand_int_tensor(
*da0073e9SAndroid Build Coastguard Worker                device, 0, model.config.num_labels - 1, (bs,)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        elif model_name.endswith("NextSentencePrediction"):
*da0073e9SAndroid Build Coastguard Worker            input_dict["labels"] = rand_int_tensor(device, 0, 1, (bs,))
*da0073e9SAndroid Build Coastguard Worker        elif model_name.endswith("ForConditionalGeneration"):
*da0073e9SAndroid Build Coastguard Worker            input_dict["labels"] = rand_int_tensor(
*da0073e9SAndroid Build Coastguard Worker                device, 0, vocab_size - 1, (bs, seq_length)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        elif model_name in EXTRA_MODELS:
*da0073e9SAndroid Build Coastguard Worker            input_dict["labels"] = rand_int_tensor(
*da0073e9SAndroid Build Coastguard Worker                device, 0, vocab_size, (bs, seq_length)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            raise NotImplementedError(
*da0073e9SAndroid Build Coastguard Worker                f"Class {model_name} unsupported for training test "
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return input_dict
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef rand_int_tensor(device, low, high, shape):
*da0073e9SAndroid Build Coastguard Worker    return torch.randint(
*da0073e9SAndroid Build Coastguard Worker        low,
*da0073e9SAndroid Build Coastguard Worker        high,
*da0073e9SAndroid Build Coastguard Worker        shape,
*da0073e9SAndroid Build Coastguard Worker        device=device,
*da0073e9SAndroid Build Coastguard Worker        dtype=torch.int64,
*da0073e9SAndroid Build Coastguard Worker        requires_grad=False,
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard WorkerEXTRA_MODELS = {
*da0073e9SAndroid Build Coastguard Worker    "AllenaiLongformerBase": (
*da0073e9SAndroid Build Coastguard Worker        AutoConfig.from_pretrained("allenai/longformer-base-4096"),
*da0073e9SAndroid Build Coastguard Worker        AutoModelForMaskedLM,
*da0073e9SAndroid Build Coastguard Worker    ),
*da0073e9SAndroid Build Coastguard Worker    "Reformer": (
*da0073e9SAndroid Build Coastguard Worker        ReformerConfig(),
*da0073e9SAndroid Build Coastguard Worker        AutoModelForMaskedLM,
*da0073e9SAndroid Build Coastguard Worker    ),
*da0073e9SAndroid Build Coastguard Worker    "T5Small": (
*da0073e9SAndroid Build Coastguard Worker        AutoConfig.from_pretrained("t5-small"),
*da0073e9SAndroid Build Coastguard Worker        AutoModelForSeq2SeqLM,
*da0073e9SAndroid Build Coastguard Worker    ),
*da0073e9SAndroid Build Coastguard Worker    # "BigBird": (
*da0073e9SAndroid Build Coastguard Worker    #     BigBirdConfig(attention_type="block_sparse"),
*da0073e9SAndroid Build Coastguard Worker    #     AutoModelForMaskedLM,
*da0073e9SAndroid Build Coastguard Worker    # ),
*da0073e9SAndroid Build Coastguard Worker    "DistillGPT2": (
*da0073e9SAndroid Build Coastguard Worker        AutoConfig.from_pretrained("distilgpt2"),
*da0073e9SAndroid Build Coastguard Worker        AutoModelForCausalLM,
*da0073e9SAndroid Build Coastguard Worker    ),
*da0073e9SAndroid Build Coastguard Worker    "GoogleFnet": (
*da0073e9SAndroid Build Coastguard Worker        AutoConfig.from_pretrained("google/fnet-base"),
*da0073e9SAndroid Build Coastguard Worker        AutoModelForMaskedLM,
*da0073e9SAndroid Build Coastguard Worker    ),
*da0073e9SAndroid Build Coastguard Worker    "YituTechConvBert": (
*da0073e9SAndroid Build Coastguard Worker        AutoConfig.from_pretrained("YituTech/conv-bert-base"),
*da0073e9SAndroid Build Coastguard Worker        AutoModelForMaskedLM,
*da0073e9SAndroid Build Coastguard Worker    ),
*da0073e9SAndroid Build Coastguard Worker    "CamemBert": (
*da0073e9SAndroid Build Coastguard Worker        AutoConfig.from_pretrained("camembert-base"),
*da0073e9SAndroid Build Coastguard Worker        AutoModelForMaskedLM,
*da0073e9SAndroid Build Coastguard Worker    ),
*da0073e9SAndroid Build Coastguard Worker}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass HuggingfaceRunner(BenchmarkRunner):
*da0073e9SAndroid Build Coastguard Worker    def __init__(self):
*da0073e9SAndroid Build Coastguard Worker        super().__init__()
*da0073e9SAndroid Build Coastguard Worker        self.suite_name = "huggingface"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def _config(self):
*da0073e9SAndroid Build Coastguard Worker        return load_yaml_file("huggingface.yaml")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def _skip(self):
*da0073e9SAndroid Build Coastguard Worker        return self._config["skip"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def _accuracy(self):
*da0073e9SAndroid Build Coastguard Worker        return self._config["accuracy"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def skip_models(self):
*da0073e9SAndroid Build Coastguard Worker        return self._skip["all"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def skip_models_for_cpu(self):
*da0073e9SAndroid Build Coastguard Worker        return self._skip["device"]["cpu"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def fp32_only_models(self):
*da0073e9SAndroid Build Coastguard Worker        return self._config["only_fp32"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def skip_models_due_to_control_flow(self):
*da0073e9SAndroid Build Coastguard Worker        return self._skip["control_flow"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _get_model_cls_and_config(self, model_name):
*da0073e9SAndroid Build Coastguard Worker        if model_name not in EXTRA_MODELS:
*da0073e9SAndroid Build Coastguard Worker            model_cls = get_module_cls_by_model_name(model_name)
*da0073e9SAndroid Build Coastguard Worker            config_cls = model_cls.config_class
*da0073e9SAndroid Build Coastguard Worker            config = config_cls()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # NB: some models need a pad token defined to handle BS > 1
*da0073e9SAndroid Build Coastguard Worker            if (
*da0073e9SAndroid Build Coastguard Worker                model_cls
*da0073e9SAndroid Build Coastguard Worker                in [
*da0073e9SAndroid Build Coastguard Worker                    GPT2ForSequenceClassification,
*da0073e9SAndroid Build Coastguard Worker                    GPTNeoForSequenceClassification,
*da0073e9SAndroid Build Coastguard Worker                    GPTJForSequenceClassification,
*da0073e9SAndroid Build Coastguard Worker                ]
*da0073e9SAndroid Build Coastguard Worker                or model_cls.__name__.startswith("Roberta")
*da0073e9SAndroid Build Coastguard Worker                or model_cls.__name__.startswith("Marian")
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                config.pad_token_id = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            config, model_cls = EXTRA_MODELS[model_name]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return model_cls, config
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @download_retry_decorator
*da0073e9SAndroid Build Coastguard Worker    def _download_model(self, model_name):
*da0073e9SAndroid Build Coastguard Worker        model_cls, config = self._get_model_cls_and_config(model_name)
*da0073e9SAndroid Build Coastguard Worker        if "auto" in model_cls.__module__:
*da0073e9SAndroid Build Coastguard Worker            # Handle auto classes
*da0073e9SAndroid Build Coastguard Worker            model = model_cls.from_config(config)
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            model = model_cls(config)
*da0073e9SAndroid Build Coastguard Worker        return model
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def load_model(
*da0073e9SAndroid Build Coastguard Worker        self,
*da0073e9SAndroid Build Coastguard Worker        device,
*da0073e9SAndroid Build Coastguard Worker        model_name,
*da0073e9SAndroid Build Coastguard Worker        batch_size=None,
*da0073e9SAndroid Build Coastguard Worker        extra_args=None,
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        is_training = self.args.training
*da0073e9SAndroid Build Coastguard Worker        use_eval_mode = self.args.use_eval_mode
*da0073e9SAndroid Build Coastguard Worker        dtype = torch.float32
*da0073e9SAndroid Build Coastguard Worker        reset_rng_state()
*da0073e9SAndroid Build Coastguard Worker        model_cls, config = self._get_model_cls_and_config(model_name)
*da0073e9SAndroid Build Coastguard Worker        model = self._download_model(model_name)
*da0073e9SAndroid Build Coastguard Worker        model = model.to(device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        if self.args.enable_activation_checkpointing:
*da0073e9SAndroid Build Coastguard Worker            model.gradient_checkpointing_enable()
*da0073e9SAndroid Build Coastguard Worker        if model_name in BATCH_SIZE_KNOWN_MODELS:
*da0073e9SAndroid Build Coastguard Worker            batch_size_default = BATCH_SIZE_KNOWN_MODELS[model_name]
*da0073e9SAndroid Build Coastguard Worker        elif batch_size is None:
*da0073e9SAndroid Build Coastguard Worker            batch_size_default = 16
*da0073e9SAndroid Build Coastguard Worker            log.info(
*da0073e9SAndroid Build Coastguard Worker                f"Batch size not specified for {model_name}. Setting batch_size=16"
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if batch_size is None:
*da0073e9SAndroid Build Coastguard Worker            batch_size = batch_size_default
*da0073e9SAndroid Build Coastguard Worker            batch_size_divisors = self._config["batch_size"]["divisors"]
*da0073e9SAndroid Build Coastguard Worker            if model_name in batch_size_divisors:
*da0073e9SAndroid Build Coastguard Worker                batch_size = max(int(batch_size / batch_size_divisors[model_name]), 1)
*da0073e9SAndroid Build Coastguard Worker                log.info(
*da0073e9SAndroid Build Coastguard Worker                    f"Running smaller batch size={batch_size} for {model_name}, orig batch_size={batch_size_default}"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        example_inputs = generate_inputs_for_model(
*da0073e9SAndroid Build Coastguard Worker            model_cls, model, model_name, batch_size, device, include_loss_args=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # So we can check for correct gradients without eliminating the dropout computation
*da0073e9SAndroid Build Coastguard Worker        for attr in dir(config):
*da0073e9SAndroid Build Coastguard Worker            if "drop" in attr and isinstance(getattr(config, attr), float):
*da0073e9SAndroid Build Coastguard Worker                setattr(config, attr, 1e-30)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if (
*da0073e9SAndroid Build Coastguard Worker            is_training
*da0073e9SAndroid Build Coastguard Worker            and not use_eval_mode
*da0073e9SAndroid Build Coastguard Worker            and not (
*da0073e9SAndroid Build Coastguard Worker                self.args.accuracy and model_name in self._config["only_inference"]
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            model.train()
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            model.eval()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.validate_model(model, example_inputs)
*da0073e9SAndroid Build Coastguard Worker        return device, model_name, model, example_inputs, batch_size
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def iter_model_names(self, args):
*da0073e9SAndroid Build Coastguard Worker        model_names = list(BATCH_SIZE_KNOWN_MODELS.keys()) + list(EXTRA_MODELS.keys())
*da0073e9SAndroid Build Coastguard Worker        model_names = set(model_names)
*da0073e9SAndroid Build Coastguard Worker        model_names = sorted(model_names)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        start, end = self.get_benchmark_indices(len(model_names))
*da0073e9SAndroid Build Coastguard Worker        for index, model_name in enumerate(model_names):
*da0073e9SAndroid Build Coastguard Worker            if index < start or index >= end:
*da0073e9SAndroid Build Coastguard Worker                continue
*da0073e9SAndroid Build Coastguard Worker            if (
*da0073e9SAndroid Build Coastguard Worker                not re.search("|".join(args.filter), model_name, re.I)
*da0073e9SAndroid Build Coastguard Worker                or re.search("|".join(args.exclude), model_name, re.I)
*da0073e9SAndroid Build Coastguard Worker                or model_name in args.exclude_exact
*da0073e9SAndroid Build Coastguard Worker                or model_name in self.skip_models
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                continue
*da0073e9SAndroid Build Coastguard Worker            yield model_name
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def skip_accuracy_checks_large_models_dashboard(self):
*da0073e9SAndroid Build Coastguard Worker        if self.args.dashboard or self.args.accuracy:
*da0073e9SAndroid Build Coastguard Worker            return self._accuracy["skip"]["large_models"]
*da0073e9SAndroid Build Coastguard Worker        return set()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def get_output_amp_train_process_func(self):
*da0073e9SAndroid Build Coastguard Worker        return {}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def pick_grad(self, name, is_training):
*da0073e9SAndroid Build Coastguard Worker        if is_training:
*da0073e9SAndroid Build Coastguard Worker            return torch.enable_grad()
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            return torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def get_tolerance_and_cosine_flag(self, is_training, current_device, name):
*da0073e9SAndroid Build Coastguard Worker        cosine = self.args.cosine
*da0073e9SAndroid Build Coastguard Worker        if is_training:
*da0073e9SAndroid Build Coastguard Worker            from torch._inductor import config as inductor_config
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if (name in self._config["tolerance"]["higher_training"]) or (
*da0073e9SAndroid Build Coastguard Worker                inductor_config.max_autotune
*da0073e9SAndroid Build Coastguard Worker                and name in self._config["tolerance"]["higher_max_autotune_training"]
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                return 2e-2, cosine
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                return 1e-2, cosine
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            if name in self._config["tolerance"]["higher_inference"]:
*da0073e9SAndroid Build Coastguard Worker                return 4e-3, cosine
*da0073e9SAndroid Build Coastguard Worker            if (
*da0073e9SAndroid Build Coastguard Worker                current_device == "cpu"
*da0073e9SAndroid Build Coastguard Worker                and name in self._config["tolerance"]["higher_inference_cpu"]
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                return 4e-3, cosine
*da0073e9SAndroid Build Coastguard Worker        return 1e-3, cosine
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def compute_loss(self, pred):
*da0073e9SAndroid Build Coastguard Worker        return pred[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def forward_pass(self, mod, inputs, collect_outputs=True):
*da0073e9SAndroid Build Coastguard Worker        with self.autocast(**self.autocast_arg):
*da0073e9SAndroid Build Coastguard Worker            return mod(**inputs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def forward_and_backward_pass(self, mod, inputs, collect_outputs=True):
*da0073e9SAndroid Build Coastguard Worker        cloned_inputs = clone_inputs(inputs)
*da0073e9SAndroid Build Coastguard Worker        self.optimizer_zero_grad(mod)
*da0073e9SAndroid Build Coastguard Worker        with self.autocast(**self.autocast_arg):
*da0073e9SAndroid Build Coastguard Worker            pred = mod(**cloned_inputs)
*da0073e9SAndroid Build Coastguard Worker            loss = self.compute_loss(pred)
*da0073e9SAndroid Build Coastguard Worker        self.grad_scaler.scale(loss).backward()
*da0073e9SAndroid Build Coastguard Worker        self.optimizer_step()
*da0073e9SAndroid Build Coastguard Worker        if collect_outputs:
*da0073e9SAndroid Build Coastguard Worker            return collect_results(mod, pred, loss, cloned_inputs)
*da0073e9SAndroid Build Coastguard Worker        return None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef refresh_model_names_and_batch_sizes():
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    This function reads the HF Fx tracer supported models and finds the largest
*da0073e9SAndroid Build Coastguard Worker    batch size that could fit on the GPU with PyTorch eager.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    The resulting data is written in huggingface_models_list.txt.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Note - We only need to run this function if we believe that HF Fx tracer now
*da0073e9SAndroid Build Coastguard Worker    supports more models.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    import transformers.utils.fx as hf_fx
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    family = {}
*da0073e9SAndroid Build Coastguard Worker    lm_seen = set()
*da0073e9SAndroid Build Coastguard Worker    family_seen = set()
*da0073e9SAndroid Build Coastguard Worker    for cls_name in hf_fx._SUPPORTED_MODELS:
*da0073e9SAndroid Build Coastguard Worker        if "For" not in cls_name:
*da0073e9SAndroid Build Coastguard Worker            continue
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        model_cls = get_module_cls_by_model_name(cls_name)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # TODO: AttributeError: '*Config' object has no attribute 'vocab_size'
*da0073e9SAndroid Build Coastguard Worker        if model_cls in [
*da0073e9SAndroid Build Coastguard Worker            CLIPModel,
*da0073e9SAndroid Build Coastguard Worker            CLIPVisionModel,
*da0073e9SAndroid Build Coastguard Worker            # SwinForImageClassification,
*da0073e9SAndroid Build Coastguard Worker            # SwinForImageClassification,
*da0073e9SAndroid Build Coastguard Worker            # SwinForMaskedImageModeling,
*da0073e9SAndroid Build Coastguard Worker            # SwinModel,
*da0073e9SAndroid Build Coastguard Worker            ViTForImageClassification,
*da0073e9SAndroid Build Coastguard Worker            ViTForMaskedImageModeling,
*da0073e9SAndroid Build Coastguard Worker            ViTModel,
*da0073e9SAndroid Build Coastguard Worker        ]:
*da0073e9SAndroid Build Coastguard Worker            continue
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # TODO: AssertionError: Padding_idx must be within num_embeddings
*da0073e9SAndroid Build Coastguard Worker        if model_cls in [MarianForCausalLM, MarianMTModel, MarianModel]:
*da0073e9SAndroid Build Coastguard Worker            continue
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # TODO: "model is not supported yet" from HFTracer
*da0073e9SAndroid Build Coastguard Worker        if model_cls in [HubertForSequenceClassification]:
*da0073e9SAndroid Build Coastguard Worker            continue
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # TODO: shape mismatch in loss calculation
*da0073e9SAndroid Build Coastguard Worker        if model_cls in [LxmertForQuestionAnswering]:
*da0073e9SAndroid Build Coastguard Worker            continue
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        family_name = cls_name.split("For")[0]
*da0073e9SAndroid Build Coastguard Worker        if family_name not in family:
*da0073e9SAndroid Build Coastguard Worker            family[family_name] = []
*da0073e9SAndroid Build Coastguard Worker        if cls_name.endswith(("MaskedLM", "CausalLM")) and family_name not in lm_seen:
*da0073e9SAndroid Build Coastguard Worker            family[family_name].append(cls_name)
*da0073e9SAndroid Build Coastguard Worker            lm_seen.add(family_name)
*da0073e9SAndroid Build Coastguard Worker        elif (
*da0073e9SAndroid Build Coastguard Worker            cls_name.endswith(
*da0073e9SAndroid Build Coastguard Worker                ("SequenceClassification", "ConditionalGeneration", "QuestionAnswering")
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            and family_name not in family_seen
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            family[family_name].append(cls_name)
*da0073e9SAndroid Build Coastguard Worker            family_seen.add(family_name)
*da0073e9SAndroid Build Coastguard Worker        elif cls_name.endswith("ImageClassification"):
*da0073e9SAndroid Build Coastguard Worker            family[family_name].append(cls_name)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    chosen_models = set()
*da0073e9SAndroid Build Coastguard Worker    for members in family.values():
*da0073e9SAndroid Build Coastguard Worker        chosen_models.update(set(members))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Add the EXTRA_MODELS
*da0073e9SAndroid Build Coastguard Worker    chosen_models.update(set(EXTRA_MODELS.keys()))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    for model_name in sorted(chosen_models):
*da0073e9SAndroid Build Coastguard Worker        try:
*da0073e9SAndroid Build Coastguard Worker            subprocess.check_call(
*da0073e9SAndroid Build Coastguard Worker                [sys.executable]
*da0073e9SAndroid Build Coastguard Worker                + sys.argv
*da0073e9SAndroid Build Coastguard Worker                + ["--find-batch-sizes"]
*da0073e9SAndroid Build Coastguard Worker                + [f"--only={model_name}"]
*da0073e9SAndroid Build Coastguard Worker                + [f"--output={MODELS_FILENAME}"]
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        except subprocess.SubprocessError:
*da0073e9SAndroid Build Coastguard Worker            log.warning(f"Failed to find suitable batch size for {model_name}")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef huggingface_main():
*da0073e9SAndroid Build Coastguard Worker    # Code to refresh model names and batch sizes
*da0073e9SAndroid Build Coastguard Worker    # if "--find-batch-sizes" not in sys.argv:
*da0073e9SAndroid Build Coastguard Worker    #     refresh_model_names_and_batch_sizes()
*da0073e9SAndroid Build Coastguard Worker    logging.basicConfig(level=logging.WARNING)
*da0073e9SAndroid Build Coastguard Worker    warnings.filterwarnings("ignore")
*da0073e9SAndroid Build Coastguard Worker    main(HuggingfaceRunner())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerif __name__ == "__main__":
*da0073e9SAndroid Build Coastguard Worker    huggingface_main()