pytorch/torch/_utils.py

*da0073e9SAndroid Build Coastguard Worker# mypy: allow-untyped-defs
*da0073e9SAndroid Build Coastguard Workerimport copyreg
*da0073e9SAndroid Build Coastguard Workerimport functools
*da0073e9SAndroid Build Coastguard Workerimport logging
*da0073e9SAndroid Build Coastguard Workerimport sys
*da0073e9SAndroid Build Coastguard Workerimport traceback
*da0073e9SAndroid Build Coastguard Workerimport warnings
*da0073e9SAndroid Build Coastguard Workerfrom collections import defaultdict
*da0073e9SAndroid Build Coastguard Workerfrom typing import Any, Callable, DefaultDict, Generic, List, Optional
*da0073e9SAndroid Build Coastguard Workerfrom typing_extensions import ParamSpec
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _type(self, dtype=None, non_blocking=False, **kwargs):
*da0073e9SAndroid Build Coastguard Worker    """Returns the type if `dtype` is not provided, else casts this object to
*da0073e9SAndroid Build Coastguard Worker    the specified type.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    If this is already of the correct type, no copy is performed and the
*da0073e9SAndroid Build Coastguard Worker    original object is returned.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        dtype (type or string): The desired type
*da0073e9SAndroid Build Coastguard Worker        non_blocking (bool): If ``True``, and the source is in pinned memory
*da0073e9SAndroid Build Coastguard Worker            and destination is on the GPU or vice versa, the copy is performed
*da0073e9SAndroid Build Coastguard Worker            asynchronously with respect to the host. Otherwise, the argument
*da0073e9SAndroid Build Coastguard Worker            has no effect.
*da0073e9SAndroid Build Coastguard Worker        **kwargs: For compatibility, may contain the key ``async`` in place of
*da0073e9SAndroid Build Coastguard Worker            the ``non_blocking`` argument. The ``async`` arg is deprecated.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    non_blocking = _get_async_or_non_blocking("type", non_blocking, kwargs)
*da0073e9SAndroid Build Coastguard Worker    if dtype is None:
*da0073e9SAndroid Build Coastguard Worker        return self.__module__ + "." + self.__class__.__name__
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    if isinstance(dtype, str):
*da0073e9SAndroid Build Coastguard Worker        dtype = _import_dotted_name(dtype)
*da0073e9SAndroid Build Coastguard Worker    if dtype == type(self):
*da0073e9SAndroid Build Coastguard Worker        return self
*da0073e9SAndroid Build Coastguard Worker    if self.is_sparse:
*da0073e9SAndroid Build Coastguard Worker        if not dtype.is_sparse:
*da0073e9SAndroid Build Coastguard Worker            raise RuntimeError("Cannot cast sparse tensor to dense tensor")
*da0073e9SAndroid Build Coastguard Worker        new_module_name = dtype.__module__.replace(".sparse", "")
*da0073e9SAndroid Build Coastguard Worker        new_values_type_name = new_module_name + "." + dtype.__name__
*da0073e9SAndroid Build Coastguard Worker        new_values = torch.Tensor._values(self).type(new_values_type_name, non_blocking)
*da0073e9SAndroid Build Coastguard Worker        new_indices_type_name = new_module_name + ".LongTensor"
*da0073e9SAndroid Build Coastguard Worker        new_indices = torch.Tensor._indices(self).type(
*da0073e9SAndroid Build Coastguard Worker            new_indices_type_name, non_blocking
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        return dtype(new_indices, new_values, self.size())
*da0073e9SAndroid Build Coastguard Worker    if dtype.is_sparse:
*da0073e9SAndroid Build Coastguard Worker        raise RuntimeError("Cannot cast dense tensor to sparse tensor")
*da0073e9SAndroid Build Coastguard Worker    return dtype(self.size()).copy_(self, non_blocking)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _to(self, device, non_blocking=False):
*da0073e9SAndroid Build Coastguard Worker    """Returns a copy of this object in device memory.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    If this object is already on the correct device, then no copy is performed
*da0073e9SAndroid Build Coastguard Worker    and the original object is returned.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        device (int): The destination device.
*da0073e9SAndroid Build Coastguard Worker        non_blocking (bool): If ``True`` and the source is in pinned memory,
*da0073e9SAndroid Build Coastguard Worker            the copy will be asynchronous with respect to the host. Otherwise,
*da0073e9SAndroid Build Coastguard Worker            the argument has no effect.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    if self.device == device:
*da0073e9SAndroid Build Coastguard Worker        return self
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    device_module = getattr(torch, device.type, None)
*da0073e9SAndroid Build Coastguard Worker    assert (
*da0073e9SAndroid Build Coastguard Worker        device_module is not None
*da0073e9SAndroid Build Coastguard Worker    ), f"{device.type.upper()} device module is not loaded"
*da0073e9SAndroid Build Coastguard Worker    with device_module.device(device):
*da0073e9SAndroid Build Coastguard Worker        if self.is_sparse and hasattr(device_module, "sparse"):
*da0073e9SAndroid Build Coastguard Worker            new_type = getattr(device_module.sparse, self.__class__.__name__)
*da0073e9SAndroid Build Coastguard Worker            indices = getattr(torch.Tensor._indices(self), device.type)(
*da0073e9SAndroid Build Coastguard Worker                device, non_blocking
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            values = getattr(torch.Tensor._values(self), device.type)(
*da0073e9SAndroid Build Coastguard Worker                device, non_blocking
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            return new_type(indices, values, self.size())
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            assert (
*da0073e9SAndroid Build Coastguard Worker                not self.is_sparse
*da0073e9SAndroid Build Coastguard Worker            ), f"sparse storage is not supported for {device.type.upper()} tensors"
*da0073e9SAndroid Build Coastguard Worker            untyped_storage = torch.UntypedStorage(self.size(), device=device)
*da0073e9SAndroid Build Coastguard Worker            untyped_storage.copy_(self, non_blocking)
*da0073e9SAndroid Build Coastguard Worker            return untyped_storage
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _get_async_or_non_blocking(function_name, non_blocking, kwargs):
*da0073e9SAndroid Build Coastguard Worker    """Return the non-blocking flag given the function name and kwargs.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        function_name (str): the name of the function being used.
*da0073e9SAndroid Build Coastguard Worker        non_blocking (bool): the default value.
*da0073e9SAndroid Build Coastguard Worker        **kwargs (dict): the kwargs passed to the function.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    if not kwargs:
*da0073e9SAndroid Build Coastguard Worker        return non_blocking
*da0073e9SAndroid Build Coastguard Worker    if len(kwargs) != 1 or "async" not in kwargs:
*da0073e9SAndroid Build Coastguard Worker        message = "{}() got an unexpected keyword argument '{}'"
*da0073e9SAndroid Build Coastguard Worker        argument = list(kwargs.keys()).pop()
*da0073e9SAndroid Build Coastguard Worker        raise TypeError(message.format(function_name, argument))
*da0073e9SAndroid Build Coastguard Worker    warnings.warn("'async' is deprecated; use 'non_blocking'")
*da0073e9SAndroid Build Coastguard Worker    return kwargs["async"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _get_restore_location(device):
*da0073e9SAndroid Build Coastguard Worker    """Return the map_location location.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Used for rebuild functions where the tensor device is distinct from the storage
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    map_location = torch.serialization._serialization_tls.map_location
*da0073e9SAndroid Build Coastguard Worker    if map_location is None:
*da0073e9SAndroid Build Coastguard Worker        return device
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        if isinstance(map_location, dict):
*da0073e9SAndroid Build Coastguard Worker            return map_location.get(device, device)
*da0073e9SAndroid Build Coastguard Worker        elif isinstance(map_location, (str, torch.device)):
*da0073e9SAndroid Build Coastguard Worker            return map_location
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            assert callable(map_location)
*da0073e9SAndroid Build Coastguard Worker            raise RuntimeError(
*da0073e9SAndroid Build Coastguard Worker                "Callable map_location not supported with _rebuild_wrapper_subclass "
*da0073e9SAndroid Build Coastguard Worker                "or _rebuild_device_tensor_from_numpy"
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# Note [Don't serialize hooks]
*da0073e9SAndroid Build Coastguard Worker# ~~~~~~~~~~~~~~~~~~~~~~~~~~~~
*da0073e9SAndroid Build Coastguard Worker# Since time immemorial, we have serialized the backward hooks associated with
*da0073e9SAndroid Build Coastguard Worker# variables.  This kind of half-worked--Python can pickle global functions
*da0073e9SAndroid Build Coastguard Worker# (but not closures!)--but there were problems.
*da0073e9SAndroid Build Coastguard Worker#
*da0073e9SAndroid Build Coastguard Worker#   - It's fragile.  If you serialize a backward hook into a saved
*da0073e9SAndroid Build Coastguard Worker#     model, and then you rename the function associated with the hook,
*da0073e9SAndroid Build Coastguard Worker#     now your saved model is broken and you can't load it anymore.
*da0073e9SAndroid Build Coastguard Worker#
*da0073e9SAndroid Build Coastguard Worker#   - It's not actually used.  The standard recommendation is to
*da0073e9SAndroid Build Coastguard Worker#     serialize the *state_dict* of a model, not the model itself
*da0073e9SAndroid Build Coastguard Worker#     (since this is more stable to code changes affecting the model
*da0073e9SAndroid Build Coastguard Worker#     serialization), and the state dict saves "data" only, thus
*da0073e9SAndroid Build Coastguard Worker#     stripping the backward hooks.  In some cases, hooks are
*da0073e9SAndroid Build Coastguard Worker#     essential to the well-functioning of a model (e.g., DDP),
*da0073e9SAndroid Build Coastguard Worker#     but DDP already manages readding the hooks!
*da0073e9SAndroid Build Coastguard Worker#
*da0073e9SAndroid Build Coastguard Worker#   - We didn't serialize them in many cases.  Prior to #10220, we
*da0073e9SAndroid Build Coastguard Worker#     were dropping backward hooks in ForkingPickler.  We "fixed" this
*da0073e9SAndroid Build Coastguard Worker#     to be convenient with other serialization sites, but lack of
*da0073e9SAndroid Build Coastguard Worker#     serializing backward hooks wasn't actually the root cause of
*da0073e9SAndroid Build Coastguard Worker#     the bug.
*da0073e9SAndroid Build Coastguard Worker#
*da0073e9SAndroid Build Coastguard Worker# With these cases in mind, we have decided that a better strategy
*da0073e9SAndroid Build Coastguard Worker# is to just NOT serialize hooks at all.
*da0073e9SAndroid Build Coastguard Worker#
*da0073e9SAndroid Build Coastguard Worker# Since this is a BC-breaking change, we should warn when we previously
*da0073e9SAndroid Build Coastguard Worker# serialized a hook, but no longer do so. This will be done by adding a special
*da0073e9SAndroid Build Coastguard Worker# sentinel property to hooks will be used to suppress this warning. If a hook
*da0073e9SAndroid Build Coastguard Worker# has the property _torch_serialize_ignore, we will not emit a warning if we
*da0073e9SAndroid Build Coastguard Worker# attempt to serialize a Tensor with this hook attached to it.
*da0073e9SAndroid Build Coastguard Worker#
*da0073e9SAndroid Build Coastguard Worker# By the way, when _backward_hooks is skipped, we must give an EMPTY
*da0073e9SAndroid Build Coastguard Worker# OrderedDict(), if you pass a None you'll run afoul #12219.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# TODO: Once we decide to break serialization FC, `storage` no longer needs to
*da0073e9SAndroid Build Coastguard Worker# be a TypedStorage
*da0073e9SAndroid Build Coastguard Workerdef _rebuild_tensor(storage, storage_offset, size, stride):
*da0073e9SAndroid Build Coastguard Worker    # first construct a tensor with the correct dtype/device
*da0073e9SAndroid Build Coastguard Worker    t = torch.empty((0,), dtype=storage.dtype, device=storage._untyped_storage.device)
*da0073e9SAndroid Build Coastguard Worker    return t.set_(storage._untyped_storage, storage_offset, size, stride)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef get_tensor_metadata(tensor):
*da0073e9SAndroid Build Coastguard Worker    # Tensor's Metadata for serializing.
*da0073e9SAndroid Build Coastguard Worker    # Currently, this only returns a dict[string, bool] specifing whether
*da0073e9SAndroid Build Coastguard Worker    # `conj` or `neg` bit is set.
*da0073e9SAndroid Build Coastguard Worker    assert isinstance(tensor, torch.Tensor)
*da0073e9SAndroid Build Coastguard Worker    return torch._C._get_tensor_metadata(tensor)  # type: ignore[attr-defined]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef set_tensor_metadata(tensor, metadata):
*da0073e9SAndroid Build Coastguard Worker    # See `get_tensor_metadata` above
*da0073e9SAndroid Build Coastguard Worker    assert isinstance(metadata, dict)
*da0073e9SAndroid Build Coastguard Worker    assert isinstance(tensor, torch.Tensor)
*da0073e9SAndroid Build Coastguard Worker    torch._C._set_tensor_metadata(tensor, metadata)  # type: ignore[attr-defined]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _rebuild_tensor_v2(
*da0073e9SAndroid Build Coastguard Worker    storage,
*da0073e9SAndroid Build Coastguard Worker    storage_offset,
*da0073e9SAndroid Build Coastguard Worker    size,
*da0073e9SAndroid Build Coastguard Worker    stride,
*da0073e9SAndroid Build Coastguard Worker    requires_grad,
*da0073e9SAndroid Build Coastguard Worker    backward_hooks,
*da0073e9SAndroid Build Coastguard Worker    metadata=None,
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    tensor = _rebuild_tensor(storage, storage_offset, size, stride)
*da0073e9SAndroid Build Coastguard Worker    tensor.requires_grad = requires_grad
*da0073e9SAndroid Build Coastguard Worker    if metadata:
*da0073e9SAndroid Build Coastguard Worker        set_tensor_metadata(tensor, metadata)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # NB: This line exists only for backwards compatibility; the
*da0073e9SAndroid Build Coastguard Worker    # general expectation is that backward_hooks is an empty
*da0073e9SAndroid Build Coastguard Worker    # OrderedDict.  See Note [Don't serialize hooks]
*da0073e9SAndroid Build Coastguard Worker    tensor._backward_hooks = backward_hooks
*da0073e9SAndroid Build Coastguard Worker    return tensor
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _rebuild_tensor_v3(
*da0073e9SAndroid Build Coastguard Worker    storage,
*da0073e9SAndroid Build Coastguard Worker    storage_offset,
*da0073e9SAndroid Build Coastguard Worker    size,
*da0073e9SAndroid Build Coastguard Worker    stride,
*da0073e9SAndroid Build Coastguard Worker    requires_grad,
*da0073e9SAndroid Build Coastguard Worker    backward_hooks,
*da0073e9SAndroid Build Coastguard Worker    dtype,
*da0073e9SAndroid Build Coastguard Worker    metadata=None,
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    t = torch.empty(
*da0073e9SAndroid Build Coastguard Worker        (0,),
*da0073e9SAndroid Build Coastguard Worker        dtype=dtype,
*da0073e9SAndroid Build Coastguard Worker        device=storage._untyped_storage.device,
*da0073e9SAndroid Build Coastguard Worker        requires_grad=requires_grad,
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    t.set_(storage._untyped_storage, storage_offset, size, stride)
*da0073e9SAndroid Build Coastguard Worker    if metadata:
*da0073e9SAndroid Build Coastguard Worker        set_tensor_metadata(t, metadata)
*da0073e9SAndroid Build Coastguard Worker    t._backward_hooks = backward_hooks
*da0073e9SAndroid Build Coastguard Worker    return t
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker_sparse_tensors_to_validate: List["torch.Tensor"] = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# In _legacy_load() in serialization.py we unpickle storages after the sparse
*da0073e9SAndroid Build Coastguard Worker# tensors have been already unpickled. Those storages contain data necessary for
*da0073e9SAndroid Build Coastguard Worker# validating sparse tensors: indices and values. That's why sparse tensors are
*da0073e9SAndroid Build Coastguard Worker# first unpickled without any validation, and then this function is called just
*da0073e9SAndroid Build Coastguard Worker# before _legacy_load() returns, so that all the sparse tensors can be validated
*da0073e9SAndroid Build Coastguard Worker# in bulk.
*da0073e9SAndroid Build Coastguard Worker#
*da0073e9SAndroid Build Coastguard Worker# The same procedure must be followed by _load() in serialization.py because due
*da0073e9SAndroid Build Coastguard Worker# to Pickler semantics, we have to use the same (non-validating) function for
*da0073e9SAndroid Build Coastguard Worker# unpickling sparse tensors, regardless of the caller.
*da0073e9SAndroid Build Coastguard Workerdef _validate_loaded_sparse_tensors():
*da0073e9SAndroid Build Coastguard Worker    try:
*da0073e9SAndroid Build Coastguard Worker        for t in _sparse_tensors_to_validate:
*da0073e9SAndroid Build Coastguard Worker            if t.layout is torch.sparse_coo:
*da0073e9SAndroid Build Coastguard Worker                torch._validate_sparse_coo_tensor_args(
*da0073e9SAndroid Build Coastguard Worker                    t._indices(), t._values(), t.size(), t.is_coalesced()
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            elif t.layout in {
*da0073e9SAndroid Build Coastguard Worker                torch.sparse_csr,
*da0073e9SAndroid Build Coastguard Worker                torch.sparse_csc,
*da0073e9SAndroid Build Coastguard Worker                torch.sparse_bsr,
*da0073e9SAndroid Build Coastguard Worker                torch.sparse_bsc,
*da0073e9SAndroid Build Coastguard Worker            }:
*da0073e9SAndroid Build Coastguard Worker                # TODO: Validation currently involves an expensive traversal
*da0073e9SAndroid Build Coastguard Worker                # on CPU, which may include a device transfer.
*da0073e9SAndroid Build Coastguard Worker                if t.layout in {torch.sparse_csr, torch.sparse_bsr}:
*da0073e9SAndroid Build Coastguard Worker                    compressed_indices, plain_indices = (
*da0073e9SAndroid Build Coastguard Worker                        t.crow_indices(),
*da0073e9SAndroid Build Coastguard Worker                        t.col_indices(),
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    compressed_indices, plain_indices = (
*da0073e9SAndroid Build Coastguard Worker                        t.ccol_indices(),
*da0073e9SAndroid Build Coastguard Worker                        t.row_indices(),
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                torch._validate_sparse_compressed_tensor_args(
*da0073e9SAndroid Build Coastguard Worker                    compressed_indices, plain_indices, t.values(), t.size(), t.layout
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                raise NotImplementedError(
*da0073e9SAndroid Build Coastguard Worker                    f"_validate_loaded_sparse_tensors for layout `{t.layout}`"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    finally:
*da0073e9SAndroid Build Coastguard Worker        _sparse_tensors_to_validate.clear()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _rebuild_sparse_tensor(layout, data):
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    Rebuilds a sparse tensor from its sparse storage representation.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        layout (str): The sparse storage layout of the tensor.
*da0073e9SAndroid Build Coastguard Worker        data (tuple): The tensor's sparse storage representation.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    if layout == torch.sparse_coo:
*da0073e9SAndroid Build Coastguard Worker        if len(data) == 3:
*da0073e9SAndroid Build Coastguard Worker            # For BC:
*da0073e9SAndroid Build Coastguard Worker            indices, values, size = data
*da0073e9SAndroid Build Coastguard Worker            is_coalesced = None
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            indices, values, size, is_coalesced = data
*da0073e9SAndroid Build Coastguard Worker        result = torch.sparse_coo_tensor(
*da0073e9SAndroid Build Coastguard Worker            indices, values, size, check_invariants=False, is_coalesced=is_coalesced
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        _sparse_tensors_to_validate.append(result)
*da0073e9SAndroid Build Coastguard Worker        return result
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    elif layout in {
*da0073e9SAndroid Build Coastguard Worker        torch.sparse_csr,
*da0073e9SAndroid Build Coastguard Worker        torch.sparse_csc,
*da0073e9SAndroid Build Coastguard Worker        torch.sparse_bsr,
*da0073e9SAndroid Build Coastguard Worker        torch.sparse_bsc,
*da0073e9SAndroid Build Coastguard Worker    }:
*da0073e9SAndroid Build Coastguard Worker        compressed_indices, plain_indices, values, size = data
*da0073e9SAndroid Build Coastguard Worker        result = torch.sparse_compressed_tensor(
*da0073e9SAndroid Build Coastguard Worker            compressed_indices,
*da0073e9SAndroid Build Coastguard Worker            plain_indices,
*da0073e9SAndroid Build Coastguard Worker            values,
*da0073e9SAndroid Build Coastguard Worker            size,
*da0073e9SAndroid Build Coastguard Worker            layout=layout,
*da0073e9SAndroid Build Coastguard Worker            check_invariants=False,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        _sparse_tensors_to_validate.append(result)
*da0073e9SAndroid Build Coastguard Worker        return result
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    raise NotImplementedError(f"rebuilding sparse tensor for layout {layout}")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _rebuild_nested_tensor(buffer, sizes, strides, storage_offsets):
*da0073e9SAndroid Build Coastguard Worker    return torch._nested_view_from_buffer(buffer, sizes, strides, storage_offsets)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _rebuild_device_tensor_from_numpy(data, dtype, device, requires_grad):
*da0073e9SAndroid Build Coastguard Worker    device = _get_restore_location(device)
*da0073e9SAndroid Build Coastguard Worker    tensor = torch.from_numpy(data).to(dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker    tensor.requires_grad = requires_grad
*da0073e9SAndroid Build Coastguard Worker    return tensor
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# Should not be used, only here to be able to load Tensors serialized with older versions of pytorch
*da0073e9SAndroid Build Coastguard Worker_rebuild_xla_tensor = _rebuild_device_tensor_from_numpy
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _rebuild_meta_tensor_no_storage(dtype, size, stride, requires_grad):
*da0073e9SAndroid Build Coastguard Worker    return torch.empty_strided(
*da0073e9SAndroid Build Coastguard Worker        size, stride, dtype=dtype, device="meta", requires_grad=requires_grad
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _rebuild_wrapper_subclass(
*da0073e9SAndroid Build Coastguard Worker    cls,
*da0073e9SAndroid Build Coastguard Worker    dtype,
*da0073e9SAndroid Build Coastguard Worker    size,
*da0073e9SAndroid Build Coastguard Worker    stride,
*da0073e9SAndroid Build Coastguard Worker    storage_offset,
*da0073e9SAndroid Build Coastguard Worker    layout,
*da0073e9SAndroid Build Coastguard Worker    device,
*da0073e9SAndroid Build Coastguard Worker    requires_grad,
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    device = _get_restore_location(device)
*da0073e9SAndroid Build Coastguard Worker    return torch.Tensor._make_wrapper_subclass(  # type: ignore[attr-defined]
*da0073e9SAndroid Build Coastguard Worker        cls,
*da0073e9SAndroid Build Coastguard Worker        size,
*da0073e9SAndroid Build Coastguard Worker        strides=stride,
*da0073e9SAndroid Build Coastguard Worker        dtype=dtype,
*da0073e9SAndroid Build Coastguard Worker        storage_offset=storage_offset,
*da0073e9SAndroid Build Coastguard Worker        layout=layout,
*da0073e9SAndroid Build Coastguard Worker        device=device,
*da0073e9SAndroid Build Coastguard Worker        requires_grad=requires_grad,
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# TODO: Once we decide to break serialization FC, `storage` no longer needs to
*da0073e9SAndroid Build Coastguard Worker# be a TypedStorage
*da0073e9SAndroid Build Coastguard Workerdef _rebuild_qtensor(
*da0073e9SAndroid Build Coastguard Worker    storage,
*da0073e9SAndroid Build Coastguard Worker    storage_offset,
*da0073e9SAndroid Build Coastguard Worker    size,
*da0073e9SAndroid Build Coastguard Worker    stride,
*da0073e9SAndroid Build Coastguard Worker    quantizer_params,
*da0073e9SAndroid Build Coastguard Worker    requires_grad,
*da0073e9SAndroid Build Coastguard Worker    backward_hooks,
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    qscheme = quantizer_params[0]
*da0073e9SAndroid Build Coastguard Worker    if qscheme == torch.per_tensor_affine:
*da0073e9SAndroid Build Coastguard Worker        _, scale, zero_point = quantizer_params
*da0073e9SAndroid Build Coastguard Worker        tensor = torch._empty_affine_quantized(
*da0073e9SAndroid Build Coastguard Worker            size,
*da0073e9SAndroid Build Coastguard Worker            scale=scale,
*da0073e9SAndroid Build Coastguard Worker            zero_point=zero_point,
*da0073e9SAndroid Build Coastguard Worker            dtype=storage.dtype,
*da0073e9SAndroid Build Coastguard Worker            device=storage.device,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    elif qscheme in (torch.per_channel_affine, torch.per_channel_affine_float_qparams):
*da0073e9SAndroid Build Coastguard Worker        _, scales, zero_points, axis = quantizer_params
*da0073e9SAndroid Build Coastguard Worker        if type(scales) is list and type(zero_points) is list:
*da0073e9SAndroid Build Coastguard Worker            if qscheme == torch.per_channel_affine:
*da0073e9SAndroid Build Coastguard Worker                scales = torch.tensor(scales, dtype=torch.double, device=storage.device)
*da0073e9SAndroid Build Coastguard Worker                zero_points = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                    zero_points, dtype=torch.long, device=storage.device
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                scales = torch.tensor(scales, dtype=torch.float, device=storage.device)
*da0073e9SAndroid Build Coastguard Worker                zero_points = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                    zero_points, dtype=torch.float, device=storage.device
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker        tensor = torch._empty_per_channel_affine_quantized(
*da0073e9SAndroid Build Coastguard Worker            size,
*da0073e9SAndroid Build Coastguard Worker            scales=scales,
*da0073e9SAndroid Build Coastguard Worker            zero_points=zero_points,
*da0073e9SAndroid Build Coastguard Worker            axis=axis,
*da0073e9SAndroid Build Coastguard Worker            dtype=storage.dtype,
*da0073e9SAndroid Build Coastguard Worker            device=storage.device,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        raise RuntimeError(f"Can't deserialize quantized tensor with qscheme {qscheme}")
*da0073e9SAndroid Build Coastguard Worker    tensor.set_(storage, storage_offset, size, stride)
*da0073e9SAndroid Build Coastguard Worker    tensor.requires_grad = requires_grad
*da0073e9SAndroid Build Coastguard Worker    # NB: This line exists only for backwards compatibility; the
*da0073e9SAndroid Build Coastguard Worker    # general expectation is that backward_hooks is an empty
*da0073e9SAndroid Build Coastguard Worker    # OrderedDict.  See Note [Don't serialize hooks]
*da0073e9SAndroid Build Coastguard Worker    tensor._backward_hooks = backward_hooks
*da0073e9SAndroid Build Coastguard Worker    return tensor
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _rebuild_parameter(data, requires_grad, backward_hooks):
*da0073e9SAndroid Build Coastguard Worker    param = torch.nn.Parameter(data, requires_grad)
*da0073e9SAndroid Build Coastguard Worker    # NB: This line exists only for backwards compatibility; the
*da0073e9SAndroid Build Coastguard Worker    # general expectation is that backward_hooks is an empty
*da0073e9SAndroid Build Coastguard Worker    # OrderedDict.  See Note [Don't serialize hooks]
*da0073e9SAndroid Build Coastguard Worker    param._backward_hooks = backward_hooks
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return param
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _rebuild_parameter_with_state(data, requires_grad, backward_hooks, state):
*da0073e9SAndroid Build Coastguard Worker    param = torch.nn.Parameter(data, requires_grad)
*da0073e9SAndroid Build Coastguard Worker    # NB: This line exists only for backwards compatibility; the
*da0073e9SAndroid Build Coastguard Worker    # general expectation is that backward_hooks is an empty
*da0073e9SAndroid Build Coastguard Worker    # OrderedDict.  See Note [Don't serialize hooks]
*da0073e9SAndroid Build Coastguard Worker    param._backward_hooks = backward_hooks
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Restore state on Parameter like python attr.
*da0073e9SAndroid Build Coastguard Worker    param = _set_obj_state(param, state)
*da0073e9SAndroid Build Coastguard Worker    return param
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _get_obj_state(obj):
*da0073e9SAndroid Build Coastguard Worker    # Get the state of the python subclass
*da0073e9SAndroid Build Coastguard Worker    # This loosely mimicks the function on the object class but since Tensor do not inherit
*da0073e9SAndroid Build Coastguard Worker    # from it, we cannot call that function directly
*da0073e9SAndroid Build Coastguard Worker    # https://github.com/python/cpython/blob/c83919bd635f4433f1c6ae8504996a9fe3c215e5/Objects/typeobject.c#L4891
*da0073e9SAndroid Build Coastguard Worker    # Note that starting with Python 3.11, this `__getstate__` is always defined and thus
*da0073e9SAndroid Build Coastguard Worker    # the else branch will never be taken.
*da0073e9SAndroid Build Coastguard Worker    getstate_fn = getattr(obj, "__getstate__", None)
*da0073e9SAndroid Build Coastguard Worker    if getstate_fn:
*da0073e9SAndroid Build Coastguard Worker        state = getstate_fn()
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        slots_to_save = copyreg._slotnames(obj.__class__)  # type: ignore[attr-defined]
*da0073e9SAndroid Build Coastguard Worker        if slots_to_save:
*da0073e9SAndroid Build Coastguard Worker            state = (
*da0073e9SAndroid Build Coastguard Worker                obj.__dict__,
*da0073e9SAndroid Build Coastguard Worker                {
*da0073e9SAndroid Build Coastguard Worker                    name: getattr(obj, name)
*da0073e9SAndroid Build Coastguard Worker                    for name in slots_to_save
*da0073e9SAndroid Build Coastguard Worker                    if hasattr(obj, name)
*da0073e9SAndroid Build Coastguard Worker                },
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            state = obj.__dict__
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return state
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _set_obj_state(obj, state):
*da0073e9SAndroid Build Coastguard Worker    if isinstance(state, tuple):
*da0073e9SAndroid Build Coastguard Worker        if not len(state) == 2:
*da0073e9SAndroid Build Coastguard Worker            raise RuntimeError(f"Invalid serialized state: {state}")
*da0073e9SAndroid Build Coastguard Worker        dict_state = state[0]
*da0073e9SAndroid Build Coastguard Worker        slots_state = state[1]
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        dict_state = state
*da0073e9SAndroid Build Coastguard Worker        slots_state = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Starting with Python 3.11, the __dict__ attribute is lazily created
*da0073e9SAndroid Build Coastguard Worker    # and is serialized as None when not needed.
*da0073e9SAndroid Build Coastguard Worker    if dict_state:
*da0073e9SAndroid Build Coastguard Worker        for k, v in dict_state.items():
*da0073e9SAndroid Build Coastguard Worker            setattr(obj, k, v)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    if slots_state:
*da0073e9SAndroid Build Coastguard Worker        for k, v in slots_state.items():
*da0073e9SAndroid Build Coastguard Worker            setattr(obj, k, v)
*da0073e9SAndroid Build Coastguard Worker    return obj
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _import_dotted_name(name):
*da0073e9SAndroid Build Coastguard Worker    components = name.split(".")
*da0073e9SAndroid Build Coastguard Worker    obj = __import__(components[0])
*da0073e9SAndroid Build Coastguard Worker    for component in components[1:]:
*da0073e9SAndroid Build Coastguard Worker        obj = getattr(obj, component)
*da0073e9SAndroid Build Coastguard Worker    return obj
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _flatten_dense_tensors(tensors):
*da0073e9SAndroid Build Coastguard Worker    """Flatten dense tensors into a contiguous 1D buffer. Assume tensors are of
*da0073e9SAndroid Build Coastguard Worker    same dense type.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Since inputs are dense, the resulting tensor will be a concatenated 1D
*da0073e9SAndroid Build Coastguard Worker    buffer. Element-wise operation on this buffer will be equivalent to
*da0073e9SAndroid Build Coastguard Worker    operating individually.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        tensors (Iterable[Tensor]): dense tensors to flatten.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Returns:
*da0073e9SAndroid Build Coastguard Worker        A contiguous 1D buffer containing input tensors.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    return torch._C._nn.flatten_dense_tensors(tensors)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _flatten_sparse_tensors(tensors):
*da0073e9SAndroid Build Coastguard Worker    """Flatten sparse tensors into two contiguous 1D buffers, one of indices and
*da0073e9SAndroid Build Coastguard Worker    one of values. Assume tensors are of same sparse type.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        tensors (Iterable[Tensor]): sparse tensors to flatten.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Returns:
*da0073e9SAndroid Build Coastguard Worker        A tuple of two contiguous 1D buffers, one containing input tensors'
*da0073e9SAndroid Build Coastguard Worker        indices and the other containing the values.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    flat_indices = torch._C._nn.flatten_dense_tensors(
*da0073e9SAndroid Build Coastguard Worker        [torch.Tensor._indices(t) for t in tensors]
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    flat_values = torch._C._nn.flatten_dense_tensors(
*da0073e9SAndroid Build Coastguard Worker        [torch.Tensor._values(t) for t in tensors]
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    return flat_indices, flat_values
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _unflatten_dense_tensors(flat, tensors):
*da0073e9SAndroid Build Coastguard Worker    """View a flat buffer using the sizes of tensors. Assume that tensors are of
*da0073e9SAndroid Build Coastguard Worker    same dense type, and that flat is given by _flatten_dense_tensors.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        flat (Tensor): flattened dense tensors to unflatten.
*da0073e9SAndroid Build Coastguard Worker        tensors (Iterable[Tensor]): dense tensors whose sizes will be used to
*da0073e9SAndroid Build Coastguard Worker          unflatten flat.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Returns:
*da0073e9SAndroid Build Coastguard Worker        Unflattened dense tensors with sizes same as tensors and values from
*da0073e9SAndroid Build Coastguard Worker        flat.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    return torch._C._nn.unflatten_dense_tensors(flat, tensors)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _unflatten_sparse_tensors(flat, tensors):
*da0073e9SAndroid Build Coastguard Worker    """View flat buffer (containing indices and values) using the sizes of
*da0073e9SAndroid Build Coastguard Worker    tensors. Assume that tensors are of same sparse type, and that flat is given
*da0073e9SAndroid Build Coastguard Worker    by _flatten_sparse_tensors.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        flat (tuple(Tensor, Tensor)): flattened indices and values of sparse
*da0073e9SAndroid Build Coastguard Worker          tensors to unflatten.
*da0073e9SAndroid Build Coastguard Worker        tensors (Iterable[Tensor]): sparse tensors whose sizes will be used to
*da0073e9SAndroid Build Coastguard Worker          unflatten flat.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Returns:
*da0073e9SAndroid Build Coastguard Worker        Unflattened sparse tensors with sizes same as tensors and values from
*da0073e9SAndroid Build Coastguard Worker        flat.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    flat_indices, flat_values = flat
*da0073e9SAndroid Build Coastguard Worker    indices = torch._C._nn.unflatten_dense_tensors(
*da0073e9SAndroid Build Coastguard Worker        flat_indices, [torch.Tensor._indices(t) for t in tensors]
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    values = torch._C._nn.unflatten_dense_tensors(
*da0073e9SAndroid Build Coastguard Worker        flat_values, [torch.Tensor._values(t) for t in tensors]
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    outputs = []
*da0073e9SAndroid Build Coastguard Worker    for t, i, v in zip(tensors, indices, values):
*da0073e9SAndroid Build Coastguard Worker        outputs.append(t.new(i, v, t.size()))
*da0073e9SAndroid Build Coastguard Worker    return tuple(outputs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _reorder_tensors_as(tensors, ordered_tensors):
*da0073e9SAndroid Build Coastguard Worker    """Assume that tensors are of same order as ordered_tensors within their
*da0073e9SAndroid Build Coastguard Worker    types, e.g., from _take_tensors. Reorder them to be of same order as
*da0073e9SAndroid Build Coastguard Worker    ordered_tensors.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        tensors (Iterable[Tensor]): tensors to be reordered. They should be of
*da0073e9SAndroid Build Coastguard Worker          the same order as ordered_tensors within their own types.
*da0073e9SAndroid Build Coastguard Worker        ordered_tensors (Iterable[Tensor]): tensors whose order will be the
*da0073e9SAndroid Build Coastguard Worker          reference.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Returns:
*da0073e9SAndroid Build Coastguard Worker        Ordered tuple of tensors with contents from tensors and order of
*da0073e9SAndroid Build Coastguard Worker        ordered_tensors.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    type_dict = defaultdict(list)
*da0073e9SAndroid Build Coastguard Worker    for tensor in tensors:
*da0073e9SAndroid Build Coastguard Worker        type_dict[tensor.type()].append(tensor)
*da0073e9SAndroid Build Coastguard Worker    type_dict_ = {t: iter(coll) for t, coll in type_dict.items()}
*da0073e9SAndroid Build Coastguard Worker    return tuple(next(type_dict_[tensor.type()]) for tensor in ordered_tensors)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _take_tensors(tensors, size_limit):
*da0073e9SAndroid Build Coastguard Worker    """Group tensors into chunks. This generator yields a chunk at each time,
*da0073e9SAndroid Build Coastguard Worker    each containing tensors of same type up to certain byte limit in total size.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        tensors (Sequence): A sequence of tensors to be separated into chunks.
*da0073e9SAndroid Build Coastguard Worker        size_limit (int): The limit of each chunk in bytes.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Yields:
*da0073e9SAndroid Build Coastguard Worker        Blocks of tensors of same type and within size_limit. The yielded
*da0073e9SAndroid Build Coastguard Worker        tensors are only ordered as the original sequence within its types.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    buf_dict: DefaultDict[str, List] = defaultdict(lambda: [[], 0])
*da0073e9SAndroid Build Coastguard Worker    for tensor in tensors:
*da0073e9SAndroid Build Coastguard Worker        t = tensor.type()
*da0073e9SAndroid Build Coastguard Worker        if tensor.is_sparse:
*da0073e9SAndroid Build Coastguard Worker            indices = torch.Tensor._indices(tensor)
*da0073e9SAndroid Build Coastguard Worker            values = torch.Tensor._values(tensor)
*da0073e9SAndroid Build Coastguard Worker            size = (
*da0073e9SAndroid Build Coastguard Worker                indices.numel() * indices.element_size()
*da0073e9SAndroid Build Coastguard Worker                + values.numel() * values.element_size()
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            size = tensor.numel() * tensor.element_size()
*da0073e9SAndroid Build Coastguard Worker        buf_and_size = buf_dict[t]
*da0073e9SAndroid Build Coastguard Worker        if buf_and_size[1] + size > size_limit and buf_and_size[1] > 0:
*da0073e9SAndroid Build Coastguard Worker            yield buf_and_size[0]
*da0073e9SAndroid Build Coastguard Worker            buf_and_size = buf_dict[t] = [[], 0]
*da0073e9SAndroid Build Coastguard Worker        buf_and_size[0].append(tensor)
*da0073e9SAndroid Build Coastguard Worker        buf_and_size[1] += size
*da0073e9SAndroid Build Coastguard Worker    for buf, _ in buf_dict.values():
*da0073e9SAndroid Build Coastguard Worker        if len(buf) > 0:
*da0073e9SAndroid Build Coastguard Worker            yield buf
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# annotation decorator to get annotations in a way that is compatible
*da0073e9SAndroid Build Coastguard Worker# with both Python 2 and 3
*da0073e9SAndroid Build Coastguard Workerdef annotate(ret, **kwargs):
*da0073e9SAndroid Build Coastguard Worker    def dec(fun):
*da0073e9SAndroid Build Coastguard Worker        fun.__annotations__ = dict(kwargs)
*da0073e9SAndroid Build Coastguard Worker        fun.__annotations__["return"] = ret
*da0073e9SAndroid Build Coastguard Worker        return fun
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return dec
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef render_call(fn, args, kwargs):
*da0073e9SAndroid Build Coastguard Worker    str_fn = torch.overrides.resolve_name(fn)
*da0073e9SAndroid Build Coastguard Worker    if str_fn is None:
*da0073e9SAndroid Build Coastguard Worker        str_fn = str(fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    str_args: List[str] = []
*da0073e9SAndroid Build Coastguard Worker    with torch._tensor_str.printoptions(threshold=0, edgeitems=0):
*da0073e9SAndroid Build Coastguard Worker        str_args.extend(repr(a) for a in args)
*da0073e9SAndroid Build Coastguard Worker        str_args.extend(f"{k}={repr(v)}" for k, v in kwargs.items())
*da0073e9SAndroid Build Coastguard Worker        r = f"{str_fn}({', '.join(str_args)})"
*da0073e9SAndroid Build Coastguard Worker    return r
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# NOTE [ Python Traceback Reference Cycle Problem ]
*da0073e9SAndroid Build Coastguard Worker#
*da0073e9SAndroid Build Coastguard Worker# When using sys.exc_info(), it is important to **not** store the exc_info[2],
*da0073e9SAndroid Build Coastguard Worker# which is the traceback, because otherwise you will run into the traceback
*da0073e9SAndroid Build Coastguard Worker# reference cycle problem, i.e., the traceback holding reference to the frame,
*da0073e9SAndroid Build Coastguard Worker# and the frame (which holds reference to all the object in its temporary scope)
*da0073e9SAndroid Build Coastguard Worker# holding reference the traceback.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass KeyErrorMessage(str):
*da0073e9SAndroid Build Coastguard Worker    r"""str subclass that returns itself in repr"""
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def __repr__(self):
*da0073e9SAndroid Build Coastguard Worker        return self
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass ExceptionWrapper:
*da0073e9SAndroid Build Coastguard Worker    r"""Wraps an exception plus traceback to communicate across threads"""
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def __init__(self, exc_info=None, where="in background"):
*da0073e9SAndroid Build Coastguard Worker        # It is important that we don't store exc_info, see
*da0073e9SAndroid Build Coastguard Worker        # NOTE [ Python Traceback Reference Cycle Problem ]
*da0073e9SAndroid Build Coastguard Worker        if exc_info is None:
*da0073e9SAndroid Build Coastguard Worker            exc_info = sys.exc_info()
*da0073e9SAndroid Build Coastguard Worker        self.exc_type = exc_info[0]
*da0073e9SAndroid Build Coastguard Worker        self.exc_msg = "".join(traceback.format_exception(*exc_info))
*da0073e9SAndroid Build Coastguard Worker        self.where = where
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def reraise(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Reraises the wrapped exception in the current thread"""
*da0073e9SAndroid Build Coastguard Worker        # Format a message such as: "Caught ValueError in DataLoader worker
*da0073e9SAndroid Build Coastguard Worker        # process 2. Original Traceback:", followed by the traceback.
*da0073e9SAndroid Build Coastguard Worker        msg = f"Caught {self.exc_type.__name__} {self.where}.\nOriginal {self.exc_msg}"
*da0073e9SAndroid Build Coastguard Worker        if self.exc_type == KeyError:
*da0073e9SAndroid Build Coastguard Worker            # KeyError calls repr() on its argument (usually a dict key). This
*da0073e9SAndroid Build Coastguard Worker            # makes stack traces unreadable. It will not be changed in Python
*da0073e9SAndroid Build Coastguard Worker            # (https://bugs.python.org/issue2651), so we work around it.
*da0073e9SAndroid Build Coastguard Worker            msg = KeyErrorMessage(msg)
*da0073e9SAndroid Build Coastguard Worker        elif getattr(self.exc_type, "message", None):
*da0073e9SAndroid Build Coastguard Worker            # Some exceptions have first argument as non-str but explicitly
*da0073e9SAndroid Build Coastguard Worker            # have message field
*da0073e9SAndroid Build Coastguard Worker            raise self.exc_type(message=msg)
*da0073e9SAndroid Build Coastguard Worker        try:
*da0073e9SAndroid Build Coastguard Worker            exception = self.exc_type(msg)
*da0073e9SAndroid Build Coastguard Worker        except TypeError:
*da0073e9SAndroid Build Coastguard Worker            # If the exception takes multiple arguments, don't try to
*da0073e9SAndroid Build Coastguard Worker            # instantiate since we don't know how to
*da0073e9SAndroid Build Coastguard Worker            raise RuntimeError(msg) from None
*da0073e9SAndroid Build Coastguard Worker        raise exception
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _get_available_device_type():
*da0073e9SAndroid Build Coastguard Worker    if torch.cuda.is_available():
*da0073e9SAndroid Build Coastguard Worker        return "cuda"
*da0073e9SAndroid Build Coastguard Worker    if hasattr(torch, "xpu") and torch.xpu.is_available():  # type: ignore[attr-defined]
*da0073e9SAndroid Build Coastguard Worker        return "xpu"
*da0073e9SAndroid Build Coastguard Worker    if hasattr(torch, "mtia") and torch.mtia.is_available():
*da0073e9SAndroid Build Coastguard Worker        return "mtia"
*da0073e9SAndroid Build Coastguard Worker    custom_backend_name = torch._C._get_privateuse1_backend_name()
*da0073e9SAndroid Build Coastguard Worker    custom_device_mod = getattr(torch, custom_backend_name, None)
*da0073e9SAndroid Build Coastguard Worker    if custom_device_mod and custom_device_mod.is_available():
*da0073e9SAndroid Build Coastguard Worker        return custom_backend_name
*da0073e9SAndroid Build Coastguard Worker    # add more available device types here
*da0073e9SAndroid Build Coastguard Worker    return None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _get_device_attr(get_member):
*da0073e9SAndroid Build Coastguard Worker    device_type = _get_available_device_type()
*da0073e9SAndroid Build Coastguard Worker    if device_type and device_type.lower() == "cuda":
*da0073e9SAndroid Build Coastguard Worker        return get_member(torch.cuda)
*da0073e9SAndroid Build Coastguard Worker    if device_type and device_type.lower() == "xpu":
*da0073e9SAndroid Build Coastguard Worker        return get_member(torch.xpu)  # type: ignore[attr-defined]
*da0073e9SAndroid Build Coastguard Worker    if device_type and device_type.lower() == "mtia":
*da0073e9SAndroid Build Coastguard Worker        return get_member(torch.mtia)
*da0073e9SAndroid Build Coastguard Worker    if device_type == torch._C._get_privateuse1_backend_name():
*da0073e9SAndroid Build Coastguard Worker        return get_member(getattr(torch, device_type))
*da0073e9SAndroid Build Coastguard Worker    # add more available device types here
*da0073e9SAndroid Build Coastguard Worker    return None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _get_current_device_index():
*da0073e9SAndroid Build Coastguard Worker    # current device index
*da0073e9SAndroid Build Coastguard Worker    return _get_device_attr(lambda m: m.current_device())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _get_all_device_indices():
*da0073e9SAndroid Build Coastguard Worker    # all device index
*da0073e9SAndroid Build Coastguard Worker    return _get_device_attr(lambda m: list(range(m.device_count())))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _get_devices_properties(device_ids):
*da0073e9SAndroid Build Coastguard Worker    # all device properties
*da0073e9SAndroid Build Coastguard Worker    return [_get_device_attr(lambda m: m.get_device_properties(i)) for i in device_ids]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef get_current_device_index() -> int:
*da0073e9SAndroid Build Coastguard Worker    r"""Checks if there are CUDA devices available and
*da0073e9SAndroid Build Coastguard Worker    returns the device index of the current default CUDA device.
*da0073e9SAndroid Build Coastguard Worker    Returns -1 in case there are no CUDA devices available.
*da0073e9SAndroid Build Coastguard Worker    Arguments: ``None``
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    if torch.cuda.device_count() > 0:
*da0073e9SAndroid Build Coastguard Worker        return torch.cuda.current_device()
*da0073e9SAndroid Build Coastguard Worker    return -1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _get_device_index(
*da0073e9SAndroid Build Coastguard Worker    device: Any,
*da0073e9SAndroid Build Coastguard Worker    optional: bool = False,
*da0073e9SAndroid Build Coastguard Worker    allow_cpu: bool = False,
*da0073e9SAndroid Build Coastguard Worker) -> int:
*da0073e9SAndroid Build Coastguard Worker    r"""Gets the device index from :attr:`device`, which can be a torch.device
*da0073e9SAndroid Build Coastguard Worker    object, a Python integer, or ``None``.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    If :attr:`device` is a torch.device object, returns the device index if it
*da0073e9SAndroid Build Coastguard Worker    has index. Note that for a device without a specified index,
*da0073e9SAndroid Build Coastguard Worker    i.e., ``torch.device('xxx')``, this will return the current default
*da0073e9SAndroid Build Coastguard Worker    device of that type if :attr:`optional` is ``True``. If :attr:`allow_cpu` is ``True``,
*da0073e9SAndroid Build Coastguard Worker    CPU devices will be accepted and ``-1`` will be returned in this case.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    If :attr:`device` is a Python integer, it is returned as is.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    If :attr:`device` is ``None``, this will return the current default
*da0073e9SAndroid Build Coastguard Worker    device of the supported runtime platform if :attr:`optional` is ``True``.
*da0073e9SAndroid Build Coastguard Worker    i.e., the current default CUDA device will be returned if CUDA runtime is supported.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    if isinstance(device, str):
*da0073e9SAndroid Build Coastguard Worker        device = torch.device(device)
*da0073e9SAndroid Build Coastguard Worker    device_idx: Optional[int] = None
*da0073e9SAndroid Build Coastguard Worker    if isinstance(device, torch.device):
*da0073e9SAndroid Build Coastguard Worker        if not allow_cpu and device.type == "cpu":
*da0073e9SAndroid Build Coastguard Worker            raise ValueError(f"Expected a non cpu device, but got: {device}")
*da0073e9SAndroid Build Coastguard Worker        device_idx = -1 if device.type == "cpu" else device.index
*da0073e9SAndroid Build Coastguard Worker    if isinstance(device, int):
*da0073e9SAndroid Build Coastguard Worker        device_idx = device
*da0073e9SAndroid Build Coastguard Worker    if device_idx is None:
*da0073e9SAndroid Build Coastguard Worker        if optional:
*da0073e9SAndroid Build Coastguard Worker            # The eager API _get_current_device_index uses `lambda` functions which are
*da0073e9SAndroid Build Coastguard Worker            # not supported in JIT and hence not scriptable. The JIT equivalent API to get
*da0073e9SAndroid Build Coastguard Worker            # the current device index is `get_current_device_index()` which can
*da0073e9SAndroid Build Coastguard Worker            # be scripted. We use is_scripting to check the mode we are in and call the
*da0073e9SAndroid Build Coastguard Worker            # appropriate API.
*da0073e9SAndroid Build Coastguard Worker            if torch.jit.is_scripting():
*da0073e9SAndroid Build Coastguard Worker                device_idx = get_current_device_index()
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                device_idx = _get_current_device_index()
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            raise ValueError(
*da0073e9SAndroid Build Coastguard Worker                f"Expected a torch.device with a specified index or an integer, but got:{device}"
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker    return device_idx
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _handle_complex(tensor):
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    Returns a real view of a tensor if complex dtype else just the tensor
*da0073e9SAndroid Build Coastguard Worker    need to check if a UninitializedParameter because otherwise checking is_complex is an error for a LazyModule
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    return (
*da0073e9SAndroid Build Coastguard Worker        torch.view_as_real(tensor)
*da0073e9SAndroid Build Coastguard Worker        if not isinstance(tensor, torch.nn.UninitializedParameter)
*da0073e9SAndroid Build Coastguard Worker        and tensor.is_complex()
*da0073e9SAndroid Build Coastguard Worker        else tensor
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _element_size(dtype):
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    Returns the element size for a dtype, in bytes
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    if not isinstance(dtype, torch.dtype):
*da0073e9SAndroid Build Coastguard Worker        raise RuntimeError(f"expected torch.dtype, but got {type(dtype)}")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    if dtype.is_complex:
*da0073e9SAndroid Build Coastguard Worker        return torch.finfo(dtype).bits >> 2
*da0073e9SAndroid Build Coastguard Worker    elif dtype.is_floating_point:
*da0073e9SAndroid Build Coastguard Worker        return torch.finfo(dtype).bits >> 3
*da0073e9SAndroid Build Coastguard Worker    elif dtype == torch.bool:
*da0073e9SAndroid Build Coastguard Worker        # NOTE: torch.bool is not supported in torch.iinfo()
*da0073e9SAndroid Build Coastguard Worker        return 1
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        return torch.iinfo(dtype).bits >> 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass _ClassPropertyDescriptor:
*da0073e9SAndroid Build Coastguard Worker    def __init__(self, fget, fset=None):
*da0073e9SAndroid Build Coastguard Worker        self.fget = fget
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def __get__(self, instance, owner=None):
*da0073e9SAndroid Build Coastguard Worker        if owner is None:
*da0073e9SAndroid Build Coastguard Worker            owner = type(instance)
*da0073e9SAndroid Build Coastguard Worker        return self.fget.__get__(instance, owner)()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef classproperty(func):
*da0073e9SAndroid Build Coastguard Worker    if not isinstance(func, (classmethod, staticmethod)):
*da0073e9SAndroid Build Coastguard Worker        func = classmethod(func)
*da0073e9SAndroid Build Coastguard Worker    return _ClassPropertyDescriptor(func)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef is_compiling() -> bool:
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    Indicates whether we are tracing/compiling with torch.compile() or torch.export().
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    TODO(khabinov): we should deprecate this function and use torch.compiler.is_compiling().
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    return torch.compiler.is_compiling()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _functionalize_sync(t):
*da0073e9SAndroid Build Coastguard Worker    # This code lives in python instead of C++ since conditioning on a certain python subclass
*da0073e9SAndroid Build Coastguard Worker    # is much more of a pain in C++.
*da0073e9SAndroid Build Coastguard Worker    from torch._subclasses.functional_tensor import FunctionalTensor
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    if isinstance(t, FunctionalTensor):
*da0073e9SAndroid Build Coastguard Worker        # If a FunctionalTensorMode is active while syncing, we don't want it to intercept any ops that get called
*da0073e9SAndroid Build Coastguard Worker        # when we sync our inner tensor.
*da0073e9SAndroid Build Coastguard Worker        # Why?
*da0073e9SAndroid Build Coastguard Worker        # (1) If there are input mutations in the graph, then they will be re-applied during
*da0073e9SAndroid Build Coastguard Worker        #     AOTAutograd when we call _sync() from inside of our functionalization kernels.
*da0073e9SAndroid Build Coastguard Worker        # (2) _sync() causes us to regenerate our updated the tensor from the updated base,
*da0073e9SAndroid Build Coastguard Worker        #     which dispatches to a bunch of view ops
*da0073e9SAndroid Build Coastguard Worker        # (3) The input to these view ops is our inner FunctionalTensorWrapper
*da0073e9SAndroid Build Coastguard Worker        #     (since the sync was called from C++), not the python FunctionalTensor
*da0073e9SAndroid Build Coastguard Worker        # (4) if a python FunctionalTensorMode is active, it will complain when it intercepts
*da0073e9SAndroid Build Coastguard Worker        #     the view op, since it will see an input that is a C++ FunctionalTensorWrapper
*da0073e9SAndroid Build Coastguard Worker        #     (aka a normal torch.Tensor) instead of a python `FunctionalTensor).
*da0073e9SAndroid Build Coastguard Worker        maybe_functional_mode = torch._C._unset_dispatch_mode(
*da0073e9SAndroid Build Coastguard Worker            torch._C._TorchDispatchModeKey.FUNCTIONAL
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        try:
*da0073e9SAndroid Build Coastguard Worker            torch._functionalize_sync(t.elem)  # type: ignore[attr-defined]
*da0073e9SAndroid Build Coastguard Worker        finally:
*da0073e9SAndroid Build Coastguard Worker            if maybe_functional_mode is not None:
*da0073e9SAndroid Build Coastguard Worker                torch._C._set_dispatch_mode(maybe_functional_mode)
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        torch._functionalize_sync(t)  # type: ignore[attr-defined]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker@functools.lru_cache(2)
*da0073e9SAndroid Build Coastguard Workerdef _get_device_module(device_type: str):
*da0073e9SAndroid Build Coastguard Worker    device_module = getattr(torch, device_type, None)
*da0073e9SAndroid Build Coastguard Worker    if device_module is None:
*da0073e9SAndroid Build Coastguard Worker        raise RuntimeError(
*da0073e9SAndroid Build Coastguard Worker            f"Device '{device_type}' does not have a corresponding module registered as 'torch.{device_type}'."
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    return device_module
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _dummy_type(name: str) -> type:
*da0073e9SAndroid Build Coastguard Worker    def get_err_fn(is_init: bool):
*da0073e9SAndroid Build Coastguard Worker        def err_fn(obj, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker            if is_init:
*da0073e9SAndroid Build Coastguard Worker                class_name = obj.__class__.__name__
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                class_name = obj.__name__
*da0073e9SAndroid Build Coastguard Worker            raise RuntimeError(f"Tried to instantiate dummy base class {class_name}")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return err_fn
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return type(
*da0073e9SAndroid Build Coastguard Worker        name, (object,), {"__init__": get_err_fn(True), "__new__": get_err_fn(False)}
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass _LazySeedTracker:
*da0073e9SAndroid Build Coastguard Worker    # Since seeding is memory-less, only track the latest seed.
*da0073e9SAndroid Build Coastguard Worker    # Note: `manual_seed_all` followed by `manual_seed` overwrites
*da0073e9SAndroid Build Coastguard Worker    # the seed on current device. We track the order of **latest**
*da0073e9SAndroid Build Coastguard Worker    # calls between these two API.
*da0073e9SAndroid Build Coastguard Worker    def __init__(self):
*da0073e9SAndroid Build Coastguard Worker        self.manual_seed_all_cb = None
*da0073e9SAndroid Build Coastguard Worker        self.manual_seed_cb = None
*da0073e9SAndroid Build Coastguard Worker        self.call_order = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def queue_seed_all(self, cb, traceback):
*da0073e9SAndroid Build Coastguard Worker        self.manual_seed_all_cb = (cb, traceback)
*da0073e9SAndroid Build Coastguard Worker        # update seed_all to be latest
*da0073e9SAndroid Build Coastguard Worker        self.call_order = [self.manual_seed_cb, self.manual_seed_all_cb]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def queue_seed(self, cb, traceback):
*da0073e9SAndroid Build Coastguard Worker        self.manual_seed_cb = (cb, traceback)
*da0073e9SAndroid Build Coastguard Worker        # update seed to be latest
*da0073e9SAndroid Build Coastguard Worker        self.call_order = [self.manual_seed_all_cb, self.manual_seed_cb]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def get_calls(self) -> List:
*da0073e9SAndroid Build Coastguard Worker        return self.call_order
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerlogger = logging.getLogger(__name__)
*da0073e9SAndroid Build Coastguard WorkerP = ParamSpec("P")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass CallbackRegistry(Generic[P]):
*da0073e9SAndroid Build Coastguard Worker    def __init__(self, name: str):
*da0073e9SAndroid Build Coastguard Worker        self.name = name
*da0073e9SAndroid Build Coastguard Worker        self.callback_list: List[Callable[P, None]] = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def add_callback(self, cb: Callable[P, None]) -> None:
*da0073e9SAndroid Build Coastguard Worker        self.callback_list.append(cb)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def fire_callbacks(self, *args: P.args, **kwargs: P.kwargs) -> None:
*da0073e9SAndroid Build Coastguard Worker        for cb in self.callback_list:
*da0073e9SAndroid Build Coastguard Worker            try:
*da0073e9SAndroid Build Coastguard Worker                cb(*args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker            except Exception as e:
*da0073e9SAndroid Build Coastguard Worker                logger.exception(
*da0073e9SAndroid Build Coastguard Worker                    "Exception in callback for %s registered with gpu trace", self.name
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# IMPORT_MAPPING and NAME_MAPPING are adapted from https://github.com/python/cpython/blob/main/Lib/_compat_pickle.py
*da0073e9SAndroid Build Coastguard Worker# for use in the weights_only Unpickler.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard WorkerIMPORT_MAPPING = {
*da0073e9SAndroid Build Coastguard Worker    "__builtin__": "builtins",
*da0073e9SAndroid Build Coastguard Worker    "copy_reg": "copyreg",
*da0073e9SAndroid Build Coastguard Worker    "Queue": "queue",
*da0073e9SAndroid Build Coastguard Worker    "repr": "reprlib",
*da0073e9SAndroid Build Coastguard Worker    "_abcoll": "collections.abc",
*da0073e9SAndroid Build Coastguard Worker    # Non-mutual mappings.
*da0073e9SAndroid Build Coastguard Worker    "UserDict": "collections",
*da0073e9SAndroid Build Coastguard Worker    "UserList": "collections",
*da0073e9SAndroid Build Coastguard Worker    "UserString": "collections",
*da0073e9SAndroid Build Coastguard Worker    "whichdb": "dbm",
*da0073e9SAndroid Build Coastguard Worker    "StringIO": "io",
*da0073e9SAndroid Build Coastguard Worker    "cStringIO": "io",
*da0073e9SAndroid Build Coastguard Worker}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# This contains rename rules that are easy to handle.  We ignore the more
*da0073e9SAndroid Build Coastguard Worker# complex stuff (e.g. mapping the names in the urllib and types modules).
*da0073e9SAndroid Build Coastguard Worker# These rules should be run before import names are fixed.
*da0073e9SAndroid Build Coastguard WorkerNAME_MAPPING = {
*da0073e9SAndroid Build Coastguard Worker    ("__builtin__", "xrange"): ("builtins", "range"),
*da0073e9SAndroid Build Coastguard Worker    ("__builtin__", "reduce"): ("functools", "reduce"),
*da0073e9SAndroid Build Coastguard Worker    ("__builtin__", "intern"): ("sys", "intern"),
*da0073e9SAndroid Build Coastguard Worker    ("__builtin__", "unichr"): ("builtins", "chr"),
*da0073e9SAndroid Build Coastguard Worker    ("__builtin__", "unicode"): ("builtins", "str"),
*da0073e9SAndroid Build Coastguard Worker    ("__builtin__", "long"): ("builtins", "int"),
*da0073e9SAndroid Build Coastguard Worker    ("itertools", "izip"): ("builtins", "zip"),
*da0073e9SAndroid Build Coastguard Worker    ("itertools", "imap"): ("builtins", "map"),
*da0073e9SAndroid Build Coastguard Worker    ("itertools", "ifilter"): ("builtins", "filter"),
*da0073e9SAndroid Build Coastguard Worker    ("itertools", "ifilterfalse"): ("itertools", "filterfalse"),
*da0073e9SAndroid Build Coastguard Worker    ("itertools", "izip_longest"): ("itertools", "zip_longest"),
*da0073e9SAndroid Build Coastguard Worker    ("UserDict", "IterableUserDict"): ("collections", "UserDict"),
*da0073e9SAndroid Build Coastguard Worker    ("UserList", "UserList"): ("collections", "UserList"),
*da0073e9SAndroid Build Coastguard Worker    ("UserString", "UserString"): ("collections", "UserString"),
*da0073e9SAndroid Build Coastguard Worker    # Non-mutual mappings.
*da0073e9SAndroid Build Coastguard Worker    ("__builtin__", "basestring"): ("builtins", "str"),
*da0073e9SAndroid Build Coastguard Worker    ("exceptions", "StandardError"): ("builtins", "Exception"),
*da0073e9SAndroid Build Coastguard Worker    ("UserDict", "UserDict"): ("collections", "UserDict"),
*da0073e9SAndroid Build Coastguard Worker}