Last commit with on-going past commented.

mfuntowicz · mfuntowicz · commit 2fcb9dcb9e02 · 2021-07-01T15:14:31.000+02:00
diff --git a/src/transformers/models/gpt2/configuration_gpt2.py b/src/transformers/models/gpt2/configuration_gpt2.py
@@ -14,7 +14,10 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """ OpenAI GPT-2 configuration """
-from typing import Mapping
+from collections import OrderedDict
+from typing import Any, Mapping, Optional
+
+from transformers import PreTrainedTokenizer, TensorType, is_torch_available
 
 from ...configuration_utils import PretrainedConfig
 from ...onnx import OnnxConfigWithPast
@@ -202,19 +205,62 @@ def num_hidden_layers(self):
 class GPT2OnnxConfig(OnnxConfigWithPast):
     @property
     def inputs(self) -> Mapping[str, Mapping[int, str]]:
-        return {
-            "input_ids": {0: "batch", 1: "sequence"},
-            "attention_mask": {0: "batch", 1: "sequence"},
-        }
+        if self.use_past:
+            common_inputs = OrderedDict({"input_ids": {0: "batch"}})
+            for i in range(self._config.n_layer * 2):
+                common_inputs[f"past_key_values.{i}"] = {0: "batch", 2: "sequence"}
+
+            common_inputs["attention_mask"] = {0: "batch"}
+        else:
+            common_inputs = OrderedDict({
+                "input_ids": {0: "batch", 1: "sequence"},
+                "attention_mask": {0: "batch", 1: "sequence"}
+            })
+
+        return common_inputs
 
     @property
     def outputs(self) -> Mapping[str, Mapping[int, str]]:
         if self.use_past:
-            return {
-                "last_hidden_state": {0: "batch", 1: "sequence"},
-                "past_keys": {0: "batch", 2: "sequence"},
-            }
+            common_outputs = {"last_hidden_state": {0: "batch", 1: "sequence"}}
+
+            for i in range(self._config.n_layer * 2):
+                common_outputs[f"present.{i}"] = {0: "batch", 2: "sequence"}
+
+            return common_outputs
         else:
-            return {
-                "last_hidden_state": {0: "batch", 1: "sequence"},
-            }
+            return {"last_hidden_state": {0: "batch", 1: "sequence"}}
+
+    def generate_dummy_inputs(
+        self,
+        tokenizer: PreTrainedTokenizer,
+        batch_size: int = -1,
+        seq_length: int = -1,
+        is_pair: bool = False,
+        framework: Optional[TensorType] = None,
+    ) -> Mapping[str, Any]:
+        common_inputs = super().generate_dummy_inputs(tokenizer, batch_size, seq_length, is_pair, framework)
+
+        # We need to order the input in the way they appears in the forward()
+        ordered_inputs = OrderedDict({
+            "input_ids": common_inputs["input_ids"]
+        })
+
+        # Need to add the past_keys
+        if self.use_past:
+            if not is_torch_available():
+                raise ValueError("Cannot generate dummy past_keys inputs without PyTorch installed.")
+            else:
+                import torch
+
+                batch = common_inputs["input_ids"].shape[0]
+                ordered_inputs["past_key_values"] = [
+                    (
+                        torch.zeros((batch, self._config.n_head, 1, self._config.hidden_size // self._config.n_head)),
+                        torch.zeros((batch, self._config.n_head, 1, self._config.hidden_size // self._config.n_head)),
+                    )
+                    for _ in range(self._config.n_layer)
+                ]
+
+        ordered_inputs["attention_mask"] = common_inputs["attention_mask"]
+        return ordered_inputs
diff --git a/src/transformers/onnx/config.py b/src/transformers/onnx/config.py
@@ -30,6 +30,9 @@ class OnnxConfig(ABC):
     Base class for ONNX exportable model describing metadata on how to export the model through the ONNX format.
     """
 
+    DEFAULT_FIXED_BATCH = 2
+    DEFAULT_FIXED_SEQUENCE = 8
+
     def __init__(self, config: PretrainedConfig):
         self._config = config
 
@@ -131,11 +134,15 @@ def generate_dummy_inputs(
         """
 
         # If dynamic axis (-1) we forward with a fixed dimension of 2 samples to avoid optimizations made by ONNX
-        batch_size = compute_effective_axis_dimension(batch_size, fixed_dimension=2, num_token_to_add=0)
+        batch_size = compute_effective_axis_dimension(
+            batch_size, fixed_dimension=OnnxConfig.DEFAULT_FIXED_BATCH, num_token_to_add=0
+        )
 
         # If dynamic axis (-1) we forward with a fixed dimension of 8 tokens to avoid optimizations made by ONNX
         token_to_add = tokenizer.num_special_tokens_to_add(is_pair)
-        seq_length = compute_effective_axis_dimension(seq_length, fixed_dimension=8, num_token_to_add=token_to_add)
+        seq_length = compute_effective_axis_dimension(
+            seq_length, fixed_dimension=OnnxConfig.DEFAULT_FIXED_SEQUENCE, num_token_to_add=token_to_add
+        )
 
         # Generate dummy inputs according to compute batch and sequence
         dummy_input = [" ".join([tokenizer.unk_token]) * seq_length] * batch_size
@@ -166,3 +173,29 @@ def values_override(self) -> Optional[Mapping[str, Any]]:
             return {"use_cache": self.use_past}
 
         return None
+
+    def generate_dummy_inputs(
+        self,
+        tokenizer: PreTrainedTokenizer,
+        batch_size: int = -1,
+        seq_length: int = -1,
+        is_pair: bool = False,
+        framework: Optional[TensorType] = None,
+    ) -> Mapping[str, Any]:
+        # If dynamic axis (-1) we forward with a fixed dimension of 2 samples to avoid optimizations made by ONNX
+        batch_size = compute_effective_axis_dimension(
+            batch_size, fixed_dimension=OnnxConfig.DEFAULT_FIXED_BATCH, num_token_to_add=0
+        )
+
+        # If dynamic axis (-1) we forward with a fixed dimension of 8 tokens to avoid optimizations made by ONNX
+        token_to_add = tokenizer.num_special_tokens_to_add(is_pair)
+
+        # When use_past the caching mechanism requires inputs to be only 1 single token
+        fixed_sequence_length = 1 if self.use_past else OnnxConfig.DEFAULT_FIXED_SEQUENCE
+        seq_length = compute_effective_axis_dimension(
+            seq_length, fixed_dimension=fixed_sequence_length, num_token_to_add=token_to_add
+        )
+
+        # Generate dummy inputs according to compute batch and sequence
+        dummy_input = [" ".join([tokenizer.unk_token]) * seq_length] * batch_size
+        return dict(tokenizer(dummy_input, return_tensors=framework))
diff --git a/src/transformers/onnx/convert.py b/src/transformers/onnx/convert.py
@@ -12,6 +12,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
+from inspect import signature
 from itertools import chain
 from pathlib import Path
 from typing import Iterable, List, Tuple, Union
@@ -97,7 +98,7 @@ def convert_pytorch(
     # Ensure inputs match
     # TODO: Check when exporting QA we provide "is_pair=True"
     model_inputs = config.generate_dummy_inputs(tokenizer, framework=TensorType.PYTORCH)
-    inputs_match, ordered_onnx_inputs = ensure_model_and_config_inputs_match(model_inputs.keys(), config.inputs.keys())
+    inputs_match, matched_inputs = ensure_model_and_config_inputs_match(model, model_inputs.keys())
     onnx_outputs = list(config.outputs.keys())
 
     if not inputs_match:
@@ -108,7 +109,7 @@ def convert_pytorch(
         model,
         (model_inputs,),
         f=output.as_posix(),
-        input_names=ordered_onnx_inputs,
+        input_names=list(config.inputs.keys()),
         output_names=onnx_outputs,
         dynamic_axes={name: axes for name, axes in chain(config.inputs.items(), config.outputs.items())},
         do_constant_folding=True,
@@ -117,7 +118,7 @@ def convert_pytorch(
         opset_version=opset,
     )
 
-    return ordered_onnx_inputs, onnx_outputs
+    return matched_inputs, onnx_outputs
 
 
 def validate_model_outputs(
@@ -133,7 +134,6 @@ def validate_model_outputs(
     logger.info("Validating ONNX model...")
 
     reference_model_inputs = config.generate_dummy_inputs(tokenizer, framework=TensorType.PYTORCH)
-    onnx_model_inputs = config.generate_dummy_inputs(tokenizer, framework=TensorType.NUMPY)
 
     # Create ONNX Runtime session
     options = SessionOptions()
@@ -151,8 +151,17 @@ def validate_model_outputs(
         else:
             ref_outputs_dict[name] = value
 
+    # We flatten potential collection of inputs (i.e. past_keys)
+    onnx_inputs = {}
+    for name, value in reference_model_inputs.items():
+        if isinstance(value, (list, tuple)):
+            value = flatten_output_collection_property(name, value)
+            onnx_inputs.update({tensor_name: pt_tensor.numpy() for tensor_name, pt_tensor in value.items()})
+        else:
+            onnx_inputs[name] = value.numpy()
+
     # Compute outputs from the ONNX model
-    onnx_outputs = session.run(onnx_named_outputs, dict(onnx_model_inputs))
+    onnx_outputs = session.run(onnx_named_outputs, onnx_inputs)
 
     # Check we have a subset of the keys into onnx_outputs against ref_outputs
     ref_outputs_set, onnx_outputs_set = set(ref_outputs_dict.keys()), set(onnx_named_outputs)
@@ -195,20 +204,22 @@ def validate_model_outputs(
 
 
 def ensure_model_and_config_inputs_match(
-    model_inputs: Iterable[str], config_inputs: Iterable[str]
+    model: Union[PreTrainedModel, TFPreTrainedModel], model_inputs: Iterable[str]
 ) -> Tuple[bool, List[str]]:
     """
 
     :param model_inputs:
     :param config_inputs:
     :return:
     """
-    model_inputs_set, config_inputs_set = set(model_inputs), set(config_inputs)
+    forward_parameters = signature(model.forward).parameters
+    model_inputs_set = set(model_inputs)
 
     # We are fine if config_inputs has more keys than model_inputs
-    is_ok = model_inputs_set.issubset(config_inputs_set)
+    forward_inputs_set = set(forward_parameters.keys())
+    is_ok = model_inputs_set.issubset(forward_inputs_set)
 
-    # Make sure the input order match
-    matching_inputs = config_inputs_set.intersection(model_inputs_set)
-    ordered_matching_inputs = [config_input for config_input in config_inputs if config_input in matching_inputs]
-    return is_ok, ordered_matching_inputs
+    # Make sure the input order match (VERY IMPORTANT !!!!)
+    matching_inputs = forward_inputs_set.intersection(model_inputs_set)
+    ordered_inputs = [parameter for parameter in forward_parameters.keys() if parameter in matching_inputs]
+    return is_ok, ordered_inputs
diff --git a/tests/test_onnx_v2.py b/tests/test_onnx_v2.py
@@ -121,11 +121,7 @@ class OnnxConfigWithPastTestCaseV2(TestCase):
     Cover the tests for model which have use_cache feature (i.e. "with_past" for ONNX)
     """
 
-    SUPPORTED_WITH_PAST_CONFIGS = {
-        ("BART", BartConfig),
-        ("GPT2", GPT2Config),
-        ("T5", T5Config)
-    }
+    SUPPORTED_WITH_PAST_CONFIGS = {("BART", BartConfig), ("GPT2", GPT2Config), ("T5", T5Config)}
 
     @patch.multiple(OnnxConfigWithPast, __abstractmethods__=set())
     def test_use_past(self):
@@ -135,13 +131,11 @@ def test_use_past(self):
         for name, config in OnnxConfigWithPastTestCaseV2.SUPPORTED_WITH_PAST_CONFIGS:
             with self.subTest(name):
                 self.assertFalse(
-                    OnnxConfigWithPast.default(config()).use_past,
-                    "OnnxConfigWithPast.default() should not use_past"
+                    OnnxConfigWithPast.default(config()).use_past, "OnnxConfigWithPast.default() should not use_past"
                 )
 
                 self.assertTrue(
-                    OnnxConfigWithPast.with_past(config()).use_past,
-                    "OnnxConfigWithPast.default() should use_past"
+                    OnnxConfigWithPast.with_past(config()).use_past, "OnnxConfigWithPast.default() should use_past"
                 )
 
     @patch.multiple(OnnxConfigWithPast, __abstractmethods__=set())
@@ -157,17 +151,15 @@ def test_values_override(self):
                 self.assertIsNotNone(onnx_config_default.values_override, "values_override should not be None")
                 self.assertIn("use_cache", onnx_config_default.values_override, "use_cache should be present")
                 self.assertFalse(
-                    onnx_config_default.values_override["use_cache"],
-                    "use_cache should be False if not using past"
+                    onnx_config_default.values_override["use_cache"], "use_cache should be False if not using past"
                 )
 
                 # with past
                 onnx_config_default = OnnxConfigWithPast.with_past(config())
                 self.assertIsNotNone(onnx_config_default.values_override, "values_override should not be None")
                 self.assertIn("use_cache", onnx_config_default.values_override, "use_cache should be present")
                 self.assertTrue(
-                    onnx_config_default.values_override["use_cache"],
-                    "use_cache should be False if not using past"
+                    onnx_config_default.values_override["use_cache"], "use_cache should be False if not using past"
                 )
 
 
@@ -197,6 +189,7 @@ class OnnxExportTestCaseV2(TestCase):
     """
     Integration tests ensuring supported models are correctly exported
     """
+
     @slow
     @require_torch
     def test_pytorch_export_default(self):
@@ -211,8 +204,9 @@ def test_pytorch_export_default(self):
                 onnx_config = onnx_config_class.default(model.config)
 
                 with NamedTemporaryFile("w") as output:
-                    onnx_inputs, onnx_outputs = \
-                        convert_pytorch(tokenizer, model, onnx_config, DEFAULT_ONNX_OPSET, Path(output.name))
+                    onnx_inputs, onnx_outputs = convert_pytorch(
+                        tokenizer, model, onnx_config, DEFAULT_ONNX_OPSET, Path(output.name)
+                    )
 
                     try:
                         validate_model_outputs(onnx_config, tokenizer, model, Path(output.name), onnx_outputs, 1e-5)