yongjun310
diff --git a/‎tests/test_models.py
Lines changed: 166 additions & 152 deletions b/‎tests/test_models.py
Lines changed: 166 additions & 152 deletions
diff --git a/‎timm/data/_info/imagenet22k_ms_synsets.txt
Lines changed: 21841 additions & 0 deletions b/‎timm/data/_info/imagenet22k_ms_synsets.txt
Lines changed: 21841 additions & 0 deletions
diff --git a/‎timm/data/_info/imagenet22k_ms_to_12k_indices.txt
Lines changed: 11821 additions & 0 deletions b/‎timm/data/_info/imagenet22k_ms_to_12k_indices.txt
Lines changed: 11821 additions & 0 deletions
diff --git a/‎timm/data/_info/imagenet22k_ms_to_22k_indices.txt
Lines changed: 21841 additions & 0 deletions b/‎timm/data/_info/imagenet22k_ms_to_22k_indices.txt
Lines changed: 21841 additions & 0 deletions
diff --git a/‎timm/data/dataset.py
Lines changed: 2 additions & 0 deletions b/‎timm/data/dataset.py
Lines changed: 2 additions & 0 deletions
diff --git a/‎timm/data/dataset_factory.py
Lines changed: 2 additions & 0 deletions b/‎timm/data/dataset_factory.py
Lines changed: 2 additions & 0 deletions
diff --git a/‎timm/data/imagenet_info.py
Lines changed: 7 additions & 4 deletions b/‎timm/data/imagenet_info.py
Lines changed: 7 additions & 4 deletions
diff --git a/‎timm/data/readers/reader_tfds.py
Lines changed: 10 additions & 1 deletion b/‎timm/data/readers/reader_tfds.py
Lines changed: 10 additions & 1 deletion
diff --git a/‎timm/data/readers/reader_wds.py
Lines changed: 16 additions & 5 deletions b/‎timm/data/readers/reader_wds.py
Lines changed: 16 additions & 5 deletions
diff --git a/‎timm/layers/__init__.py
Lines changed: 1 addition & 0 deletions b/‎timm/layers/__init__.py
Lines changed: 1 addition & 0 deletions
@@ -88,6 +88,7 @@ def __init__(
             root,
             reader=None,
             split='train',
+            class_map=None,
             is_training=False,
             batch_size=None,
             seed=42,
@@ -102,6 +103,7 @@ def __init__(
                 reader,
                 root=root,
                 split=split,
+                class_map=class_map,
                 is_training=is_training,
                 batch_size=batch_size,
                 seed=seed,
 
@@ -157,6 +157,7 @@ def create_dataset(
             root,
             reader=name,
             split=split,
+            class_map=class_map,
             is_training=is_training,
             download=download,
             batch_size=batch_size,
@@ -169,6 +170,7 @@ def create_dataset(
             root,
             reader=name,
             split=split,
+            class_map=class_map,
             is_training=is_training,
             batch_size=batch_size,
             repeats=repeats,
 
@@ -7,12 +7,14 @@
 from .dataset_info import DatasetInfo
 
 
+# NOTE no ambiguity wrt to mapping from # classes to ImageNet subset so far, but likely to change
 _NUM_CLASSES_TO_SUBSET = {
     1000: 'imagenet-1k',
-    11821: 'imagenet-12k',
-    21841: 'imagenet-22k',
-    21843: 'imagenet-21k-goog',
-    11221: 'imagenet-21k-miil',
+    11221: 'imagenet-21k-miil',  # miil subset of fall11
+    11821: 'imagenet-12k',  # timm specific 12k subset of fall11
+    21841: 'imagenet-22k',  # as in fall11.tar
+    21842: 'imagenet-22k-ms',  # a Microsoft (for FocalNet) remapping of 22k w/ moves ImageNet-1k classes to first 1000
+    21843: 'imagenet-21k-goog',  # Google's ImageNet full has two classes not in fall11
 }
 
 _SUBSETS = {
@@ -22,6 +24,7 @@
     'imagenet21k': 'imagenet21k_goog_synsets.txt',
     'imagenet21kgoog': 'imagenet21k_goog_synsets.txt',
     'imagenet21kmiil': 'imagenet21k_miil_synsets.txt',
+    'imagenet22kms': 'imagenet22k_ms_synsets.txt',
 }
 _LEMMA_FILE = 'imagenet_synset_to_lemma.txt'
 _DEFINITION_FILE = 'imagenet_synset_to_definition.txt'
 
@@ -34,6 +34,7 @@
     print("Please install tensorflow_datasets package `pip install tensorflow-datasets`.")
     exit(1)
 
+from .class_map import load_class_map
 from .reader import Reader
 from .shared_count import SharedCount
 
@@ -94,6 +95,7 @@ def __init__(
             root,
             name,
             split='train',
+            class_map=None,
             is_training=False,
             batch_size=None,
             download=False,
@@ -151,7 +153,12 @@ def __init__(
         # NOTE: the tfds command line app can be used download & prepare datasets if you don't enable download flag
         if download:
             self.builder.download_and_prepare()
-        self.class_to_idx = get_class_labels(self.builder.info) if self.target_name == 'label' else {}
+        self.remap_class = False
+        if class_map:
+            self.class_to_idx = load_class_map(class_map)
+            self.remap_class = True
+        else:
+            self.class_to_idx = get_class_labels(self.builder.info) if self.target_name == 'label' else {}
         self.split_info = self.builder.info.splits[split]
         self.num_samples = self.split_info.num_examples
 
@@ -299,6 +306,8 @@ def __iter__(self):
             target_data = sample[self.target_name]
             if self.target_img_mode:
                 target_data = Image.fromarray(target_data, mode=self.target_img_mode)
+            elif self.remap_class:
+                target_data = self.class_to_idx[target_data]
             yield input_data, target_data
             sample_count += 1
             if self.is_training and sample_count >= target_sample_count:
 
@@ -29,6 +29,7 @@
     wds = None
     expand_urls = None
 
+from .class_map import load_class_map
 from .reader import Reader
 from .shared_count import SharedCount
 
@@ -42,13 +43,13 @@ def _load_info(root, basename='info'):
     info_yaml = os.path.join(root, basename + '.yaml')
     err_str = ''
     try:
-        with wds.gopen.gopen(info_json) as f:
+        with wds.gopen(info_json) as f:
             info_dict = json.load(f)
         return info_dict
     except Exception as e:
         err_str = str(e)
     try:
-        with wds.gopen.gopen(info_yaml) as f:
+        with wds.gopen(info_yaml) as f:
             info_dict = yaml.safe_load(f)
         return info_dict
     except Exception:
@@ -110,8 +111,8 @@ def _info_convert(dict_info):
                 filenames=split_filenames,
             )
     else:
-        if split not in info['splits']:
-            raise RuntimeError(f"split {split} not found in info ({info['splits'].keys()})")
+        if 'splits' not in info or split not in info['splits']:
+            raise RuntimeError(f"split {split} not found in info ({info.get('splits', {}).keys()})")
         split = split
         split_info = info['splits'][split]
         split_info = _info_convert(split_info)
@@ -290,6 +291,7 @@ def __init__(
             batch_size=None,
             repeats=0,
             seed=42,
+            class_map=None,
             input_name='jpg',
             input_image='RGB',
             target_name='cls',
@@ -320,6 +322,12 @@ def __init__(
         self.num_samples = self.split_info.num_samples
         if not self.num_samples:
             raise RuntimeError(f'Invalid split definition, no samples found.')
+        self.remap_class = False
+        if class_map:
+            self.class_to_idx = load_class_map(class_map)
+            self.remap_class = True
+        else:
+            self.class_to_idx = {}
 
         # Distributed world state
         self.dist_rank = 0
@@ -431,7 +439,10 @@ def __iter__(self):
         i = 0
         # _logger.info(f'start {i}, {self.worker_id}')  # FIXME temporary debug
         for sample in ds:
-            yield sample[self.image_key], sample[self.target_key]
+            target = sample[self.target_key]
+            if self.remap_class:
+                target = self.class_to_idx[target]
+            yield sample[self.image_key], target
             i += 1
         # _logger.info(f'end {i}, {self.worker_id}')  # FIXME temporary debug
 
 
@@ -20,6 +20,7 @@
     EvoNorm2dS0, EvoNorm2dS0a, EvoNorm2dS1, EvoNorm2dS1a, EvoNorm2dS2, EvoNorm2dS2a
 from .fast_norm import is_fast_norm, set_fast_norm, fast_group_norm, fast_layer_norm
 from .filter_response_norm import FilterResponseNormTlu2d, FilterResponseNormAct2d
+from .format import Format, get_channel_dim, get_spatial_dim, nchw_to, nhwc_to
 from .gather_excite import GatherExcite
 from .global_context import GlobalContext
 from .helpers import to_ntuple, to_2tuple, to_3tuple, to_4tuple, make_divisible, extend_tuple