Fakerycoder
diff --git a/‎setup.py
Lines changed: 12 additions & 13 deletions b/‎setup.py
Lines changed: 12 additions & 13 deletions
diff --git a/‎supar/__init__.py
Lines changed: 29 additions & 20 deletions b/‎supar/__init__.py
Lines changed: 29 additions & 20 deletions
diff --git a/‎supar/cmds/biaffine_dependency.py renamed to ‎supar/cmds/biaffine_dep.py
Lines changed: 5 additions & 4 deletions b/‎supar/cmds/biaffine_dependency.py renamed to ‎supar/cmds/biaffine_dep.py
Lines changed: 5 additions & 4 deletions
diff --git a/‎supar/cmds/biaffine_semantic_dependency.py renamed to ‎supar/cmds/biaffine_sdp.py
Lines changed: 5 additions & 3 deletions b/‎supar/cmds/biaffine_semantic_dependency.py renamed to ‎supar/cmds/biaffine_sdp.py
Lines changed: 5 additions & 3 deletions
diff --git a/‎supar/cmds/crf2o_dependency.py renamed to ‎supar/cmds/crf2o_dep.py
Lines changed: 4 additions & 3 deletions b/‎supar/cmds/crf2o_dependency.py renamed to ‎supar/cmds/crf2o_dep.py
Lines changed: 4 additions & 3 deletions
diff --git a/‎supar/cmds/crf_constituency.py renamed to ‎supar/cmds/crf_con.py
Lines changed: 4 additions & 3 deletions b/‎supar/cmds/crf_constituency.py renamed to ‎supar/cmds/crf_con.py
Lines changed: 4 additions & 3 deletions
diff --git a/‎supar/cmds/crf_dependency.py renamed to ‎supar/cmds/crf_dep.py
Lines changed: 4 additions & 3 deletions b/‎supar/cmds/crf_dependency.py renamed to ‎supar/cmds/crf_dep.py
Lines changed: 4 additions & 3 deletions
@@ -4,10 +4,10 @@
 
 setup(
     name='supar',
-    version='1.0.1',
+    version='1.1.0',
     author='Yu Zhang',
     author_email='yzhang.cs@outlook.com',
-    description='Syntactic Parsing Models',
+    description='Syntactic/Semantic Parsing Models',
     long_description=open('README.md', 'r').read(),
     long_description_content_type='text/markdown',
     url='https://github.com/yzhangcs/parser',
@@ -20,25 +20,24 @@
         'Topic :: Text Processing :: Linguistic'
     ],
     setup_requires=[
-        'setuptools>=18.0',
+        'setuptools>=56.0',
     ],
     install_requires=[
-        'torch>=1.7.0',
-        'transformers>=3.1.0',
+        'torch>=1.7.1',
+        'transformers>=4.0.0',
         'nltk',
         'stanza',
         'dill'],
     entry_points={
         'console_scripts': [
-            'biaffine-dependency=supar.cmds.biaffine_dependency:main',
-            'crfnp-dependency=supar.cmds.crfnp_dependency:main',
-            'crf-dependency=supar.cmds.crf_dependency:main',
-            'crf2o-dependency=supar.cmds.crf2o_dependency:main',
-            'crf-constituency=supar.cmds.crf_constituency:main',
-            'biaffine-semantic-dependency=supar.cmds.biaffine_semantic_dependency:main',
-            'vi-semantic-dependency=supar.cmds.vi_semantic_dependency:main'
+            'biaffine-dep=supar.cmds.biaffine_dep:main',
+            'crf-dep=supar.cmds.crf_dep:main',
+            'crf2o-dep=supar.cmds.crf2o_dep:main',
+            'crf-con=supar.cmds.crf_con:main',
+            'biaffine-sdp=supar.cmds.biaffine_sdp:main',
+            'vi-sdp=supar.cmds.vi_sdp:main'
         ]
     },
-    python_requires='>=3.6',
+    python_requires='>=3.7',
     zip_safe=False
 )
@@ -2,42 +2,51 @@
 
 from .parsers import (BiaffineDependencyParser,
                       BiaffineSemanticDependencyParser, CRF2oDependencyParser,
-                      CRFConstituencyParser, CRFDependencyParser,
-                      CRFNPDependencyParser, Parser,
+                      CRFConstituencyParser, CRFDependencyParser, Parser,
+                      VIConstituencyParser, VIDependencyParser,
                       VISemanticDependencyParser)
 
 __all__ = ['BiaffineDependencyParser',
-           'CRFNPDependencyParser',
            'CRFDependencyParser',
            'CRF2oDependencyParser',
+           'VIDependencyParser',
            'CRFConstituencyParser',
+           'VIConstituencyParser',
            'BiaffineSemanticDependencyParser',
            'VISemanticDependencyParser',
            'Parser']
 
-__version__ = '1.0.1'
+__version__ = '1.1.0'
 
 PARSER = {parser.NAME: parser for parser in [BiaffineDependencyParser,
-                                             CRFNPDependencyParser,
                                              CRFDependencyParser,
                                              CRF2oDependencyParser,
+                                             VIDependencyParser,
                                              CRFConstituencyParser,
+                                             VIConstituencyParser,
                                              BiaffineSemanticDependencyParser,
                                              VISemanticDependencyParser]}
 
-PRETRAINED = {
-    'biaffine-dep-en': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ptb.biaffine.dependency.char.zip',
-    'biaffine-dep-zh': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ctb7.biaffine.dependency.char.zip',
-    'biaffine-dep-bert-en': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ptb.biaffine.dependency.bert.zip',
-    'biaffine-dep-bert-zh': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ctb7.biaffine.dependency.bert.zip',
-    'crfnp-dep-en': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ptb.crfnp.dependency.char.zip',
-    'crfnp-dep-zh': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ctb7.crfnp.dependency.char.zip',
-    'crf-dep-en': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ptb.crf.dependency.char.zip',
-    'crf-dep-zh': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ctb7.crf.dependency.char.zip',
-    'crf2o-dep-en': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ptb.crf2o.dependency.char.zip',
-    'crf2o-dep-zh': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ctb7.crf2o.dependency.char.zip',
-    'crf-con-en': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ptb.crf.constituency.char.zip',
-    'crf-con-zh': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ctb7.crf.constituency.char.zip',
-    'crf-con-bert-en': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ptb.crf.constituency.bert.zip',
-    'crf-con-bert-zh': 'https://github.com/yzhangcs/parser/releases/download/v1.0.0/ctb7.crf.constituency.bert.zip'
+SRC = 'https://github.com/yzhangcs/parser/releases/download'
+NAME = {
+    'biaffine-dep-en': 'ptb.biaffine.dep.lstm.char',
+    'biaffine-dep-zh': 'ctb7.biaffine.dep.lstm.char',
+    'crf2o-dep-en': 'ptb.crf2o.dep.lstm.char',
+    'crf2o-dep-zh': 'ctb7.crf2o.dep.lstm.char',
+    'biaffine-dep-roberta-en': 'ptb.biaffine.dep.roberta',
+    'biaffine-dep-electra-zh': 'ctb7.biaffine.dep.electra',
+    'biaffine-dep-xlmr': 'ud.biaffine.dep.xlmr',
+    'crf-con-en': 'ptb.crf.con.lstm.char',
+    'crf-con-zh': 'ctb7.crf.con.lstm.char',
+    'crf-con-roberta-en': 'ptb.crf.con.roberta',
+    'crf-con-electra-zh': 'ctb7.crf.con.electra',
+    'crf-con-xlmr': 'spmrl.crf.con.xlmr',
+    'biaffine-sdp-en': 'dm.biaffine.sdp.lstm.tag-char-lemma',
+    'biaffine-sdp-zh': 'semeval16.biaffine.sdp.lstm.tag-char-lemma',
+    'vi-sdp-en': 'dm.vi.sdp.lstm.tag-char-lemma',
+    'vi-sdp-zh': 'semeval16.vi.sdp.lstm.tag-char-lemma',
+    'biaffine-sdp-roberta-en': 'dm.biaffine.sdp.roberta',
+    'biaffine-sdp-electra-zh': 'semeval16.biaffine.sdp.electra'
 }
+MODEL = {n: f'{SRC}/v{__version__}/{m}.zip' for n, m in NAME.items()}
+CONFIG = {n: f'{SRC}/v{__version__}/{m}.ini' for n, m in NAME.items()}
@@ -9,14 +9,15 @@
 def main():
     parser = argparse.ArgumentParser(description='Create Biaffine Dependency Parser.')
     parser.add_argument('--tree', action='store_true', help='whether to ensure well-formedness')
-    parser.add_argument('--proj', action='store_true', help='whether to projectivise the data')
+    parser.add_argument('--proj', action='store_true', help='whether to projectivize the data')
     parser.add_argument('--partial', action='store_true', help='whether partial annotation is included')
     parser.set_defaults(Parser=BiaffineDependencyParser)
     subparsers = parser.add_subparsers(title='Commands', dest='mode')
     # train
     subparser = subparsers.add_parser('train', help='Train a parser.')
-    subparser.add_argument('--feat', '-f', choices=['tag', 'char', 'bert'], help='choices of additional features')
+    subparser.add_argument('--feat', '-f', choices=['tag', 'char', 'bert'], nargs='+', help='features to use')
     subparser.add_argument('--build', '-b', action='store_true', help='whether to build the model first')
+    subparser.add_argument('--encoder', choices=['lstm', 'bert'], default='lstm', help='encoder to use')
     subparser.add_argument('--punct', action='store_true', help='whether to include punctuation')
     subparser.add_argument('--max-len', type=int, help='max length of the sentences')
     subparser.add_argument('--buckets', default=32, type=int, help='max num of buckets to use')
@@ -26,18 +27,18 @@ def main():
     subparser.add_argument('--embed', default='data/glove.6B.100d.txt', help='path to pretrained embeddings')
     subparser.add_argument('--unk', default='unk', help='unk token in pretrained embeddings')
     subparser.add_argument('--n-embed', default=100, type=int, help='dimension of embeddings')
-    subparser.add_argument('--bert', default='bert-base-cased', help='which bert model to use')
+    subparser.add_argument('--bert', default='bert-base-cased', help='which BERT model to use')
     # evaluate
     subparser = subparsers.add_parser('evaluate', help='Evaluate the specified parser and dataset.')
     subparser.add_argument('--punct', action='store_true', help='whether to include punctuation')
     subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
     subparser.add_argument('--data', default='data/ptb/test.conllx', help='path to dataset')
     # predict
     subparser = subparsers.add_parser('predict', help='Use a trained parser to make predictions.')
-    subparser.add_argument('--prob', action='store_true', help='whether to output probs')
     subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
     subparser.add_argument('--data', default='data/ptb/test.conllx', help='path to dataset')
     subparser.add_argument('--pred', default='pred.conllx', help='path to predicted result')
+    subparser.add_argument('--prob', action='store_true', help='whether to output probs')
     parse(parser)
 
 
 
@@ -12,8 +12,9 @@ def main():
     subparsers = parser.add_subparsers(title='Commands', dest='mode')
     # train
     subparser = subparsers.add_parser('train', help='Train a parser.')
-    subparser.add_argument('--feat', '-f', default='tag,char,lemma', help='additional features to use，separated by commas.')
+    subparser.add_argument('--feat', '-f', choices=['tag', 'char', 'lemma', 'bert'], nargs='+', help='features to use')
     subparser.add_argument('--build', '-b', action='store_true', help='whether to build the model first')
+    subparser.add_argument('--encoder', choices=['lstm', 'bert'], default='lstm', help='encoder to use')
     subparser.add_argument('--max-len', type=int, help='max length of the sentences')
     subparser.add_argument('--buckets', default=32, type=int, help='max num of buckets to use')
     subparser.add_argument('--train', default='data/sdp/DM/train.conllu', help='path to train file')
@@ -22,17 +23,18 @@ def main():
     subparser.add_argument('--embed', default='data/glove.6B.100d.txt', help='path to pretrained embeddings')
     subparser.add_argument('--unk', default='unk', help='unk token in pretrained embeddings')
     subparser.add_argument('--n-embed', default=100, type=int, help='dimension of embeddings')
-    subparser.add_argument('--bert', default='bert-base-cased', help='which bert model to use')
+    subparser.add_argument('--n-embed-proj', default=125, type=int, help='dimension of projected embeddings')
+    subparser.add_argument('--bert', default='bert-base-cased', help='which BERT model to use')
     # evaluate
     subparser = subparsers.add_parser('evaluate', help='Evaluate the specified parser and dataset.')
     subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
     subparser.add_argument('--data', default='data/sdp/DM/test.conllu', help='path to dataset')
     # predict
     subparser = subparsers.add_parser('predict', help='Use a trained parser to make predictions.')
-    subparser.add_argument('--prob', action='store_true', help='whether to output probs')
     subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
     subparser.add_argument('--data', default='data/sdp/DM/test.conllu', help='path to dataset')
     subparser.add_argument('--pred', default='pred.conllu', help='path to predicted result')
+    subparser.add_argument('--prob', action='store_true', help='whether to output probs')
     parse(parser)
 
 
 
@@ -16,8 +16,9 @@ def main():
     subparsers = parser.add_subparsers(title='Commands', dest='mode')
     # train
     subparser = subparsers.add_parser('train', help='Train a parser.')
-    subparser.add_argument('--feat', '-f', choices=['tag', 'char', 'bert'], help='choices of additional features')
+    subparser.add_argument('--feat', '-f', choices=['tag', 'char', 'bert'], nargs='+', help='features to use')
     subparser.add_argument('--build', '-b', action='store_true', help='whether to build the model first')
+    subparser.add_argument('--encoder', choices=['lstm', 'bert'], default='lstm', help='encoder to use')
     subparser.add_argument('--punct', action='store_true', help='whether to include punctuation')
     subparser.add_argument('--max-len', type=int, help='max length of the sentences')
     subparser.add_argument('--buckets', default=32, type=int, help='max num of buckets to use')
@@ -27,18 +28,18 @@ def main():
     subparser.add_argument('--embed', default='data/glove.6B.100d.txt', help='path to pretrained embeddings')
     subparser.add_argument('--unk', default='unk', help='unk token in pretrained embeddings')
     subparser.add_argument('--n-embed', default=100, type=int, help='dimension of embeddings')
-    subparser.add_argument('--bert', default='bert-base-cased', help='which bert model to use')
+    subparser.add_argument('--bert', default='bert-base-cased', help='which BERT model to use')
     # evaluate
     subparser = subparsers.add_parser('evaluate', help='Evaluate the specified parser and dataset.')
     subparser.add_argument('--punct', action='store_true', help='whether to include punctuation')
     subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
     subparser.add_argument('--data', default='data/ptb/test.conllx', help='path to dataset')
     # predict
     subparser = subparsers.add_parser('predict', help='Use a trained parser to make predictions.')
-    subparser.add_argument('--prob', action='store_true', help='whether to output probs')
     subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
     subparser.add_argument('--data', default='data/ptb/test.conllx', help='path to dataset')
     subparser.add_argument('--pred', default='pred.conllx', help='path to predicted result')
+    subparser.add_argument('--prob', action='store_true', help='whether to output probs')
     parse(parser)
 
 
 
@@ -13,8 +13,9 @@ def main():
     subparsers = parser.add_subparsers(title='Commands', dest='mode')
     # train
     subparser = subparsers.add_parser('train', help='Train a parser.')
-    subparser.add_argument('--feat', '-f', choices=['tag', 'char', 'bert'], help='choices of additional features')
+    subparser.add_argument('--feat', '-f', choices=['tag', 'char', 'bert'], nargs='+', help='features to use')
     subparser.add_argument('--build', '-b', action='store_true', help='whether to build the model first')
+    subparser.add_argument('--encoder', choices=['lstm', 'bert'], default='lstm', help='encoder to use')
     subparser.add_argument('--max-len', type=int, help='max length of the sentences')
     subparser.add_argument('--buckets', default=32, type=int, help='max num of buckets to use')
     subparser.add_argument('--train', default='data/ptb/train.pid', help='path to train file')
@@ -23,17 +24,17 @@ def main():
     subparser.add_argument('--embed', default='data/glove.6B.100d.txt', help='path to pretrained embeddings')
     subparser.add_argument('--unk', default='unk', help='unk token in pretrained embeddings')
     subparser.add_argument('--n-embed', default=100, type=int, help='dimension of embeddings')
-    subparser.add_argument('--bert', default='bert-base-cased', help='which bert model to use')
+    subparser.add_argument('--bert', default='bert-base-cased', help='which BERT model to use')
     # evaluate
     subparser = subparsers.add_parser('evaluate', help='Evaluate the specified parser and dataset.')
     subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
     subparser.add_argument('--data', default='data/ptb/test.pid', help='path to dataset')
     # predict
     subparser = subparsers.add_parser('predict', help='Use a trained parser to make predictions.')
-    subparser.add_argument('--prob', action='store_true', help='whether to output probs')
     subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
     subparser.add_argument('--data', default='data/ptb/test.pid', help='path to dataset')
     subparser.add_argument('--pred', default='pred.pid', help='path to predicted result')
+    subparser.add_argument('--prob', action='store_true', help='whether to output probs')
     parse(parser)
 
 
 
@@ -16,8 +16,9 @@ def main():
     subparsers = parser.add_subparsers(title='Commands', dest='mode')
     # train
     subparser = subparsers.add_parser('train', help='Train a parser.')
-    subparser.add_argument('--feat', '-f', choices=['tag', 'char', 'bert'], help='choices of additional features')
+    subparser.add_argument('--feat', '-f', choices=['tag', 'char', 'bert'], nargs='+', help='features to use')
     subparser.add_argument('--build', '-b', action='store_true', help='whether to build the model first')
+    subparser.add_argument('--encoder', choices=['lstm', 'bert'], default='lstm', help='encoder to use')
     subparser.add_argument('--punct', action='store_true', help='whether to include punctuation')
     subparser.add_argument('--max-len', type=int, help='max length of the sentences')
     subparser.add_argument('--buckets', default=32, type=int, help='max num of buckets to use')
@@ -27,18 +28,18 @@ def main():
     subparser.add_argument('--embed', default='data/glove.6B.100d.txt', help='path to pretrained embeddings')
     subparser.add_argument('--unk', default='unk', help='unk token in pretrained embeddings')
     subparser.add_argument('--n-embed', default=100, type=int, help='dimension of embeddings')
-    subparser.add_argument('--bert', default='bert-base-cased', help='which bert model to use')
+    subparser.add_argument('--bert', default='bert-base-cased', help='which BERT model to use')
     # evaluate
     subparser = subparsers.add_parser('evaluate', help='Evaluate the specified parser and dataset.')
     subparser.add_argument('--punct', action='store_true', help='whether to include punctuation')
     subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
     subparser.add_argument('--data', default='data/ptb/test.conllx', help='path to dataset')
     # predict
     subparser = subparsers.add_parser('predict', help='Use a trained parser to make predictions.')
-    subparser.add_argument('--prob', action='store_true', help='whether to output probs')
     subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
     subparser.add_argument('--data', default='data/ptb/test.conllx', help='path to dataset')
     subparser.add_argument('--pred', default='pred.conllx', help='path to predicted result')
+    subparser.add_argument('--prob', action='store_true', help='whether to output probs')
     parse(parser)