Edit permutation importances and add plot

minjk-bl · minjk-bl · commit 112792c093ea · 2023-09-18T09:12:31.000+09:00
diff --git a/visualpython/js/com/component/ModelEditor.js b/visualpython/js/com/component/ModelEditor.js
@@ -479,16 +479,30 @@ define([
                     name: 'permutation_importance',
                     label: 'Permutation importance',
                     import: 'from sklearn.inspection import permutation_importance',
-                    code: '${importance_allocate} = permutation_importance(${model}, ${importance_featureData}, ${importance_targetData}${scoring}${random_state}${etc})',
+                    code: '${importance_allocate} = vp_create_permutation_importances(${model}, ${importance_featureData}, ${importance_targetData}${scoring}${sort})',
                     description: 'Permutation importance for feature evaluation.',
                     options: [
                         { name: 'importance_featureData', label: 'Feature Data', component: ['data_select'], var_type: ['DataFrame', 'Series', 'ndarray', 'list', 'dict'], value: 'X_train' },
                         { name: 'importance_targetData', label: 'Target Data', component: ['data_select'], var_type: ['DataFrame', 'Series', 'ndarray', 'list', 'dict'], value: 'y_train' },
                         { name: 'scoring', component: ['input'], usePair: true },
-                        { name: 'random_state', component: ['input_number'], placeholder: '123', usePair: true },
+                        { name: 'sort', label: 'Sort data', component: ['bool_checkbox'], value: true, usePair: true },
                         { name: 'importance_allocate', label: 'Allocate to', component: ['input'], placeholder: 'New variable', value: 'importances' }
                     ]
                 },
+                'plot_permutation_importance': {
+                    name: 'plot_permutation_importance',
+                    label: 'Plot permutation importance',
+                    import: 'from sklearn.inspection import permutation_importance',
+                    code: 'vp_plot_permutation_importances(${model}, ${importance_featureData}, ${importance_targetData}${scoring}${sort}${top_count})',
+                    description: 'Permutation importance for feature evaluation.',
+                    options: [
+                        { name: 'importance_featureData', label: 'Feature Data', component: ['data_select'], var_type: ['DataFrame', 'Series', 'ndarray', 'list', 'dict'], value: 'X_train' },
+                        { name: 'importance_targetData', label: 'Target Data', component: ['data_select'], var_type: ['DataFrame', 'Series', 'ndarray', 'list', 'dict'], value: 'y_train' },
+                        { name: 'scoring', component: ['input'], usePair: true },
+                        { name: 'sort', label: 'Sort data', component: ['bool_checkbox'], value: true, usePair: true },
+                        { name: 'top_count', label: 'Top count', component: ['input_number'], min: 0, usePair: true }
+                    ]
+                },
                 'feature_importances': {
                     name: 'feature_importances',
                     label: 'Feature importances',
diff --git a/visualpython/js/m_ml/ModelInfo.js b/visualpython/js/m_ml/ModelInfo.js
@@ -409,16 +409,30 @@ define([
                     name: 'permutation_importance',
                     label: 'Permutation importance',
                     import: 'from sklearn.inspection import permutation_importance',
-                    code: '${importance_allocate} = permutation_importance(${model}, ${importance_featureData}, ${importance_targetData}${scoring}${random_state}${etc})',
+                    code: '${importance_allocate} = vp_create_permutation_importances(${model}, ${importance_featureData}, ${importance_targetData}${scoring}${sort})',
                     description: 'Permutation importance for feature evaluation.',
                     options: [
                         { name: 'importance_featureData', label: 'Feature Data', component: ['data_select'], var_type: ['DataFrame', 'Series', 'ndarray', 'list', 'dict'], value: 'X_train' },
                         { name: 'importance_targetData', label: 'Target Data', component: ['data_select'], var_type: ['DataFrame', 'Series', 'ndarray', 'list', 'dict'], value: 'y_train' },
                         { name: 'scoring', component: ['input'], usePair: true },
-                        { name: 'random_state', component: ['input_number'], placeholder: '123', usePair: true },
+                        { name: 'sort', label: 'Sort data', component: ['bool_checkbox'], value: true, usePair: true },
                         { name: 'importance_allocate', label: 'Allocate to', component: ['input'], placeholder: 'New variable', value: 'importances' }
                     ]
                 },
+                'plot_permutation_importance': {
+                    name: 'plot_permutation_importance',
+                    label: 'Plot permutation importance',
+                    import: 'from sklearn.inspection import permutation_importance',
+                    code: 'vp_plot_permutation_importances(${model}, ${importance_featureData}, ${importance_targetData}${scoring}${sort}${top_count})',
+                    description: 'Permutation importance for feature evaluation.',
+                    options: [
+                        { name: 'importance_featureData', label: 'Feature Data', component: ['data_select'], var_type: ['DataFrame', 'Series', 'ndarray', 'list', 'dict'], value: 'X_train' },
+                        { name: 'importance_targetData', label: 'Target Data', component: ['data_select'], var_type: ['DataFrame', 'Series', 'ndarray', 'list', 'dict'], value: 'y_train' },
+                        { name: 'scoring', component: ['input'], usePair: true },
+                        { name: 'sort', label: 'Sort data', component: ['bool_checkbox'], value: true, usePair: true },
+                        { name: 'top_count', label: 'Top count', component: ['input_number'], min: 0, usePair: true }
+                    ]
+                },
                 'feature_importances': {
                     name: 'feature_importances',
                     label: 'Feature importances',
diff --git a/visualpython/python/userCommand.py b/visualpython/python/userCommand.py
@@ -123,6 +123,41 @@ def vp_plot_feature_importances(model, X_train=None, sort=False, top_count=0):
                         
     _vp_plt.show()
 ######
+# Visual Python: Machine Learning > Model Info
+######
+def vp_create_permutation_importances(model, X_train, y_train, scoring=None, sort=False):
+    from sklearn.inspection import permutation_importance
+    if isinstance(X_train, _vp_pd.core.frame.DataFrame):
+        feature_names = X_train.columns
+    else:
+        feature_names = [ 'X{}'.format(i) for i in range(len(model.feature_importances_)) ]
+                        
+    imp = permutation_importance(model, X_train, y_train, scoring)
+
+    df_i = _vp_pd.DataFrame(imp['importances_mean'], index=feature_names, columns=['Feature_importance'])
+    df_i['Percentage'] = 100 * df_i['Feature_importance']
+    if sort: df_i.sort_values(by='Feature_importance', ascending=False, inplace=True)
+    df_i = df_i.round(2)
+                        
+    return df_i
+######
+# Visual Python: Machine Learning > Model Info
+######
+def vp_plot_permutation_importances(model, X_train, y_train, scoring=None, sort=False, top_count=0):
+    df_i = vp_create_permutation_importances(model, X_train, y_train, scoring, sort)
+                        
+    if sort: 
+        if top_count > 0:
+            df_i['Percentage'].sort_values().tail(top_count).plot(kind='barh')
+        else:
+            df_i['Percentage'].sort_values().plot(kind='barh')
+    else: 
+        df_i['Percentage'].plot(kind='barh')
+    _vp_plt.xlabel('Feature importance Percentage')
+    _vp_plt.ylabel('Features')
+                        
+    _vp_plt.show()
+######
 # Visual Python: Visualization > Seaborn
 ######
 def vp_seaborn_show_values(axs, precision=1, space=0.01):