0% found this document useful (0 votes)

4 views

import numpy as np

The document outlines a data analysis process using Python libraries such as pandas, matplotlib, and scikit-learn. It involves loading training and testing datasets, performing exploratory data analysis, visualizing data distributions, and building a Random Forest classifier to predict outcomes based on features. The model's accuracy is calculated, and feature importance is assessed to understand the contribution of each feature to the predictions.

Uploaded by

pkpkpavan2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views

import numpy as np

Uploaded by

pkpkpavan2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

import numpy as np # linear algebra

import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

import matpoltlib.pyplot as plt

import os

import numpy as np

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

from sklearn.svm import SVR

from matplotlib.colors import ListedColormap

test=pd.read_csv("Testing.csv")

train=pd.read_csv("Training.csv")

train.sample(n=1)

#This will indicate any random 1 data will be retreived

data = pd.concat([train, test])

data.sample(10)

#This will give us randome sample data

data.head(5)
# This will retrieve the 1st 5 data

data.tail(5)

# This will retrive the last 5 data

data.columns

# This will retrieve all the colums associated with the dataset

data.shape

# It has 4961 rows and 133 columns

data.info()

# What we are expecting from visualization. ?

data.boxplot(column ='skin_rash', by='itching') #boxplot shows outlier, median,Q3,Q1

# # What we are expecting from visualization. ?

data1 =data.loc[:,["itching","skin_rash","coma"] ]

data1.plot()

## What we are expecting from visualization. ?

data1.plot(subplots =True)

data.plot(kind= "scatter",x="depression", y="muscle_pain")

data.plot(kind="hist", y="acidity", bins = 50, range=(0,250))

data.isnull().sum()

#Importing the train_test_split functionality

from sklearn.model_selection import train_test_split

X, y=data.iloc[:,:-1], data.iloc[:,-1]

#Spliting the dataset into training set and test set

X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.3)

#70% training and 30% test

#Import Random Forest Model

from sklearn.ensemble import RandomForestClassifier

#Create a Gaussian Classifier

clf=RandomForestClassifier(n_estimators=100)

#Train the model using the training sets y_pred=clf.predict(X_test)

clf.fit(X_train,y_train)

y_pred=clf.predict(X_test)

#Import scikit-learn metrics module for accuracy calculation

from sklearn import metrics

# Model Accuracy, how often is the classifier correct?

print("Accuracy:",metrics.accuracy_score(y_test, y_pred))

feature_imp = pd.Series(clf.feature_importances_,index=list(data.columns[:-
1])).sort_values(ascending=False).head(50)

feature_imp[::-1]

feature_imp2 =
pd.Series(clf2.feature_importances_,index=list(X_reduced.columns)).sort_values(asce
nding=False)

feature_imp2[::-1]

#looking how much percent each diseases having

data['prognosis'].value_counts(normalize = True)

Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
AML_lab[1] (1)
No ratings yet
AML_lab[1] (1)
14 pages
som
No ratings yet
som
19 pages
Machine
100% (1)
Machine
45 pages
AI ML - Cycle 2 Programs (1)
No ratings yet
AI ML - Cycle 2 Programs (1)
15 pages
SVM K NN MLP With Sklearn Jupyter NoteBo
No ratings yet
SVM K NN MLP With Sklearn Jupyter NoteBo
22 pages
ML Lab
No ratings yet
ML Lab
7 pages
Prathamesh KRAI
No ratings yet
Prathamesh KRAI
38 pages
Vertopal.com Experiment4
No ratings yet
Vertopal.com Experiment4
3 pages
Aiml 5-8
No ratings yet
Aiml 5-8
19 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Additional Program
No ratings yet
Additional Program
573 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Week 7 Laboratory Activity
No ratings yet
Week 7 Laboratory Activity
12 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
Code shabab error 7
No ratings yet
Code shabab error 7
5 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
SVM Implementation
No ratings yet
SVM Implementation
8 pages
Decision Tree (1)
No ratings yet
Decision Tree (1)
2 pages
Pytorch (Tabular) - Regression
No ratings yet
Pytorch (Tabular) - Regression
13 pages
B24 ML Exp-3
No ratings yet
B24 ML Exp-3
10 pages
ML_Lab_01999676272
No ratings yet
ML_Lab_01999676272
12 pages
Linear SVM: 'Target'
No ratings yet
Linear SVM: 'Target'
13 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
Maxbox - Starter67 Machine Learning
No ratings yet
Maxbox - Starter67 Machine Learning
7 pages
ML pdf
No ratings yet
ML pdf
30 pages
AML_code_for_m2
No ratings yet
AML_code_for_m2
7 pages
svmdoc
No ratings yet
svmdoc
7 pages
5) Randomforest - Ipynb - Colaboratory
No ratings yet
5) Randomforest - Ipynb - Colaboratory
12 pages
Coe Projects
No ratings yet
Coe Projects
7 pages
Data Science Practical
No ratings yet
Data Science Practical
22 pages
Mlda - Lab
No ratings yet
Mlda - Lab
35 pages
Recsify Technologies Assignment
No ratings yet
Recsify Technologies Assignment
10 pages
7CSE A1 IU2141230116 Kevin Mevada-Practical9
No ratings yet
7CSE A1 IU2141230116 Kevin Mevada-Practical9
3 pages
Slip
No ratings yet
Slip
5 pages
PDF To Jpeg
No ratings yet
PDF To Jpeg
7 pages
Data science and analtics Laboratory
No ratings yet
Data science and analtics Laboratory
21 pages
Setup: This Notebook Contains All The Sample Code and Solutions To The Exercises in Chapter 7
No ratings yet
Setup: This Notebook Contains All The Sample Code and Solutions To The Exercises in Chapter 7
23 pages
Final ML File
No ratings yet
Final ML File
34 pages
Random Forest 1 Image
No ratings yet
Random Forest 1 Image
5 pages
MACHINE LEARNING manual
No ratings yet
MACHINE LEARNING manual
36 pages
22MCA1008 - Varun ML LAB ASSIGNMENTS
100% (1)
22MCA1008 - Varun ML LAB ASSIGNMENTS
41 pages
PRJ-Parkinsons Disease Prediction
No ratings yet
PRJ-Parkinsons Disease Prediction
16 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
ML W8 Merged
No ratings yet
ML W8 Merged
27 pages
Import Library Python
No ratings yet
Import Library Python
10 pages
DM ML Practical
No ratings yet
DM ML Practical
13 pages
Module 4 - Supervised Learning - First ML Model
No ratings yet
Module 4 - Supervised Learning - First ML Model
23 pages
Roll NO 2020
No ratings yet
Roll NO 2020
8 pages
Data analytics
No ratings yet
Data analytics
10 pages
MLT_07
No ratings yet
MLT_07
8 pages
Online Payment Fraud Detection Using Machine Learning
No ratings yet
Online Payment Fraud Detection Using Machine Learning
2 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
MLfull
No ratings yet
MLfull
29 pages
ML 7
No ratings yet
ML 7
6 pages
NF Assighment4
No ratings yet
NF Assighment4
5 pages
Heart: Our "Goal" Predict The Presence of Heart Disease in The Patient
100% (1)
Heart: Our "Goal" Predict The Presence of Heart Disease in The Patient
73 pages
Title: Implement Support Vector Machine Classifier: Department of Computer Science and Engineering
No ratings yet
Title: Implement Support Vector Machine Classifier: Department of Computer Science and Engineering
5 pages
Udacity Machine Learning Analysis Supervised Learning
100% (1)
Udacity Machine Learning Analysis Supervised Learning
504 pages
Introduction to PHP, Part 2, Second Edition
From Everand
Introduction to PHP, Part 2, Second Edition
Adam Majczak
No ratings yet