Regresión Logistica
Regresión Logistica
Regresión Logistica
Reporte de práctica
1
Código entrenar un modelo con una regresión polinómica
con el dataset del para estimar el precio de venta de carros
# -* - coding : utf - 8 -* -
"""
@author : Izmael Guzman Murguia
"""
import pandas as pd
import numpy as np
from sklearn import metrics
import matplotlib . pyplot as plt
from sklearn . preprocessing import P o l y n o m i a l F e a t u r e s
from sklearn . linear_model import L i n e a r R e g r e s si o n
from sklearn . mo de l _s el ec t io n import t r ai n _ t e s t _ s p l i t
df = pd . read_csv ( ’/ content / drive / MyDrive / Colab Notebooks / IA / car_data . csv ’)
# nos dice las c o l u m n a s , cuantos , tipo de dato
df . info ()
# datos e s t a d i s t i c o s
print ( df . describe () )
# las p r i m e r a s filas
print ( df . head () )
df . info ()
y = df [ ’ Selling_Price ’]
X = df . drop ( columns = [ ’ Car_Name ’ , ’ Selling_Price ’] )
# Fiting
lin_reg = L i n e a r R e g re s s i o n ()
lin_reg . fit ( X_train_poly , y_train )
2
print ( " \ n \ n \ n * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * " )
print ( " *\ tPrecicion model : " , lin_reg . score ( X_train_poly , y_train ) ," \ t * " )
print ( " *\ tDegree : " ,deg , " \ t \ t \ t \ t * " )
print ( " *\ tCreated by : Izmael Guzman Murguia \ t * " )
print ( " * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * " )
3
Resultados
4
Código Aplicar regresión logı́stica para estimar la proba-
bilidad de que alguien tenga cáncer de mama o no (aquı́
la salida y es ”diagnosis”, y hay que tener cuidado con las
columnas que no aportan información como por ejemplo id)
# import the l i b r e r i e s
import pandas as pd
from sklearn . metrics import accu racy_sco re
from sklearn . mo de l _s el ec t io n import t r ai n _ t e s t _ s p l i t
from sklearn . linear_model import L o g i s t i c R e g r e s s i o n
import matplotlib . pyplot as plt
import numpy as np
from sklearn . pipeline import Pipeline
# Show general r e g i s t e r s
df . info ()
df . info ()
# S e l e c t i o n of input values
X = df . iloc [ : ,2 : 31 ]
# R e g r e s i o n model l o g i s t i c
lr = L o g i s t i c R e g r e s s i o n ()
model = lr . fit ( X_train , y_train )
5
# draw the image
# plt . figure ( ’ p r o b a b i l i d a d ’)
# g = X_test
# p r e d i c t i o n = model . p r e d i c t _ p r o b a ( g )
# p r e d i c t i o n 1 = model . predict ( g )
# plt . plot ( X_train , y_train , ’. b ’)
# plt . plot ( X_test , y_test , ’. r ’)
# plt . xlabel ( ’ Glucose ’)
# plt . ylabel ( ’ Outcome ’)
# plt . plot (g , prediction1 ," - -")
# # Crear modelo y e n t r e n a r
# models = P i p e l i n e ([
# ( ’ scaler ’, S t a n d a r d S c a l e r () ) ,
# ( ’ logit ’, L o g i s t i c R e g r e s s i o n ( solver = ’ lbfgs ’) ) ])
# models . fit ( X_train , y_train )
# # C a l c u l a r Score
# print ( ’ Train : ’, models . score ( X_train , y_train ) )
# print ( ’ Test : ’, models . score ( X_test , y_test ) )
6
Resultados
7
Código y lo mismo para saber si padece del corazón (para
este la salida es la columna de ”target”)
# import the l i b r e r i e s
import pandas as pd
from sklearn . metrics import accu racy_sco re
from sklearn . mo de l _s el ec t io n import t r ai n _ t e s t _ s p l i t
from sklearn . linear_model import L o g i s t i c R e g r e s s i o n
import matplotlib . pyplot as plt
import numpy as np
from sklearn . pipeline import Pipeline
from sklearn . metrics import accu racy_sco re
# Show general r e g i s t e r s
# df . info ()
8
min = np . amin ( cpf )
print ( " Min : " , min / 2 )
df [ ’ restecg ’] . replace ( to_replace =0 , value = min /2 , inplace = True )
print ( df )
9
df . info ()
# Select the Y value
y = df . iloc [ : , 13 ]
# S e l e c t i o n of the X values
X = df . iloc [ : ,0 : 12 ]
# df . head ()
# R e g r e s s i o n model
lr = L o g i s t i c R e g r e s s i o n ()
model = lr . fit ( X_train , y_train )
10
Resultados
11
Conclusión
Cuando tratamos de aplicar algoritmos de inteligencia artificial hay que cuidar aspectos como la
información que en realidad es útil, un claro ejemplo de la información que no es útil es los ids que
en la mayorı́a de los casos son números consecutivos para indicar el registro, también debemos
considerar que los datos sean de tipo numérico por lo que será de utilidad hacer uso de librerı́as
que nos permitan reemplazar ciertos caracteres por valores numéricos, asimismo es necesario
verificar que no existan valores nulos en algún campo ya que nos podrı́a ocasionar un error, por
último a la hora de graficar un problema donde tenemos varias variables de entrada es un poco
complicado, a esto se le llama multidimensional, en algunos casos como los unidimensionales o
bidimensionales si que es sencillo graficar ya que contamos con modelos 2D y 3D que podemos
observar y analizar sin ningún problema, sin embargo cuando las variables son demasiadas las
cosas se complican.
12