Visualización y Análisis de Datos Con Python

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 32

Visualización y Análisis

de Datos con Python


Juan Pablo Zaldumbide Proaño
Contenido
• Introducción.
• Instalación de herramientas.
• Lenguaje de programación Python.
• Uso y sintaxis, ejercicios varios.
• Escritura y lectura de archivos planos.
• Instalación de librerías externas.
• Carga de datos de diferentes fuentes y tipos.
• Uso de numpy, pandas y matplotlib.
• Visualización de datos
• Ejercicios
¿Qué lenguajes de programación conozco?
Python es un lenguaje de programación interpretado,
multiparadigma, multiplataforma, con una curva de
arpendizaje muy corta.

Diseñado por Guido van Rossum cuya primera versión


salió en el año 1991.
Características:
1.- Lenguaje de programación de alto nivel.
2.- Fácil de leer y entender.
3.- Lenguaje interpretado.
4.- Multiplataforma.
5.- Gratuito y de código abierto
Características:

6.- Multiparadigma.

Imperativo:
Los lenguajes de programación también se pueden agrupar en
imperativos y declarativos, los del primer grupo son aquellos
que describen el estado del programa y permiten su
modificación mediante condiciones o instrucciones de código
que le indican al computador cómo realizar una tarea.

Funcional:
La programación funcional es un paradigma de la
programación declarativa basada en el uso de funciones
matemáticas que permite la variación del programa mediante
la mutación de variables. Esto nos va a permitir operar con
datos de entrada y salida. Brindándole así la posibilidad al
usuario de ingresar datos que serán procesados para darnos
otros datos de salida.

Orientado a Objetos (POO)


7.- Es extensible, es decir puede interactuar con
otros lenguajes de programación tales como C,
java, etc.

8.- Gran cantidad de Librerías y Paquetes


adicionales.

9.- Varios IDE’s de desarrollo

10.- Bastante documentación


.
.
.
.
.
¿En qué podemos utilizar Python?
Instalación de
Herramientas
https://www.python.org/downloads/
Instalación Python:

https://www.python.org/downloads/release/python-376/
Instalación de IDE’s

https://www.jetbrains.com/pycharm/ https://www.anaconda.com/distribution/
pip3 install --upgrade pip

pip3 install jupyter

jupyter notebook

http://localhost:8888
Uso y sintaxis

Modo interactivo
Operadores aritméticos Operadores relacionales

Descripción Operador Ejemplo Descripción Operador Ejemplo


Suma + c=2+3 Igual == 2==3
Resta - c=2-3 Diferente != 2!=3
Multiplicación * c=2*3 Mayor > 2>3
División / c=2/3 Menor < 2<3
Potencia ** c=2**3 Mayor igual >= 2>=3
División entera // c=2//3 Menor igual <= 2<=3
Módulo % c=2%3
En cada caso, asignar el valor a una
variable y probar los comandos:
En cada caso, probar los comandos:
print(c) print(c)
type(c) type(c)
Operadores lógicos

>>> True and True >>> True or True >>> not True
True True False
>>> True and False >>> True or False >>> not False
False True True
>>> False and True >>> False or True
False True
>>> False and False >>> False or False
False False

Verificar los resultados: Python permite encadenar varias comparaciones y el


>>> 3 > 2 resultado será verdadero si y sólo si todas las
>>> 3 < 2 comparaciones lo son.
>>> 2 >= 1 + 1 >>> 4 == 3 + 1 > 2
>>> 4 - 2 <= 1 True
>>> 2 == 1 + 1 >>> 2 != 1 + 1 > 0
>>> 6 / 2 != 3 False
Ingreso de datos:
Para introducir una cadena: Escribir un programa que pida al usuario su
cadena = input(“Introduce una cadena de texto: “) peso (en kg) y estatura (en metros), calcule el
print (“La cadena que ingreso es:\n”,cadena) índice de masa corporal y lo almacene en
una variable, muestre por pantalla la frase:
Para introducir un int:
numero = int(input(“Introduce un numero: “)) “Tu índice de masa corporal es <imc>”
print (“El valor que ingreso es:\n”,numero)
Donde <imc> es el índice de masa corporal
Para introducir un float: calculado redondeado con dos decimales.
numero = float(input(“Introduce un numero: “))
print (“El valor que ingreso es:\n”,numero)

Para redondear utilice la función round:


>>>x = round(5.76543, 2)
>>>print(x)
>>>5.77
Strings
El método count() retorna el número
de veces que se repite un conjunto de
caracteres especificado. >>> s = "Hola mundo"
>>> s.startswith("Hola")
>>> s = "Hola mundo" True
>>> s.count("Hola") >>> s.endswith("mundo")
1 True
>>> s.endswith("world")

El método find() retorna la ubicación


(comenzando desde el cero) en la que
se encuentra el argumento indicado.
rfind()
>>> s.find("mundo")
Cadenas
Subindices y subcadenas
Dada la cadena:
>>> palabra='Python'
>>> palabra[:2] # caracteres desde el principio hasta la posición 2 (excluída)
'Py'
>>> palabra[4:] # caracterrs desde la posición 4 (incluída) hasta el final
'on'
>>> palabra[-2:] # caracteres desde la ante-última (incluída)hasta el final
'on'

Las cadenas de Python no pueden ser modificadas – son immutables

>>>palabra[0] = 'J'
Probar los siguientes ejercicios y verificar su salida:
>>> cadena.replace("Hola", "Adiós")
>>> cadena = " esta cadena tiene espacios a los lados "
>>> cadena.strip()
>>> cadena.lstrip()
>>> cadena.rstrip()

>>> print(cadena.upper())
>>> print(cadena.lower())
>>> cadena.capitalize()

>>> nombres = "Carlos|Cristina|Rodrigo|Hugo"


>>> nombres.split("|")

>>> caracter = "|"


>>> nombres2 = ["Carlos", "Cristina", "Rodrigo", "Hugo"]
>>> print (caracter.join(nombres2) )
Listas
>>> cuadrados = [1, 4, 9, 16, 25] A diferencia de las cadenas de texto, que son immutable, las
>>> cuadrados listas son un tipo mutable, es posible cambiar un su contenido:

>>> cuadrados[-1] >>> cubos = [1, 8, 27, 65, 125] # algo anda mal
>>> cuadrados[-3:] >>> 4 ** 3 # el cubo de 4 es 64, no 65!
64
>>> cubos[3] = 64 # reemplazar el valor incorrecto
>>> cubos
[1, 8, 27, 64, 125]
También se puede agregar nuevos ítems al final de la lista, usando el método append() :

>>> cubos.append(216) # agregar el cubo de 6


>>> cubos.append(7 ** 3) # y el cubo de 7

>>> cubos
[1, 8, 27, 64, 125, 216, 343]

Es posible anidar listas:


>>> a = ['a', 'b', 'c']
>>> n = [1, 2, 3]
>>> x = [a, n]

>>> x [['a', 'b', 'c'], [1, 2, 3]]


>>> x[0]
['a', 'b', 'c']
>>> x[0][1]
'b'
Conjuntos
>>> canasta = {'manzana', 'naranja', 'manzana', 'pera', 'naranja', 'banana'}
>>> print (canasta) # muestra que se removieron los duplicados
{'pera', 'manzana', 'banana', 'naranja'}
>>> 'naranja' in canasta # verificación de pertenencia rápida
True
>>> 'yerba' in canasta
False
Diccionarios
Un diccionario es un conjunto no ordenado de pares clave: valor,
con el requerimiento de que las claves sean únicas.
>>>tel={'Pedro':4098,'Luis':4139}
>>>tel['Juan']=4127
>>>tel
{'Luis':4139,'Pedro':4098,'Juan':4127}
>>>tel['Pedro']
4098
>>>deltel['Luis']
>>>tel['Lili']=4127
>>>tel
{'Pedro':4098,'Lili':4127,'Juan':4127}
>>>list(tel.keys())
['Lili','Juan','Pedro']
>>>sorted(tel.keys())
['Juan','Lili','Pedro']
>>>'Juan' in tel
True
>>>'Pedro' not intel
False
Funciones
Manejo de Archivos
def leertxt():
def creartxt():
archi=open('datos.txt','r')
archi=open('datos.txt','w')
linea=archi.readline()
archi.close()
while linea!="":
def grabartxt():
print (linea)
archi=open('datos.txt','a')
linea=archi.readline()
archi.write('Linea 1\n')
archi.close()
archi.write('Linea 2\n')
archi.write('Linea 3\n')
archi.close()

def leertxtenlista():
creartxt()
archi=open('datos.txt','r')
grabartxt()
lineas=archi.readlines()
print (lineas)
archi.close()
Ejercicio
El objetivo es contar el número de ocurrencias de las palabras en un archivo de texto.
El resultado final deberá ser similar a:

(harry,250)
(potter,153)
(niño,48 )

Realizarlo en las parejas asignadas por el instructor.y compartir su solución a


juan.zaldumbide@epn.edu.ec

También podría gustarte