Página principal www.cide.edu
      Principal      Contáctenos      Quiénes somos      Términos y condiciones      Mis órdenes       Ver carrito English  
   Diplomados   
   Cursos   
   Seminarios   
   Conferencias   
   Educación a Distancia   
BÚSQUEDAS
SEGURIDAD
    
 
     

 Agregar al Carrito
Nombre/Título
Curso Análisis de dato con Python
Coordinador
Laboratorio Nacional de Políticas Públicas
Código
0218-1098
Precio
$  6,500.00 mxp
   

 

Análisis de dato con Python

(Del 14 de agosto al 6 de septiembre)

Introducción

Python es el lenguaje más popular para hacer ciencia de datos. Sus múltiples librerías permiten llevar a cabo todo el proceso de obtención, limpieza, análisis y visualización de datos de una manera muy eficiente. Además, es gratis y muy fácil e intuitivo de aprender.

En este curso vamos a conocer Python y a empezar a programar desde cero en este lenguaje que puede abrir muchas oportunidades en tu carrera. Específicamente aprenderemos a usar las librerías más populares para las tareas de manejo y visualización de datos, no solo numéricos, sino también de datos geográficos y de texto.

Objetivos

El objetivo del curso es aprender a usar Python para el manejo y visualización de datos. Específicamente, los objetivos del curso son aprender a:

  • Hacer operaciones básicas de manejo de bases de datos.
  • Hacer el pre procesamiento y limpieza de variables.
  • Elaborar gráficas estáticas e interactivas.
  • Realizar operaciones básicas de manejo de datos geoespaciales.
  • Hacer procesamiento básico de texto para su análisis.

Dirigido a

Cualquier profesional interesado en ciencia de datos.

Conocimientos previos

Preferentemente con experiencia en análisis de datos y algún software para manejo de bases de datos (R, Stata, Excel, etc).

Temario

1. Introducción básica a Python:

En esta sesión veremos lo fundamental para empezar a programar en Python desde cero.

· ¿Qué es?

· ¿qué se puede hacer en Python?

· Ejemplos de aplicaciones

· Cómo instalar Python y sus paquetes

· Jupyter notebooks

· Tipos de datos: str, int, float

· Funciones built-in básicas: print(), type(), len(), range(),

· Estructuras de datos en Python: Tuplas, Listas, Diccionarios, Conjuntos, Arrays, DataFrames

2. Introducción intermedia a Python:

En esta sesión seguiremos aprendiendo a programar en Python utilizando las estructuras de control -que nos permiten automatizar y controlar procesos repetitivos- y también veremos cómo crear nuestras propias funciones y comandos.

· Estructuras de control en Python: for, while, if, else, elif, whit

· Listas y diccionarios por comprensión

· Funciones

· Clases y métodos

3. Manejo de datos en Pandas I

Pandas es la librería más popular de Python para el manejo datos. Es sencilla y muy completa. En esta sesión aprenderemos desde cómo leer los archivos con datos, pasando por cómo crear y transformar variables, reestructurar la base de datos, resumir la información y finalmente exportar a otros formatos los datos.

· DataFrames y Series

· Leer datos de diferentes fuentes (csv, Excel, stata, spss, internet)

· Filtro de variables y valores

· Consultas

· Crear variables

· Renombrar variables

· Reemplazar valores

· Reestructurar (pivot, melt)

· Transformación de variables

· Resumir información (summary)

· Unir bases de datos.

· Exportar los datos.

4. Manejo de datos en Pandas II

En esta sesión veremos algunas funcionalidades más avanzadas de Pandas.

· Agrupar y agregar datos

· Multindex

· Manejo de variables de tiempo

· Missing Values

· Duplicados

· Aplicar funciones

· Variables dummies

· Outliers

5. Gráficas con MatplotLib, Seaborn y Bokeh

En esta sesión exploraremos las librerías más populares de Python para elaborar gráficas. Haremos desde las gráficas más básicas hasta gráficas interactivas que responden a las selecciones de los usuarios.

· Gráficas en Matplotlib

· Propiedades de las gráficas

· Múltiples gráficas

· Gráficas en Seaborn

· Gráficas interactivas con Bokeh

6. Manejo de datos espaciales con GeoPandas

GeoPandas hace muy fácil el manejo y la visualización de datos geográficos. En esta sesión aprenderemos cómo usar la información geográfica para enriquecer el análisis de datos.

· Instalación

· Estructuras de datos de GeoPandas

· Lectura de datos espaciales

· Operaciones geométricas

· Uniones de bases datos

· Uniones espaciales

· Geocodificación

· Mapas

7. Manejo de texto

En esta sesión aprenderemos los fundamentos del procesamiento de texto para su análisis. Veremos cómo pre procesar y limpiar el texto, cómo usar expresiones regulares y algunos análisis básicos de analítica de texto.

· Funciones built-in de los strings

· Expresiones regulares

· Métodos para variables string en Pandas

· Lectura de archivos de texto

· NLTK

· Tokenización

· Lematización

· Ngrams

· Medidas de similitud

· Conteo de frecuencias

8. Otras utilidades de Python para el análisis de datos

Estas son utilidades varias que nos ayudan en tareas cotidianas del manejo de datos.

· Librerías para manejar fechas y tiempo.

· Librerías para obtener datos de APIS.

· Introducción a Numpy y la vectorización.

Bibliografía

1. McKinney, W. (2012). Python for data analysis: Data wrangling with Pandas, NumPy, and IPython. " O'Reilly Media, Inc.".

2. Automate the Boring Stuff with Python. Libro en línea disponible en: https://automatetheboringstuff.com/

3. Bird, S., Klein, E., & Loper, E. (2009). Natural language processing with Python: analyzing text with the natural language toolkit. " O'Reilly Media, Inc.". Disponible en : http://www.nltk.org/book/

PROFESOR

Juan Javier Santos Ochoa

E-mail: juan.santos@cide.edu

HORARIO DE CLASES

El curso tendrá una duración total de 24 horas. 8 sesiones de 3 horas.

Martes y jueves de 18:00 a 21:00 horas (14,16,21,23,28,30 de agosto 4 y 6 de septiembre)

LUGAR: Teatro de Decisiones del LNPP, CIDE.


Requisitos de Admisión:

Para ser admitido como alumno de nuevo ingreso al programa de Educación Continua, el solicitante debe satisfacer los siguientes requisitos:

  • Copia de identificación oficial con fotografía.

Precio y formas de pago:

Los participantes deberán cubrir una colegiatura de $6,500.00 (seis mil quinientos pesos 00/100 m.n.) por cada curso, la cual deberá ser cubierta en una sola exhibición, a pagar al momento de la inscripción en línea. Bajo ninguna circunstancia se otorgarán prórrogas para el pago de cuotas. Las inscripciones se cierran el primer día del curso.

El depósito o transferencia bancaria se deberá hacer al banco HSBC a nombre de Centro de Investigación y Docencia Económicas, A. C. a la cuenta número: 4039603584, sucursal número 0763 (Lilas), CLABE: 021180040396035842.

Estacionamiento:

Los participantes de la Escuela de Métodos tendrán acceso al estacionamiento del CIDE.

Mayores informes:

Maricarmen García Hernández

Tel. (55) 5727 9800 ext. 2465

maricarmen.garcia@cide.edu



 


                   
 
Principal  |  Quiénes somos  |  Contáctenos  |  Términos y condiciones  |  Mi depósito

Comercio Electronico seo vender por internet y cobros en linea  www.comercio-online.com.mx hospedaje web México

tiendas online