Bienvenidos a este tutorial en el que aprenderemos a utilizar Python y la librería Pandas para el análisis de la evolución de los precios de las acciones en bolsa.
¿Qué es Pandas?
Pandas es una librería de código abierto para Python que nos permite el análisis y manipulación de datos de forma eficiente y rápida.
Instalación de Pandas
Para instalar Pandas en nuestra computadora, abrimos la terminal y ejecutamos el siguiente comando:
pip install pandas
Importando Pandas
Para poder utilizar Pandas en nuestro script de Python, primero debemos importarla. Lo hacemos de la siguiente manera:
import pandas as pd
Análisis de precios de acciones
Para el análisis de los precios de acciones, utilizaremos el paquete pandas-datareader. Este paquete nos permite hacer una consulta a una fuente de datos en línea y obtener los precios del histórico de una acción. Para instalarlo, ejecutamos el siguiente comando en la terminal:
pip install pandas-datareader
Importando pandas-datareader
Importamos pandas-datareader de la siguiente manera:
import pandas_datareader.data as web
Obteniendo los precios históricos de una acción
Para obtener los precios históricos de una acción, utilizamos la función DataReader()
de pandas-datareader. Esta función toma como argumentos el símbolo de la acción, la fuente de datos (en nuestro caso, Yahoo Finance), y las fechas de inicio y final para la consulta.
start = '2017-01-01'
end = '2017-12-31'
ticker = 'AAPL'
data = web.DataReader(ticker, 'yahoo', start, end)
Visualización de los precios históricos de una acción
Para visualizar los precios históricos de una acción, podemos utilizar la librería Matplotlib. Importamos Matplotlib de la siguiente manera:
import matplotlib.pyplot as plt
Y para hacer una visualización sencilla, utilizamos:
plt.plot(data['Close'])
plt.title('Precio de cierre de AAPL')
plt.xlabel('Fecha')
plt.ylabel('Precio')
Manipulación de datos con Pandas
Una de las principales ventajas de Pandas es la facilidad con la que podemos manipular y transformar los datos. A continuación, algunos ejemplos.
Seleccionando filas y columnas
Para seleccionar filas y columnas de un DataFrame de Pandas, utilizamos loc[]
. Por ejemplo, para seleccionar la columna del precio de cierre:
data['Close']
Y para seleccionar las filas entre las fechas 2017-01-01 y 2017-01-31:
data.loc['2017-01-01':'2017-01-31']
Calculando el retorno diario de una acción
Para calcular el retorno diario de una acción, utilizamos pct_change()
de Pandas.
data['Return'] = data['Close'].pct_change()
Calculando el retorno acumulado
Para calcular el retorno acumulado, utilizamos cumprod()
de Pandas.
data['Cumulative Return'] = (1 + data['Return']).cumprod()
Grupos y agregaciones
Para agrupar los datos por año y calcular la media del retorno anual, utilizamos:
annual_return = data['Return'].groupby(data.index.year).mean()
Y para visualizar los resultados:
plt.bar(annual_return.index, annual_return)
plt.title('Retorno anual promedio de AAPL')
plt.xlabel('Año')
plt.ylabel('Retorno')
A lo largo de este tutorial, hemos aprendido cómo utilizar Pandas para el análisis de la evolución de los precios de las acciones en bolsa. Con Pandas, podemos importar y manipular datos de forma eficiente, lo que nos permite hacer análisis más completos y precisos. Espero que este tutorial haya sido de utilidad para ustedes.