# API configuration (mostrado solo con fines educativos al ser en local; no usar en producción)
BASE_URL = "http://localhost/api"
API_KEY = "9b3e7f0a6e1c4d2b8f9a0c7e5d4b3a21"

PAGE_SIZE = 5000

ORDERS_FILE = "data/orders.json"
LINES_FILE = "data/order_lines.json"
CUSTOMERS_FILE = "data/customers.json"

# Función para  persistencia, guarda datos en un archivo JSON
import os
import json

def guardar_json(ruta, datos):
    os.makedirs(os.path.dirname(ruta), exist_ok=True)
    with open(ruta, "w", encoding="utf-8") as f:
        json.dump(datos, f, ensure_ascii=False, indent=4)

# Módulo necesario para realizar solicitudes a la API de PrestaShop
import requests

def update_orders():
    """
    Descarga todos los pedidos desde la API de PrestaShop
    y los guarda en un archivo JSON para su posterior análisis
    con pandas.
    """
    pedidos = []
    offset = 0

    while True:
        response = requests.get(
            f"{BASE_URL}/orders",
            auth=(API_KEY, ""),
            params={
                "display": "[id,id_customer,total_paid,date_add]",
                "limit": f"{offset},{PAGE_SIZE}",
                "output_format": "JSON",
            },
            timeout=30,
        )
        response.raise_for_status()
        json_data = response.json()

        # PrestaShop puede devolver lista o diccionario según versión/configuración
        if isinstance(json_data, dict):
            data = json_data.get("orders", [])
        else:
            data = json_data

        if not data:
            break

        pedidos.extend(data)
        offset += PAGE_SIZE

    guardar_json(ORDERS_FILE, pedidos)

def update_order_lines():
    """
    Descarga todas las lineas de pedidos desde la API de PrestaShop
    y los guarda en un archivo JSON para su posterior análisis
    con pandas.
    """

    lineas = []
    offset = 0

    while True:
        response = requests.get(
            f"{BASE_URL}/order_details",
            auth=(API_KEY, ""),
            params={
                "display": "[id,id_order,product_id,product_name,product_quantity,total_price_tax_incl]",
                "limit": f"{offset},{PAGE_SIZE}",
                "output_format": "JSON",
            },
            timeout=30,
        )
        response.raise_for_status()

        json_data = response.json()

        # PrestaShop puede devolver lista o diccionario según versión/configuración
        if isinstance(json_data, dict):
            data = json_data.get("order_details", [])
        else:
            data = json_data

        if not data:
            break

        lineas.extend(data)

        offset += PAGE_SIZE


    guardar_json( LINES_FILE, lineas)

def update_customers():
    """
    Descarga todos los pedidos desde la API de PrestaShop
    y los guarda en un archivo JSON para su posterior análisis
    con pandas.
    """

    clientes = []
    offset = 0

    while True:
        response = requests.get(
            f"{BASE_URL}/customers",
            auth=(API_KEY, ""),
            params={
                "display": "[id,firstname,lastname,email,date_add]",
                "limit": f"{offset},{PAGE_SIZE}",
                "output_format": "JSON",
            },
            timeout=30,
        )
        response.raise_for_status()

        json_data = response.json()

        # PrestaShop puede devolver lista o diccionario según versión/configuración
        if isinstance(json_data, dict):
            data = json_data.get("customers", [])
        else:
            data = json_data

        if not data:
            break

        clientes.extend(data)
        
        offset += PAGE_SIZE

 
    guardar_json(CUSTOMERS_FILE, clientes)

# Para no llamar a la API por error cada vez que ejecutamos el cuaderno debemos comentar siempre una linea para que funcione
ACTUALIZAR_DATOS = True
ACTUALIZAR_DATOS = False

if ACTUALIZAR_DATOS:
    update_orders()
    update_order_lines()
    update_customers()

import pandas as pd
import matplotlib.pyplot as plt

orders = pd.read_json("data/orders.json")
order_lines = pd.read_json("data/order_lines.json")
customers = pd.read_json("data/customers.json")

orders.head()

orders["date_add"] = pd.to_datetime(orders["date_add"])
orders["total_paid"] = orders["total_paid"].astype(float)

order_lines["product_quantity"] = order_lines["product_quantity"].astype(int)
order_lines["total_price_tax_incl"] = order_lines["total_price_tax_incl"].astype(float)
customers["date_add"] = pd.to_datetime(customers["date_add"])

#Eliminamos la fecha de creación del cliente que no es necesaria para el análisis
customers_reduced = customers[[
    "id",
    #"firstname",
    # "lastname",
    # "email"
]].rename(columns={"id": "id_customer"})
# Para no mostrar datos privados de los clientes vamos a anonimizar nombres con fines didácticos evitando cargar o mostrar datos reales
customers_reduced["customer_name"] = (
    "Cliente_" + customers_reduced["id_customer"].astype(str)
)
orders_clientes = orders.merge(
    customers_reduced,
    on="id_customer",
    how="left"
)

orders_clientes.head()

orders_clientes["month"] = orders_clientes["date_add"].dt.to_period("M")

ventas_historicas_por_mes = (
    orders_clientes.groupby("month")["total_paid"]
    .sum()
    .sort_index()
)

ventas_historicas_por_mes

month
2012-08       170.4100
2012-09       565.3800
2012-10      2389.4500
2012-11      2199.5500
2012-12      1809.3600
              ...     
2020-03     80415.1478
2020-04    114321.6605
2020-05    146925.1954
2020-06     13659.3394
2020-07        84.0200
Freq: M, Name: total_paid, Length: 96, dtype: float64

ventas_historicas_por_mes.plot(kind="bar",figsize=(12,6))
plt.title("Ventas por mes")
plt.ylabel("Importe total")
plt.xlabel("Mes")
plt.xticks(fontsize=6, rotation=70, ha="right")
plt.tight_layout()
plt.show()

import locale
locale.setlocale(locale.LC_TIME, "es_ES.UTF-8")

orders_clientes["month_name"] = orders_clientes["date_add"].dt.strftime("%B")

ventas_por_meses = (
    orders_clientes
    .groupby("month_name")["total_paid"]
    .sum()
    .reindex([
        "enero", "febrero", "marzo", "abril", "mayo", "junio",
        "julio", "agosto", "septiembre", "octubre", "noviembre", "diciembre"
    ])
)

ventas_por_meses

month_name
enero         277833.9956
febrero       302343.6328
marzo         325004.6032
abril         371851.4248
mayo          414629.9361
junio         300309.3881
julio         322660.6206
agosto        357346.0203
septiembre    423996.6698
octubre       360795.5293
noviembre     401056.0627
diciembre     267391.8702
Name: total_paid, dtype: float64

ax = ventas_por_meses.plot(kind="bar", figsize=(10, 4))

media = ventas_por_meses.mean()
ax.axhline(media, linestyle="--")
ventas_por_meses.plot(
    kind="line",
    ax=ax,
    marker="o"
)
ax.set_title("Ventas por mes con media anual")
ax.set_ylabel("Importe total")

plt.show()

productos_mas_vendidos = (
    order_lines.groupby("product_name")["product_quantity"]
    .sum()
    .sort_values(ascending=False)
)
print (productos_mas_vendidos.head(10))
top_productos = productos_mas_vendidos.head(10).index

product_name
Frasco de vidrio para Miel 1 Kg Celdillas - Formato : Pack                                                                           6347
Grapas metálicas Inox de agarre para envases modelos Weck  - Formato : Pack                                                          4446
Separador de plástico                                                                                                                3631
TAPONES PLÁSTICO PARA ENTRETAPAS                                                                                                     3573
Tapas metálicas para frascos Diámetro: 77 mm - Color : Blanca, Formato : Pack, Tipo de compuesto (cocción) : Esterilizable (121º)    3248
Tapas metálicas para frascos Diámetro: 77 mm - Color : Blanca, Formato : Pack, Tipo de cocción : Pasteurizable (100º)                2947
Tapas metálicas para frascos Diámetro: 63 mm - Color : Blanca, Formato : Pack, Tipo de compuesto (cocción) : Esterilizable (121º)    2920
Botella "verano"                                                                                                                     2796
Tapa metálica para frascos Diámetro: 43 mm - Color : Dorada, Formato : Pack, Tipo de cocción : Pasteurizable (100º)                  2725
Tapas metálicas para frascos Diámetro: 66 mm - Color : Negra, Formato : Pack, Tipo de cocción : Pasteurizable (100º)                 2669
Name: product_quantity, dtype: int64

# Fecha del pedido para cada línea
ventas_producto_mes = (
    order_lines
    .merge(
        orders[["id", "date_add"]],
        left_on="id_order",
        right_on="id"
    )
)

ventas_producto_mes["month"] = ventas_producto_mes["date_add"].dt.month_name()

# Agrupamos por producto y mes
ventas_top = (
    ventas_producto_mes[
        ventas_producto_mes["product_name"].isin(top_productos)
    ]
    .groupby(["product_name", "month"])["product_quantity"]
    .sum()
    .reset_index()
)

# Analizamos el producto más vendido para ver su estacionalidad de manera directa
producto = top_productos[0]

datos_producto = ventas_top[ventas_top["product_name"] == producto]

plt.figure()
plt.bar(datos_producto["month"], datos_producto["product_quantity"])
plt.title(f"Estacionalidad del producto: {producto}")
plt.xticks(rotation=45)
plt.show()

coef_variacion = (
    ventas_top
    .groupby("product_name")["product_quantity"]
    .std()
    /
    ventas_top.groupby("product_name")["product_quantity"].mean()
)
coef_variacion.sort_values(ascending=False)

product_name
Botella "verano"                                                                                                                     1.133645
TAPONES PLÁSTICO PARA ENTRETAPAS                                                                                                     1.094625
Separador de plástico                                                                                                                0.982422
Tapas metálicas para frascos Diámetro: 77 mm - Color : Blanca, Formato : Pack, Tipo de cocción : Pasteurizable (100º)                0.915096
Tapas metálicas para frascos Diámetro: 77 mm - Color : Blanca, Formato : Pack, Tipo de compuesto (cocción) : Esterilizable (121º)    0.699183
Tapa metálica para frascos Diámetro: 43 mm - Color : Dorada, Formato : Pack, Tipo de cocción : Pasteurizable (100º)                  0.553464
Frasco de vidrio para Miel 1 Kg Celdillas - Formato : Pack                                                                           0.519135
Tapas metálicas para frascos Diámetro: 63 mm - Color : Blanca, Formato : Pack, Tipo de compuesto (cocción) : Esterilizable (121º)    0.512163
Grapas metálicas Inox de agarre para envases modelos Weck  - Formato : Pack                                                          0.408615
Tapas metálicas para frascos Diámetro: 66 mm - Color : Negra, Formato : Pack, Tipo de cocción : Pasteurizable (100º)                 0.281390
Name: product_quantity, dtype: float64

# Fecha máxima del dataset (referencia temporal)
now = orders_clientes["date_add"].max() + pd.Timedelta(days=1)

# Acotamos a los últimos 24 meses
fecha_corte = now - pd.DateOffset(months=24)

orders_filtrados = orders_clientes[
    orders_clientes["date_add"] >= fecha_corte
]

# Nos quedamos solo con clientes con al menos 2 pedidos
orders_filtrados = (
    orders_filtrados
    .groupby("id_customer")
    .filter(lambda x: len(x) >= 2)
)

rfm = (
    orders_filtrados
    .groupby("id_customer")
    .agg({
        "date_add": lambda x: (now - x.max()).days,  # Recencia
        "id": "count",                               # Frecuencia
        "total_paid": "sum",                         # Valor monetario
        "customer_name": "first"                     # Identificador anónimo
    })
    .rename(columns={
        "date_add": "recency",
        "id": "frequency",
        "total_paid": "monetary",
    })
)

rfm.sort_values("monetary", ascending=False).head(10)

vip_dormidos = rfm[
    (rfm["frequency"] > rfm["frequency"].quantile(0.75)) &
    (rfm["monetary"] > rfm["monetary"].quantile(0.75)) &
    (rfm["recency"] > rfm["recency"].quantile(0.75))
]

vip_dormidos.sort_values("monetary", ascending=False).head()

clientes_en_riesgo = rfm[
    (rfm["frequency"] > rfm["frequency"].quantile(0.50)) &
    (rfm["monetary"] > rfm["monetary"].quantile(0.50)) &
    (rfm["recency"] > rfm["recency"].quantile(0.75))
]

clientes_en_riesgo.sort_values("recency", ascending=False).head()

nuevos_prometedores = rfm[
    (rfm["recency"] <= rfm["recency"].quantile(0.25)) &
    (rfm["frequency"] <= rfm["frequency"].quantile(0.50)) &
    (rfm["monetary"] > rfm["monetary"].quantile(0.50))
]

nuevos_prometedores.sort_values("monetary", ascending=False).head()

plt.figure(figsize=(8,6))
plt.scatter(rfm["recency"], rfm["monetary"], alpha=0.5)

plt.xlabel("Recency (días desde última compra)")
plt.ylabel("Monetary (gasto total)")
plt.title("Distribución de clientes según Recencia y Valor")

plt.show()

	id	id_customer	date_add	total_paid
0	3	5	2012-08-21 15:07:58	42.43
1	5	7	2012-08-28 12:17:24	35.42
2	6	8	2012-08-28 13:37:23	92.56
3	7	10	2012-09-02 01:41:03	32.56
4	9	12	2012-09-06 16:45:00	57.84

	id	id_customer	date_add	total_paid	customer_name
0	3	5	2012-08-21 15:07:58	42.43	Cliente_5
1	5	7	2012-08-28 12:17:24	35.42	Cliente_7
2	6	8	2012-08-28 13:37:23	92.56	Cliente_8
3	7	10	2012-09-02 01:41:03	32.56	Cliente_10
4	9	12	2012-09-06 16:45:00	57.84	Cliente_12

	recency	frequency	monetary	customer_name
id_customer
26404	40	53	14368.0763	Cliente_26404
11920	215	31	13657.4955	Cliente_11920
9752	35	113	12242.5257	Cliente_9752
22938	120	49	7789.9800	Cliente_22938
5851	154	25	7570.3767	Cliente_5851
18167	40	66	6105.3909	Cliente_18167
17435	56	24	5669.9733	Cliente_17435
352	134	13	5385.7876	Cliente_352
29141	69	17	4930.1333	Cliente_29141
35189	214	3	4755.7968	Cliente_35189

	recency	frequency	monetary	customer_name
id_customer
23872	652	6	3741.6922	Cliente_23872
12301	441	18	2413.6400	Cliente_12301
21814	435	19	2139.8174	Cliente_21814
16265	386	5	1925.4252	Cliente_16265
22042	704	7	1881.8125	Cliente_22042

	recency	frequency	monetary	customer_name
id_customer
22515	714	3	278.2167	Cliente_22515
22042	704	7	1881.8125	Cliente_22042
19449	700	3	157.8504	Cliente_19449
22436	691	3	218.2864	Cliente_22436
4781	690	3	313.1370	Cliente_4781

Análisis de ventas con PrestaShop y pandas¶

A. Extracción de archivos mediante API PrestaShop¶

1. Uso de ficheros JSON en lugar de consulta directa a la API¶

Pandas no está diseñado para consumir APIs REST complejas¶

Rendimiento y estabilidad¶

Función de persistencia de datos en formato JSON¶

¿Qué hace la función?¶

¿Por qué JSON?¶

Extracción de datos desde la API de PrestaShop¶

Funcionamiento común de las funciones de descarga¶

Nota sobre el formato de respuesta de la API¶

B. Análisis de datos (ventas y pedidos)¶

Carga de librerías y datos¶

Preparación y limpieza de datos¶

Cruce de pedidos con clientes¶

1. ¿Cual es la trayectoria de la tienda cronológicamente?¶

Conclusiones sobre la evolución temporal de las ventas¶

2 ¿Las ventas son estacionales?¶

3. Productos más vendidos¶

4. Estacionalidad de productos¶

Lectura del conjunto de productos¶

1. Productos extremadamente estacionales (CV > 1)¶

2. Productos claramente estacionales (0.7 < CV < 1)¶

3. Productos base con estacionalidad moderada (0.5 < CV < 0.7)¶

4. Productos muy estables (CV < 0.4)¶

Insight de negocio clave¶

C. Análisis de clientes RFM (Recencia, Frecuencia, Valor Monetario)¶

1. Clientes VIP inactivos¶

2. Clientes en riesgo¶

3. Nuevos prometedores¶

4. Grafico de clientes¶

Conclusiones¶

	recency	frequency	monetary	customer_name
id_customer
28610	73	2	1268.2358	Cliente_28610
20029	85	2	732.4531	Cliente_20029
18000	46	2	699.5815	Cliente_18000
37098	116	2	667.2578	Cliente_37098
20626	87	2	650.6790	Cliente_20626