Pybonacci: Ajuste e interpolación unidimensionales básicos en Python con SciPy

Introducción

En este artículo vamos a ver una introducción a cómo hacer ajustes e interpolaciones en Python utilizando NumPy y los módulos interpolate y optimize de SciPy.

Ajustes de curvas e interpolaciones son dos tareas básicas que realizaremos con mucha frecuencia. Por ejemplo, cuando recojamos los datos de un experimento: sabemos que se tienen que comportar como una parábola, pero obviamente por errores de medición u otro tipo no obtenemos una parábola exactamente. En este caso necesitaremos realizar un ajuste de los datos, conocido el modelo (una curva de segundo grado en este caso).

En otras ocasiones dispondremos de una serie de puntos y querremos construir una curva que pase por todos ellos. En este caso lo que queremos es realizar una interpolación: si tenemos pocos puntos podremos usar un polinomio, y en caso contrario habrá que usar trazadores (splines en inglés). Vamos a empezar por este último método.

Si deseas consultar el código completo (incluyendo el que genera las figuras) puedes ver el notebook que usé para redactar el artículo.

En esta entrada se han usado python 3.3.2, numpy 1.7.1, scipy 0.12.0 y matplotlib 1.3.0.

Interpolación

Polinomios no, ¡gracias!

Lo primero que vamos a hacer va a ser desterrar la idea de que, sea cual sea el número de puntos que tengamos, podemos construir un polinomio que pase por todos ellos «y que lo haga bien». Si tenemos puntos nuestro polinomio tendrá que ser de grado menor o igual que N - 1 , pero cuando empieza a ser grande (del orden de 10 o más) a menos que los puntos estén muy cuidadosamente elegidos el polinomio oscilará salvajemente. Esto se conoce como fenómeno de Runge.

Para ver esto podemos estudiar el clásico ejemplo que dio Runge: tenemos la función

$\displaystyle f(x) = \frac{1}{1 + x^2}$

veamos qué sucede si la interpolamos en nodos equiespaciados. Para ello vamos a usar la función barycentric_interpolate (según Berrut y Trefethen [II] «[El método de interpolación baricéntrica] merece ser conocido como el método estándar de interpolación polinómica»). Esta función recibe tres argumentos:

una lista de coordenadas x_i de los nodos,
una lista de coordenadas y_i de los nodos, y
un array x donde evaluar el polinomio interpolante que resulta.

El código será este:

import numpy as np
from scipy.interpolate import barycentric_interpolate

def runge(x):
    """Función de Runge."""
    return 1 / (1 + x ** 2)

N = 11  # Nodos de interpolación

xp = np.arange(11) - 5  # -5, -4, -3, ..., 3, 4, 5
fp = runge(xp)

x = np.linspace(-5, 5)
y = barycentric_interpolate(xp, fp, x)

Y este es el resultado:

Con 11 nodos equiespaciados en este ejemplo dado por Runge el polinomio interpolante diverge en los extremos.

Y no os quiero contar nada si escogemos 20 o 100 puntos.

Existe una forma de mitigar este problema, que es, como ya hemos dicho, «escogiendo los puntos cuidadosamente». Una de las formas es elegir las raíces de los polinomios de Chebyshev, que podemos construir en NumPy usando el módulo polynomial.chebyshev. Por ejemplo, si queremos como antes 11 nodos tendremos que escoger el polinomio de Chebyshev de grado 11:

from numpy.polynomial import chebyshev

coeffs_cheb = [0] * 11 + [1]  # Solo queremos el elemento 11 de la serie
T11 = chebyshev.Chebyshev(coeffs_cheb, [-5, 5])

xp_ch = T11.roots()
# -4.949, -4.548, -3.779, -2.703, ..., 4.548, 4.949

Utilizando estos puntos, la cosa no queda tan mal:

Usando nodos de Chebyshev la interpolación es mucho mejor.

Aun así, aún tenemos varios problemas:

El polinomio sigue oscilando, y esto puede no ser deseable.
No siempre podemos escoger los puntos como nosotros queramos.

Por tanto, desde ya vamos a abandonar la idea de usar polinomios y vamos a hablar de trazadores (splines en inglés).

Trazadores

Los trazadores o splines no son más que curvas polinómicas definidas a trozos, normalmente de grado 3 (casi nunca mayor de 5). Al ser cada uno de los trozos de grado pequeño se evita el fenómeno de Runge, y si se «empalman» los trozos inteligentemente la curva resultante será suave (matemáticamente: diferenciable) hasta cierto punto. Cuando queremos una curva que pase por todos los puntos disponibles un trazador es justamente lo que necesitamos.

El trazador más elemental, el lineal (grado 1), se puede construir rápidamente en NumPy usando np.interp. El más común, el trazador cúbico (grado 3) se puede construir con la clase scipy.interpolate.InterpolatedUnivariateSpline. Si pasamos a esta clase un argumento k podemos especificar el grado del trazador (entre 1 y 5). Como ejemplo vamos a tomar los datos de la silueta del pato de Villafuerte [III].

from scipy.interpolate import InterpolatedUnivariateSpline

# Pato
P = [(0.9, 1.3), (1.3, 1.5), (1.9, 1.8), (2.1,2.1), (2.6, 2.6), (3.0, 2.7),
     (3.9, 2.3), (4.4, 2.1), (4.8, 2.0), (5.0, 2.1), (6, 2.2), (7, 2.3),
     (8, 2.2), (9.1, 1.9), (10.5, 1.4), (11.2, 0.9), (11.6, 0.8), (12, 0.6),
     (12.6, 0.5), (13, 0.4), (13.2, 0.2)]

xi, yi = zip(*P)  # 21 puntos de interpolación

x = np.linspace(min(xi), max(xi), num=1001)  # Dominio

y1d = np.interp(x, xi, yi)
#y1d = InterpolatedUnivariateSpline(xi, yi, k=1)(x)  # Mismo resultado
ysp = InterpolatedUnivariateSpline(xi, yi)(x)  # Llamamos a la clase con x

Nota: ¿Quieres saber el truco de zip(*P)?

Y si representamos el resultado obtenemos esto:

Trazadores lineal y cúbico.

¿Alguien se anima a enviarnos una gráfica de cómo quedaría la interpolación si usásemos un polinomio de grado 20?

En ocasiones, sin embargo, puede que no necesitemos un trazador que pase por todos los puntos, sino una curva o un modelo más sencillo que aproxime una serie de puntos, tratando de cometer el mínimo error posible. Si quieres saber cómo hacer esto, ¡sigue leyendo!

Ajuste de curvas

Ajuste polinómico

El ajuste más básico en el que podemos pensar es el ajuste polinómico: buscamos un polinomio que aproxime los datos con el menor error posible. Para ello utilizaremos la función polynomial.polyfit del paquete polynomial de NumPy.

Nota: La función ~~np.polyfit~~ es diferente a la que vamos a usar aquí y está obsoleta, aparte de que tiene el convenio contrario para los coeficientes. Se recomienda no usarla. Ya sé que la otra tiene un nombre un poco largo y que los ejemplos de la documentación tienen fallos, pero es lo que hay.

Esta función recibe tres argumentos obligatorios:

una lista de coordenadas x de los puntos,
una lista de coordenadas y de los puntos, y
el grado deg del polinomio interpolante.

Vamos a ver un ejemplo real con el que me encontré hace unos meses: hallar la polar parabólica aproximada de un avión. Para ello podéis utilizar estos datos.

La polar de un avión es la relación entre la sustentación y la resistencia aerodinámica del mismo. Su forma teórica es:

$\displaystyle C_D = C_{D0} + k C_L^2$

podríamos estar tentados de intentar un ajuste parabólico, pero vemos que en realidad no aparece término lineal. Si llamamos y = C_D y x = C_L^2 tenemos:

$\displaystyle y = y_0 + k x$

con lo que podemos realizar un ajuste lineal. Por otro lado, tengo que descartar los puntos que están más allá de la condición de entrada en pérdida (después del máximo del coeficiente de sustentación), porque esos no cuadran con el modelo teórico. Este es el código:

import numpy.polynomial as P

# Cargamos los datos
data = np.loadtxt("polar.dat")
_, C_L, C_D = data

# Descarto los datos que no me sirven
stall_idx = np.argmax(C_L)

y = C_D[:stall_idx + 1]
x = C_L[:stall_idx + 1] ** 2

# Ajuste lineal, devuelve los coeficientes en orden creciente
C_D0, k = P.polynomial.polyfit(x, y, deg=1)

print(C_D0, k)

Una vez hemos obtenido los dos coeficientes, no hay más que evaluar el polinomio en un cierto dominio usando la función polynomial.polyval, que acepta como argumentos

el dominio donde queremos evaluar la función y
una lista de coeficientes de grado creciente, tal y como los devuelve polyfit.

El código es simplemente:

C_L_dom = np.linspace(C_L[0], C_L[stall_idx], num=1001)
C_D_int = P.polynomial.polyval(C_L_dom ** 2, (C_D0, k))

Y este es el resultado que obtenemos:

Polar parabólica y datos reales.

En la figura se aprecia perfectamente cómo he descartado los puntos más allá del máximo y cómo la parábola, aun no pasando por todos los puntos (tal vez no pase por ninguno) aproxima bastante bien los datos que tenemos. ¡Bien!

General

En ocasiones las cosas son más complicadas que un polinomio (sí lectores, así es la vida). Pero no pasa nada, porque con la función scipy.optimize.curve_fit podemos ajustar una serie de datos a cualquier modelo que se nos ocurra, no importa qué tan complicado sea. Sin ir más lejos, tomando el ejemplo de la documentación, supongamos que tenemos unos datos que se ajustan al modelo

$\displaystyle A e^{-B x^2} + C$

en Python nuestro modelo será una función que recibirá como primer argumento x y el resto serán los parámetros del mismo:

def func(x, A, B, C):
    """Modelo para nuestros datos."""
    return A * np.exp(-B * x ** 2) + C

Ahora solo necesitamos algunos datos (añadiremos un poco de ruido gaussiano para que tenga más gracia) y podemos probar el ajuste. La función scipy.optimize.curve_fit recibe como argumentos:

el modelo func para los datos,
una lista de coordenadas xdata de los puntos, y
una lista de coordenadas ydata de los puntos.

Así realizamos el ajuste:

from scipy.optimize import curve_fit

Adat, Bdat, Cdat = 2.5, 1.3, 0.5

xdat = np.linspace(-2, 4, 12)
ydat = func(xdat, Adat, Bdat, Cdat) + 0.2 * np.random.normal(size=len(xdat))

(A, B, C), _ = curve_fit(func, xdat, ydat)

print(A, B, C)

Y el resultado queda así:

Hemos especificado nuestro modelo, y este es el ajuste.

Fácil, ¿no?

Mínimos cuadrados

Todas estas funciones emplean la solución por mínimos cuadrados de un sistema lineal. Nosotros podemos acceder a esta solución utilizando la función scipy.optimize.leastsq, pero como es más general y este artículo ya se ha extendido bastante lo vamos a dejar aquí, de momento

Y tú, ¿te animas ya a realizar ajustes e interpolaciones con Python? ¿Qué dificultades ves? ¿Cómo piensas que podríamos mejorar el artículo? ¡Cuéntanoslo en los comentarios!

Referencias

RIVAS, Damián; VÁZQUEZ, Carlos. Elementos de Cálculo Numérico. ADI, 2010.
BERRUT, Jean-Paul; TREFETHEN, Lloyd N. Barycentric lagrange interpolation. Siam Review, 2004, vol. 46, no 3, p. 501-517.
VILLAFUERTE, Héctor F. Guías para Métodos Numéricos, parte 2 [en línea]. 2010. Disponible en web: <http://uvgmm2010.wordpress.com/guias/>. [Consulta: 15 de agosto de 2013]

Archivado en: Básico, Tutoriales Tagged: interpolación, numpy, python, python3, scipy, scipy.interpolate

Pybonacci: Ajuste e interpolación unidimensionales básicos en Python con SciPy

Introducción

Interpolación

Polinomios no, ¡gracias!

Trazadores

Ajuste de curvas

Ajuste polinómico

General

Mínimos cuadrados

Referencias

Trending Articles

HOY PANGIT, MAGBAYAD KA!

Henry el monstruo feliz para colorear e imprimir

Dama y vagabundo para pintar

Girasoles para colorear

Long Distance Relationship Tagalog Love Quotes

RE: Mutton Pies (jameskoiman)

Hagibis (1946) by Francisco V. Coching

Ka riam ka beit bad ka por riam

Vimeo Create - Video Maker & Editor 1.6.0 by Vimeo Inc

Vimeo 3.42.1 by Vimeo Inc

Good Morning Quotes

Pokemon para colorear

Arbol genealogico para colorear

Dibujos de animales para imprimir

Re:Mutton Pies (lleechef)

Mga Tala sa “Unang Siglo ng Nobela sa Filipinas” (2009) ni Virgilio S. Almario

Re: lwIP PIC32 port - new title : CycloneTCP a new open source stack for...

Kurup heroin 9.09 grams na 4mer, Pynthor, shah kem uwei

PREMATURE CAMPAIGNING – Meron ba nun?

Tinkerbell para colorear, pintar e imprimir