¿QUIERES SABER QUÉ HARÁ EN EL FUTURO EL SP500? ¡ATENTO A LA PRODUCCIÓN DE MANTEQUILLA DE BANGLADESH!
¿QUIERES SABER QUÉ HARÁ EN EL FUTURO EL SP500? ¡ATENTO A LA PRODUCCIÓN DE MANTEQUILLA DE BANGLADESH!
En 1995, David J. Leinweber se propuso encontrar la métrica que mejor predecía los movimientos en el mercado de valores de Estados Unidos. Comenzó con datos sobre el precio de cierre anual del índice Standard & Poor’s 500 para los 10 años que mediaban desde 1983 hasta 1993. Luego consultó un archivo de series de datos internacionales publicados por las Naciones Unidas, que cubría información como cambios en las tasas de interés, crecimiento económico y desempleo para los 140 países miembros de la ONU. Usando una técnica estadística llamada “análisis de regresión“, Leinweber se propuso encontrar la serie de datos que mejor predijera el precio de cierre anual del S&P 500.
El análisis de regresión es la principal herramienta que utilizan los estadísticos para descubrir una relación lineal entre dos o más variables. Existe cierta ambigüedad en cuanto a su verdadero inventor. Fue teorizado y publicado por primera vez en 1805 por Adrien-Marie Legendre, un matemático francés, como el “méthode des moindres carrés” o “método de mínimos cuadrados“. No obstante, se admite que Carl Friedrich Gauss, matemático y físico alemán, desarrolló la base del método de mínimos cuadrados en 1795 a la asombrosamente temprana edad de 18 años. Gauss no publicó su método hasta 1809, por lo que, al menos oficialmente, Legendre obtuvo todo el crédito.
La medida del poder explicativo de un análisis de regresión se llama “R-cuadrado” o “coeficiente de determinación.” Una relación perfecta entre dos variables mostrará un R cuadrado de 1,00 o 100%. Las relaciones sólidas tienen un R cuadrado de más del 50%. Un R cuadrado de cero indica la ausencia de cualquier relación. Un análisis de regresión de, por ejemplo, la altura y el peso en humanos muestra una relación fuerte y positiva de aproximadamente 0,7 o 70%. Es decir, cuanto más alto, más probable que uno sea también más pesado.
Después de ejecutar un análisis de regresión de la serie de datos internacionales de la ONU para los 140 países miembros, Leinweber hizo un descubrimiento sorprendente. Un simple producto lácteo de un país poco probable explicaba el 75% de la variación en el S&P 500. ¿Qué era? La producción de mantequilla en Bangladesh. Leinweber sabía que tenía algo entre manos. Pensó entonces que tal vez podría hacerlo mejor si incluyera datos globales sobre una selección más amplia de productos lácteos. ¿Qué tal, por ejemplo, si se añadiera el queso y la producción láctea estadounidense? Leinweber consultó los datos. Sorprendentemente, el R cuadrado saltó al 95% de precisión. Pero, ¿qué impulsaba en realidad estos retornos? Al incluir una tercera variable, ¡la población de ovejas!, Leinweber descubrió que podía explicar el 99% del movimiento en el S&P 500 para el período de 1983 a 1993. Casi perfecto. Leinweber no publicó de inmediato sus hallazgos. Parecían demasiado buenos para ser verdad. Sin embargo, los periodistas se hicieron eco de la investigación de Leinweber y este descubrimiento también se abrió camino en el plan de estudios de la Escuela de Negocios de Stanford y en otros lugares. Además, Leinweber empezó a recibir llamadas de inversores sobre el estado de la producción de mantequilla en Bangladesh. Finalmente, decidió escribir un estudio y publicarlo mientras muchos inversores copiaban sus gráficos de la evolución de productos lácteos.
El estudio de Leinweber era, por supuesto, una broma para ilustrar los peligros del data mining. La “minería de datos” es la práctica de analizar grandes cantidades de datos para encontrar relaciones entre series de ellos que son meramente coincidentes durante el período analizado. La producción de mantequilla de Bangladesh, por ejemplo, es inútil como predictor del S&P 500 antes de 1983 o después de 1993. Leinweber diseñó el estudio a propósito para ilustrar que las variables que no podrían predecir el S&P 500 podrían mostrar una relación muy fuerte en un análisis de regresión. Era una asociación fortuita, y aunque no sabía qué aparecería como el mejor predictor del S&P 500, sí sabía que surgiría alguna relación si miraba suficientes series de datos. La relación entre la producción de mantequilla de Bangladesh y el S&P 500 fue el resultado de una afortunada expedición de pesca y fue completamente falsa.
Lo que todo esto significa es que desarrollar una sólida estrategia de inversión de tipo cuantitativo, combinando métricas de precio y calidad o cualquier otro elemento, debe llevarnos a pensar, antes de que podamos crear y poner en práctica esa estrategia, si podemos confiar en nuestra propia investigación. Es decir: ¿tiene sentido económico la estrategia? ¿O queremos construir nuestra propia estrategia basada en la producción de mantequilla de Bangladesh? El problema es que resulta muy fácil encontrar sorprendentes resultados de inversión simulada realizando back test. Sin embargo, encontrar métricas que conduzcan a un rendimiento futuro sólido en el mundo real es bastante más difícil. Por eso es tan importante reflexionar acerca de las trampas que se deben evitar. Algo que intentaremos hacer en las próximas entregas.
Vale la pena cerrar este capítulo con esta acertada reflexión de Warren Buffett, realizada en 1984 en su célebre conferencia “Los superinversores de Graham&Doddsville”:
“Siempre me ha parecido extraordinario que haya tantos estudios que se centren en el comportamiento del precio y el volumen, las cosas que interesan a los chartistas. ¿Se imagina comprando una empresa entera simplemente porque su precio ha subido sustancialmente la última semana y la semana anterior? Por supuesto, el motivo de que se hagan tantos estudios con estas variables de precio y volumen es que, en la actualidad, en la era de los ordenadores, hay una serie prácticamente infinita de datos sobre esas variables. No es que este tipo de estudios tengan necesariamente alguna utilidad; simplemente es que los datos están ahí y que los académicos se han esforzado mucho para adquirir las habilidades matemáticas necesarias para manipularlos. Después de adquirir esas habilidades parece un despilfarro no utilizarlas, aunque su utilización no tenga ninguna utilidad, o incluso aunque esa utilidad sea negativa. Como dice un amigo mío, a un hombre que tiene un martillo todo le parecen clavos.”
@mellizonomics & @quietinvestment
Fuente original: Quantitative Value, Tobias E. Carlisle & Wesley R. Gray