La trampa de datos: por qué los números nunca cuentan la historia completa

The Data Trap: Why Numbers Never Tell The Full Story

large_MWwdIotXd0nfd03yoMwDIB5RAmgjkY70jhiJ26-x78w


Fuente / Source: www.weforum.org Kian Bakhtiari
READ ENGLISH VERSION BELOW ⇓

Todos los días, generamos 2.5 trillones de bytes de datos. Organizada y analizada correctamente, esta información tiene el poder de crear un futuro mejor para todos. Los grandes datos pueden detectar con precisión los terremotos, las inundaciones y las hambrunas, antes de asignar los recursos donde más se necesitan. Los datos abiertos tienen el potencial de mejorar el acceso a la educación, la salud y los servicios financieros.

No obstante, a pesar de tal promesa, los conjuntos de datos son el producto del diseño humano. Un reflejo de los defectos, preferencias y experiencias de sus creadores imperfectos. Casi todos los datos son definidos, interpretados y manipulados por personas que a menudo toman una decisión valiosa sobre qué incluir. Por lo tanto, comprender los elementos excluidos del conjunto de datos es tan importante como los datos mismos.

Como humanos, sufrimos de un sesgo de confirmación: la tendencia a buscar o interpretar información de maneras que refuerzan nuestros puntos de vista existentes, mientras ignoramos cualquier evidencia contradictoria. Un buen ejemplo son las elecciones presidenciales de 2016 en Estados Unidos, cuando la mayoría de los encuestadores no pudieron predecir la victoria de Donald Trump. El día de las elecciones, a Trump se le dio un 15% de posibilidades de ganar en base a los datos. Pero los expertos descuidaron gran parte de lo siguiente: inexactitud de los modelos de participación, sobrerrepresentación de graduados en las encuestas, el impacto de grupos difíciles de alcanzar y la honestidad de los votantes con completos desconocidos. Tales descuidos nunca serán prevenidos al tener acceso a más datos, sino al estallar las burbujas del filtro que nos engañan para hacernos creer que todos piensan y actúan como nosotros.

Al mismo tiempo, se han creado más datos en los últimos dos años que los 5.000 años previos de la historia humana. Este flujo acelerado de nueva información aumenta nuestra dependencia de la “heurística de disponibilidad”: la tendencia a tomar decisiones basadas en la información más reciente disponible. La mayoría de los gobiernos, economistas y periodistas no previeron la crisis financiera de 2007-8; ya que los modelos matemáticos prevalecientes no sugerían un descenso. Si tan solo se hubieran centrado menos en los últimos datos y más en la naturaleza cíclica de los mercados financieros.

El resto de este artículo está disponible solo en inglés en el sitio web del autor. Traducción al español provista por pluraL.

The Data Trap: Why Numbers Never Tell The Full Story

Every day, we generate 2.5 quintillion bytes of data. Organized and analyzed correctly, this information has the power to create a better future for all. Big data can accurately detect earthquakes, floods and famines, before allocating resources where they are most needed. Open data has the potential to improve access to education, healthcare and financial services.

Despite such promise, data sets are the product of human design. A reflection of the flaws, preferences and experiences of their imperfect creators. Nearly all data is defined, interpreted and manipulated by humans who frequently make a value decision about what to include. Therefore, understanding the elements excluded from the data set is just as important as the data itself.

As humans, we suffer from confirmation bias: the tendency to seek out or interpret information in ways that reinforce our existing views, while ignoring any contradictory evidence. A good example is the 2016 US presidential election when most pollsters failed to predict Donald Trump’s victory. On election day, Trump was given a 15% chance of winning based on the data. But the experts neglected much of the following: inaccuracy of turnout models, overrepresentation of graduates in polls, the impact of hard-to-reach groups and the honesty of voters with complete strangers. Such oversights will never be prevented by having access to more data, but rather by bursting the filter bubbles that trick us into believing that everyone thinks and acts like us.

At the same time, more data has been created in the last two years than the previous 5,000 years of human history. This accelerated flow of new information is increasing our reliance on the “availability heuristic”: the tendency to make decisions based on the most recent information available. Most governments, economists and journalists failed to foresee the 2007-8 financial crisis; since the prevailing mathematical models did not suggest a downturn. If only they had focused less on the latest data and more on the cyclical nature of financial markets.

READ FULL ARTICLE

Leave a Reply