Prepublicación

‘Big data y el Internet de las cosas’

Libre
adelanta un capítulo del libro Big data y el Internet de las cosas. Qué hay detrás y cómo nos va a cambiar, de Mario Tascón y Arantza Collaut, donde analizan el trato que le dan las empresas a los datos personales de los usuarios

CÓMO NOS AFECTA EN NUESTRA VIDA DIARIA

A comienzos de 2016, una información periodística disparaba todas las alarmas: si uno intentaba localizar web-cams en “Shodan”, un buscador especializado en Internet de las Cosas, podía encontrarse desde imágenes en directo de cunas con bebés durmiendo a plantaciones privadas de marihuana. Un montón de sistemas de vigilancia de hogares abiertos al público. Un protocolo transmisión de datos poco seguro era el culpable, pero hay mucho más.

En el informe de McKinsey(1) se pone el punto de mira en “las políticas relacionadas con la privacidad, seguridad, propiedad intelectual, e incluso con la responsabilidad”. Son aspectos, advierte dicho documento, que deberán ser abordados en breve para continuar con el desarrollo de los sistemas de Big Data.

El acceso a los datos críticos de las empresas es cada vez más una necesidad para poder integrar la información de múltiples fuentes de datos, a menudo de terceros, y analizarlos. “Hay que tener en cuenta los límites de esta normativa. Ver si el usuario ha habilitado el permiso para obtener esa información o no. Asimismo, hay que trabajar mucho las condiciones y términos de uso, ya que si no después nos encontraremos con un problema con el usuario”, explica Óscar López, presidente del Grupo Regulación de AUTELSI.

Gabriel Martín, directivo en España de Symantec, asegura que la seguridad “debe contemplarse desde el princi-pio.”. En su opinión, “se necesita un sistema de acceso que permita determinar los niveles de acceso dependiendo de las edades”. Además, también se necesita un sistema que “deje una huella para que se pueda disponer de esos datos y que al mismo tiempo esté todo relacionado con el cumplimiento de normativas, tanto internas como legales”.

¿Cómo usar estos datos?

Esta pregunta es una de las que más problemáticas está generando en torno a la pues-ta en práctica de las herramientas de Big Data. Así, en una entrevista para el Centro de Innovación BBVA, Elena Alfaro, gerente en el área de Business Discovery BBVA y experta en Smart Cities, aborda la cuestión sobre la privacidad de los datos y su uso. En este sentido, incide en que la información en su proyecto “se use para mejorar la 'inteligencia de la ciudad' y no tanto para determinar oportunidades de venta a personas concretas, a no ser que esas personas accedan a ello”.

“Los datos nos llegan ya como anónimos o enmascarados de acuerdo con la ley, de forma que no hay manera de identificar a ninguna persona o lo que haya hecho. Nosotros creemos que hay muchas posibilidades en el uso y explotación de la información agregada, no personal. Digamos que nos interesa el qué, el dónde y el cuándo, pero no el quién”, explica Alfaro. Nos guste o no, no hay que olvidar que somos datos. Un estudio del MIT probó que los patrones de uso de las tarjetas permiten descubrir la identidad del 90% de una muestra de 1,1 millones de personas anónimas. Los investigadores aplicaron algoritmos a una base de datos de un gran banco y vieron cómo con un promedio de cuatro transacciones, el día y la tienda, les bastaba para identificar a las personas en el 90% de los casos. Una muestra del poder de los metadatos.

LA PROTECCIÓN DE DATOS(2)

El director de la Agencia Vasca de Protección de Datos, Iñaki Pariente de la Prada, explica que en España la Ley General de Protección de Datos es del año 1999 (traspone una directiva europea del 95), engloba la protección de datos en general y no regula sectorialmente ningún campo de actuación. Una ley que se hizo cuando solo unos pocos estaban familiarizados con Internet y el término Big Data era prácticamente desconocido. El experto vasco remacha: “No hay una regulación específica ni para cloud computing o telefonía móvil. Lo que se hace es aplicar los principios generales de la protección de datos a cada sector, a cada ámbito nuevo que surge. Sería conveniente tener una ley más actual, pues la directiva tiene 20 años. Se hizo con unos parámetros en los que no había Internet y los actuales son que todo el mundo se pasea por la calle con varios dispositivos encendidos”. Pariente de la Prada añade: “Pese a no haber una ley específica de Big Data, se prevé la obligación a las administraciones y empresas de todo el mundo a que hagan tratamiento masivos de datos, la redacción de un texto denominado evaluación de impacto, que tiene que elaborarse antes de la recogida o tratamientos masivos de información, en donde se analice si se va a respetar o no la normativa de privacidad y cómo se va a hacer”.

El experto vasco incide en que hay que respetar la ley tanto en la recogida como en el tratamiento y en la cancelación de los datos personales:

Hay dos principios esenciales en la recogida de datos: información y consentimiento. Supuestamente, una persona cuando da sus datos a otra tiene que haber sido informada previamente de para qué se van a recoger —la finalidad—, cómo se van a utilizar, dónde se van a utilizar, en qué ficheros se van a guardar y la seguridad que van a tener. Teóricamente, una vez que he informado de todo esto, la persona consiente o no dar esa información. Y si recojo datos en una página web gracias a una casilla, el sistema tiene que permitir guardar esa casilla para acreditar que se dio el consentimiento. A efectos de prueba.

Cuando no se puede obtener ese consentimiento en la recogida, por ejemplo, de millones de datos para realizar investigaciones médicas o con otras finalidades, esos datos tienen que estar anonimizados para eliminar la vinculación de los datos a personas concretas y evitar su identificación. Señala el experto vasco:

Las empresas están almacenando actualmente miles de datos con los denominados wearables. Nos ponemos pulseras, dispositivos y en 5 años tendrán muchísima información acumulada de cada uno. El problema es que no sabemos para qué están almacenando toda esa información, cómo la van a utilizar en el futuro. La finalidad no está nada clara. Muchas de ellas están en Estados Unidos, no están sujetas al derecho español. Eso implica que si tengo un problema no voy a poder acudir a que me tutelen o ayuden las instituciones estatales.

Para Pariente de la Prada no hay otro camino que la anonimización en la recogida masiva de datos. Aunque también alerta que esa anonimización puede ser reversible en algún momento: “Te dicen que técnicamente hay garantía de que no puede ser reanonimizado, pero realmente no sabes, aunque en ese momento sea cierto, si mañana la tecnología va a evolucionar. Pasa a ser un problema técnico”.

La recogida masiva de datos preocupa en Europa. Prueba de ello es que el grupo de expertos ha pasado de reunirse de forma esporádica cuando nació a hacerlo de forma asidua. La directiva de la Protección de Datos de 1995 creó un grupo de trabajo que reúne a todas las autoridades de protección de datos de los países miembros y ese grupo de expertos emite, ahora, cerca de 4 dictámenes al año. El de abril de 2014 fue sobre “técnicas de anonimización” y estableció los criterios técnicos para anonimizar los datos. “Es un dictamen muy interesante que marca las pautas que hay que seguir. De alguna forma es como si actualizase la ley. Trata cosas que la norma no contempló cuando nació y que hay que ir interpretando. La ley no cambia, pero con estos dictámenes se actualiza, son muy importantes”, explica el experto vasco.

Estas son algunas de las recomendaciones del dictamen europeo: “Existen limitaciones inherentes a algunas técnicas de anonimización. Los responsables del tratamiento deben ponderar seriamente estas limitaciones antes de escoger una técnica u otra para desarrollar un proceso de anonimización. Asimismo, deben atender a los fines previstos para la anonimización, como proteger la privacidad de las personas cuando se publica un conjunto de datos o permitir que se consulte algún tipo de información contenida en dicho conjunto”(Dictamen 05/2014 sobre técnicas de anonimización).

Y alerta sobre la dificultad de anonimizar los datos: “Las técnicas descritas en este documento no cumplen al cien por ciento los criterios de una anonimización efectiva, a saber: no es posible singularizar a una persona; no existe vinculabilidad entre los registros de una misma persona y no se puede inferir información sobre una persona. No obstante, dado que cada una de estas técnicas entraña, en mayor o menor medida, alguno de estos riesgos, es imprescindible diseñar cuidadosamente la aplicación de una determinada técnica a la situación concreta de que se trate, o bien la implementación de una combinación de estas técnicas, a fin de obtener resultados más sólidos” (Dictamen 05/2014 sobre técnicas de anonimización).

'SELFTRACKING', LA FIEBRE POR LOS DATOS

¿Nos estamos convirtiendo en adictos a los datos? La medición constante de los datos vitales del cuerpo humano con wearables que permiten monitorizar nuestra vida relacionándolas con las constantes vitales que en ese momento tengamos (la medida del ritmo cardíaco, la ten-sión arterial, la respiración, las calorías quemadas durante el ejercicio) aspiran a revolucionar el mundo de la salud. Relojes, gafas, ropa, pulseras, collares o zapatillas. Todo sirve para medir permanentemente el cuerpo. La tecnología se pega a la piel y acompaña a las personas desde que son bebés. Los dispositivos no solo sirven a los adultos. Los pañales inteligentes permiten a los padres escanear los fluidos del móvil para controlar la salud de sus hijos. También utilizan las pulseras en sus bebés, que, sin ser conscientes, son cobayas tecnológicas, early adopter. Anillos, tobilleras que calculan su ritmo cardíaco, que avisan al teléfono de sus padres si su cadencia respiratoria varía durante la noche. Hay wearables de todo tipo para las personas tecnoadictas que funcionan las 24 horas del día. La madre o el padre que monitoriza el sueño de niños sanos por la mañana segura-mente utilizarán por la tarde un dispositivo que almacenará todas sus constantes vitales mientras hacen footing.

Todo lo que puede ser medido se mide. Un fenómeno que se conoce como selftracking (autorastreo o cuantificación). Los selftrackers utilizan apps y otros medios electrónicos para recopilar todos los datos de sus cuerpos, buscan averiguar el máximo sobre sí mismos. Uno de sus lemas es “Lo que puede ser medido puede ser mejorado” y por ello cuantifican todo. Gary Wolf y Kevin Kelly son los fundadores del movimiento Quantified Self, que nació en 2007 en Estados Unidos. Un modo de vida que gira alrededor de los da -tos. Los selftrackers necesitan saber exactamente lo que con-sumen, gastan, comen y duermen. Un selftracker sabe que ayer dio 5.997 pasos, los minutos que ha dormido, su índice de grasa corporal, la cantidad de azúcar en la sangre y los centilitros de vino que se ha bebido en los últimos 10 años. No solo mide su estado físico, también registra el entorno —la humedad o contaminación— y todo lo que le realiza cada día —uso de las redes sociales o las horas que pasa delante del televisor—. Creen en el autoconocimiento y la optimización de su estilo de vida gracias al seguimiento de las cifras que emite su cuerpo —mediante apps y dispositivos—, y llevan hasta el límite el aforismo “Conócete a ti mismo”. Algunos médicos alertan de esta práctica que califican de obsesiva y en algunos casos vana, pues se acumulan miles de datos sin ningún sentido.

EL ESCÁNDALO SNOWDEN

Un informático de 30 años, Edward Snowden, nos despertó bruscamente del sueño acerca de las posibilidades y las bondades —pese a los recelos en el tema de la privacidad— que parecía brindarnos la recogida masiva de datos, y nos mostró la cara más turbia del Big Data. El caso Snowden, que estalló durante el verano de 2013 y que todavía está lejos de haber terminado, demostró que decenas de países estaban siendo espiados por Washington. El exanalista de la Agencia Nacional de Seguridad (NSA, por sus siglas en inglés) reveló la existencia de un programa global de espionaje de las comunicaciones telefónicas y del tráfico de Internet. Una información que fueron destapando con cuentagotas los periódicos The Guardian y Washington Post —ambos se llevaron el Premio Pulitzer en 2014 por la publicación de los documentos que prueban la intercepción sistemática de millones de comunicaciones de voz y datos— y que sacudió las relaciones de Estados Unidos con los países aliados.

La recopilación indiscriminada de datos por parte de la NSA afectó a decenas de políticos mundiales —la canciller alemana Angela Merkel o los tres últimos presidentes franceses, entre otros muchos— que fueron espiados por el país norteamericano y dejó al descubierto la connivencia de los gigantes tecnológicos estadounidenses —Google, Facebook, Microsoft— con la Agencia Nacional de Seguridad. Reino Unido también fue cómplice de este espionaje, según revelaron los documentos filtrados por Edward Snowden.

“Can you hear me now?” (“¿Pueden oírme ahora?”) es el primer tuit que curiosamente el exanalista escribió tras estrenar cuenta de Twitter a finales de septiembre de 2015. Antes, se escuchó y se habló mucho de Snowden tras la filtración de los documentos, tanto por su vida profesional como por la polémica derivada del caso que destaparon los periódicos The Washington Post y The Guardian —David Miranda, pareja de uno de los periodistas que publicó la información, Glenn Greenwald, fue arrestado en Londres y se le aplicó la ley antiterrorista en un claro abuso de poder por parte de las autoridades inglesas—. En el aeropuerto Sheremétievo de la capital rusa, Snowden pasó 38 días en la zona de tránsito esperando la solución de su caso y terminó pidiendo asilo político a Rusia. Una decisión que agravó las relaciones entre Moscú y Washington. Todo esto ocurría en 2013 tras el escándalo mayúsculo. Desde ese año no han dejado de aparecer docu-mentos que no solo han tenido consecuencias políticas, sino también económicas, pues miles de empresas desconfían de las compañías norteamericanas a la hora de trabajar con ellas. También han removido a los ciudadanos, que vieron incrédulos cómo en nombre de la seguridad se rastrearon sin pudor millones de comunicaciones, se gastaron más de 250 millones de dólares en influir en los diseños tecnológicos de los gigantes de Silicon Valley, se craquearon comunicaciones encriptadas o se almacenaron miles de llamadas telefónicas privadas. La Administración norteamericana realizó un espionaje masivo recolectando información a través de Google, Facebook, Apple y Skype gracias al programa Prisma NSA, que permite almacenar los correos electrónicos, búsquedas de Internet, archivos enviados y conversaciones online de cualquier ciudadano no estadounidense fuera de las fronteras de Estados Unidos.

El caso del exanalista de la CIA ya tiene una película, dirigida por Oliver Stone, que detalla la vida de uno de los hombres que para algunos es considerado un traidor —Estados Unidos justifica el espionaje masivo como arma indispensable para luchar contra el terrorismo— y para otros un héroe. Stone muestra todos los pasos del informático que, antes de llevarse de la oficina más de un millón de documentos secretos de la NSA y volar a Hong Kong con el propósito de contarle a un periodista el inmenso programa de vigilancia electrónica estadounidense, se preparó para ser marine en Irak tras rechazar la primera oferta que le hizo la NSA para trabajar como decodificador. Antes de su huida de Estados Unidos, Snowden trabajó en países como Suiza o Japón realizando labores de contraespionaje para la NSA y para otras agencias de la inteligencia de Estados Unidos. Aunque no ha vuelto a su país de origen, este informáti-co que ahora tiene 32 años ha conseguido algún cambio en el mundo Big Data. Prueba de ello es que, a finales de 2015, el presidente de Estados Unidos Barack Obama rubricaba una ley para limitar los poderes de la Agencia de Seguridad Nacional. Algo que nadie había conseguido ni pensado tras los atentados del 11-S.

DATOS PARA LUCHAR CONTRA LA DESIGUALDAD

Erradicar la pobreza en el año 2030 es uno de los objetivos de los líderes mundiales. En septiembre de 2015, los representantes de las Naciones Unidas lanzaron en Nueva York los Objetivos de Desarrollo Sostenible (ODS), el proyecto más ambicioso en la historia del pla-neta en el empeño de construir una sociedad global y mejor. Para lograrlo señalaron la importancia de los datos. Los expertos advirtieron que si no consiguen una mejoría drástica de los datos sobre las personas más pobres del mundo, este ambicioso proyecto dejará de cumplir con su objetivo de “no dejar a nadie atrás”. El proyecto tiene 17 objetivos globales y 168 metas en educación, la seguridad alimentaria, el empleo o el medio ambiente. Pasa de gestionar millones —como sucedía con los Objetivos de Desarrollo del Milenio (ODM), que, tras 15 años de vigencia, ha dejado paso al nuevo programa— a billones, alrededor de 11,5 billones de dólares al año durante los próximos tres lustros.

Para alcanzar el objetivo aspiran a mejorar esos datos utilizando datos. En la reunión señalaron que millones de personas se pierden dentro de la división de datos y recalcaron la importancia de la formulación de políticas de información con datos para ayudar a las personas más vulnerables del mundo. “Sin datos estamos volando a ciegas, y nosotros no podemos tomar las decisiones políticas que deben estar basadas en la evidencia.” Se estima que puede haber 350 millones más de personas que viven en la pobreza de las que se conoce actualmente. Tampoco se sabe el número de niñas que se casan antes de cumplir los 18 años ni cuántas mujeres hay en el porcentaje de los pobres del mundo. Tampoco el número de niños de la calle en todo el mundo ni el número de personas en el mundo que tienen hambre.

Un artículo de The Guardian recoge el desconcierto de muchos de los expertos que estuvieron en la jornada de la ONU —“La situación de los datos en muchos países es realmente preocupante. Si usted no sabe el número de personas que vive en su país ¿cómo se pueden hacer políticas serias?”—. El artículo incide en que la colaboración entre el sector privado y organizaciones no gubernamentales serán cruciales para tapar las lagunas de datos en los países en desarrollo. Los datos de las empresas privadas se pueden utilizar junto con los métodos de captura de datos tradicionales como las encuestas, que son costosos y difíciles de llevar a cabo. En Costa de Marfil, por ejemplo, la empresa de telecomunicaciones Orange ha lanzado una campaña de recogida de datos entre investigadores y universidades para encontrar soluciones a los problemas de desarrollo en el país. A medida que las relaciones público-privadas se hagan más fuertes, será de vital importancia la calidad de los datos y que estos cumplan un conjunto de normas internacionalmente reconocidas respetando la privacidad de los ciudadanos. Unos datos que, para la ONU, son necesarios para erradicar la pobreza.

DESTRUCCIÓN Y CREACIÓN DE EMPLEO

La automatización que permite el manejo de Big Data y el despliegue de los dispositivos del Internet de las cosas configuran un futuro sombrío para muchas profesiones actuales. Todo aquello que se puede automatizar se automatizará, y esta tautología es la causa de que cada día que pasa la mayoría del trabajo manual que venían haciendo miles de operarios pase a “manos” de sensores, máquinas e incluso robots.

Hasta las cajeras de supermercado están siendo sustituidas por cajas inteligentes que mediante las etiquetas de los productos calculan en un segundo el importe de la compra; el cliente no necesita apenas más que acercar o dar una orden de voz a su teléfono móvil para realizar el pago de la operación. No hay ninguna persona intermediando. Los jardines y su riego se ajustan cada vez más con sensores e incluso la producción de leche empieza a estar cada vez más controlada por diferentes sensores. Estos son solo algunos de los muchos ejemplos de un cambio copernicano en el mundo laboral. Mientras aparecen nuevas profesiones, como los científicos de datos, se destruyen otras, lo que se está convirtiendo en uno de los mayores retos para gobiernos y sociedades de todo el mundo.

-----------------

1. “Big data: The next frontier for innovation, competition, and productivity”.

La otra cara del MWC: en Internet todavía hay clases

2. “Informe Big Data y Salud”, Prodigioso Volcán y Planner Media, 2015.

-----------------------------

Este texto ha sido actualizado en la tarde del domingo tras consultar con Mario Tascón la corrección de un error descubierto en el libro por un lector de 'infoLibre'.

Más sobre este tema