A pesar de las precauciones que se puedan tomar, los contactos relacionados de una cuenta en redes como Facebook, Twitter o Flickr sirven para reconstruir el perfil de un usuario en la Red
Por Steve Lohr
The New York Times
Si un extraño se le acerca en la calle, ¿usted le diría su nombre, su documento de identidad y su dirección de correo electrónico?
Probablemente, no.
Sin embargo, la gente con frecuencia revela toda clase de información personal en Internet, lo cual permite deducir esos datos de identificación. Servicios como Facebook , Twitter y Flickr son océanos de detalles personales. Desde saludos de cumpleaños que se envían y se reciben, chismes de la escuela y del trabajo hasta fotografías de vacaciones familiares y películas que se miran.
Los científicos que se dedican a las computadoras y los expertos en política dicen que esos trocitos de auto-revelación aparentemente inocuos pueden ser recolectados y re-ensamblados cada vez más por las computadoras con el fin de ayudar a crear el perfil de la identidad de una persona, algunas veces por medio del número de afiliado a una obra social.
"La tecnología ha hecho que la definición convencional de información personalmente identificable quede obsoleta", dijo Maneesha Mithal, directora asociada de la división de privacidad de la Comisión Federal de Comercio ( FTC , según su sigla en inglés). "Puedes descubrir quién es alguien sin ella".
En un proyecto de clase en el Instituto de Tecnología de Massachussets (MIT, según su sigla en inglés), que recibió cierta atención el año último, Carter Jernigan y Behram Mistree analizaron más de 4000 perfiles de estudiantes en Facebook, incluyendo vínculos a amigos que decían que ellos eran homosexuales. Ambos pudieron predecir, con un 78 por ciento de precisión, si un perfil pertenecía a un hombre homosexual.
Hasta el momento, este tipo de poderosa recolección de datos, que depende de sofisticadas correlaciones estadísticas, yace principalmente en el reino de los investigadores universitarios, no en ladrones de identidad y vendedores.
Pero la FTC está preocupada por que las reglas destinadas a proteger la privacidad no marchan al mismo paso que la tecnología. La entidad convoca el miércoles al tercero de los tres talleres sobre el tema.
Sus preocupaciones no son inverosímiles. El último otoño (boreal), Netflix otorgó 1 millón de dólares a un equipo de estadistas y científicos dedicados a las computadoras que ganaron un concurso de tres años de duración para analizar los antecedentes vinculados con el alquiler de películas de 500.000 suscriptores y mejorar así la precisión de la predicción del software de recomendación del servicio en, al menos, un 10 por ciento.
En las redes sociales, la gente puede incrementar sus defensas contra la identificación adoptando rigurosos controles de privacidad sobre la información en perfiles personales. No obstante, las acciones de una persona, dicen los investigadores, raramente son suficientes para proteger la privacidad en el mundo interconectado de Internet.
Quizás usted no revele información personal, pero sus amigos y colegas online pueden llegar a hacerlo por usted, refiriéndose a la escuela o a su empleador, a su género, su ubicación y sus intereses. Los patrones de comunicación social, explican los investigadores, son reveladores.
"La privacidad de una persona ya no es un tema individual", dijo Harold Abelson, profesor de ciencias de la computación en el M.I.T. "En el mundo online de la actualidad, lo que tu madre decía es más que cierto: la gente realmente puede juzgarte por los amigos que tienes".
Toda junta, la información sobre cada individuo puede formar una distintiva "firma social", aseguran los investigadores.
El poder de las computadoras para identificar personas a partir de patrones sociales solamente fue demostrado el año último en un estudio llevado a cabo por el mismo par de investigadores que ingresó a la base de datos anónima de Netflix: Vitaly Shmatikov, un profesor asociado de ciencias de la computación, en la Universidad de Texas, y Arvind Narayanan, ahora investigador en la Universidad de Stanford.
Examinando correlaciones entre varios informes online, los científicos demostraron que podían identificar a más del 30 por ciento de los usuarios de Twitter, el servicio de microblogs (micro-bitácoras), y de Flickr, un servicio online destinado a compartir fotografías, aunque a los informes se les había quitado la información identificatoria (nombres de cuentas y direcciones de correo electrónico).
"Cuando unes estos grandes paquetes de datos, una pequeña porción de nuestro comportamiento y la estructura de nuestras redes sociales pueden dar lugar a la identificación", dijo Shmatikov.
Incluso más perturbador para los defensores de la privacidad es el trabajo de dos investigadores de la Universidad Carnegie Mellon . En un artículo publicado el año último, Alessandro Acquisti y Ralph Gross informaron que pudieron predecir con precisión el número de afiliado a una obra social completo, de nueve dígitos, del 8,5 por ciento de las personas nacidas en Estados Unidos entre 1989 y 2003, prácticamente cinco millones de personas.
Los números de afiliados a obras sociales son muy valiosos para los ladrones de identidad porque los utilizan como identificadores y para autenticar transacciones bancarias, tarjetas de crédito y otros tipos de transacciones.
Los investigadores de la Universidad Carnegie Mellon usaron información que se encontraba disponible públicamente, que tomaron de diversas fuentes, incluyendo perfiles en redes sociales, con el fin de acotar la búsqueda relacionada con dos datos fundamentales para identificar a una persona: la fecha de cumpleaños y la ciudad o el estado donde ésta nació.
Eso les ayudó a descubrir los tres primeros dígitos de cada número de afiliado a una obra social, el cual había sido asignado por el gobierno según la ubicación. Los seis dígitos restantes habían sido asignados a través de métodos que el gobierno no reveló, a pesar de que estaban relacionados con el momento en el cual la persona solicitó ese número. Los investigadores utilizaron proyecciones vinculadas con dichas solicitudes y otros datos públicos, como los números de afiliado a obras sociales de personas fallecidas, y luego ejecutaron ciclos repetidos de correlaciones estadísticas y deducciones para re-diseñar parcialmente el sistema de asignación del gobierno.
Con seguridad, el trabajo de Acquisti y de Gross sugiere un riesgo potencial, no real. Pero una investigación que ellos efectuaron y que no ha sido publicada explora la manera en la cual los delincuentes podrían usar técnicas similares para esquemas de robo de identificación a gran escala.
Más generalmente hablando, quienes defienden la privacidad están preocupados por que las nuevas fronteras de la recolección, operación y extracción de datos están en su mayoría desreguladas. Ellos temen a la "lista negra online", donde los productos y los servicios se ofrecen a algunos consumidores y no a otros, tomando como base deducciones estadísticas y predicciones sobre individuos y su comportamiento.
La FTC y el Congreso están evaluando medidas como por ejemplo: requisitos industriales más severos y la creación de una lista "no rastrear", similar a la lista federal "no llamar", con el fin de detener la monitorización online.
Pero Jon Kleinberg, un profesor de ciencias de la computación en la Universidad Cornell , quien estudia redes sociales, se muestra escéptico respecto de que las reglas tengan gran impacto. Su consejo: "Cuando estás haciendo algo online, deberías comportarte como si lo estuvieras haciendo en público".
© NYT Traducción de Angela Atadía de Borghetti
No hay comentarios:
Publicar un comentario