Así como el modelo estándar de la física de partículas establece los fundamentos de cómo las partículas y las fuerzas elementales interactúan en el universo, pero no explica cómo las partículas obtienen su masa; el empoderamiento que provoca la información en los individuos solamente se aprecia desde la perspectiva aplicada, sin que de manera particular se pueda identificar las razones por las que ésta influye en la voluntad de las personas o en la incidencia de los hechos.
Por ello, así como el llamado bosón de Higgs o la partícula de Dios constituye el día de hoy uno de los principales estudios de la física moderna a fin de dar explicación a la composición atómica y subatómica del Universo, la minería de datos puede compararse con el proceso de análisis y descubrimiento de los fundamentos por los cuales la información adquiere su valor y se transforma en conocimiento útil.
Esa fuerza básica inherente a la creación y a los componentes primarios de las cosas, se enfrentan a su vez al entorno en el cual interactúan, en el primer caso, frente a una nueva concepción de la realidad marcada por la mecánica cuántica, y en el segundo caso, relativo a la información, con relación a la conformación de los diversos códigos en los cuales el mensaje se comunica, los cuáles son susceptibles de homologarse a través de un mismo instrumento, el algoritmo.
Muestra de ello son las aplicaciones computacionales actuales en las cuáles a través de los algoritmos se logra crear representaciones de la realidad a través de signos, imágenes, videos, sonidos, sobre los cuáles se interactúa en un entorno virtualizado que busca explotar e incrementar los aplicativos en torno a la información derivado de diversos aplicativos que más allá de los medios físicos a través de los cuales se lleva a cabo su representación, utiliza como componente conductor al algoritmo y como insumo, a los datos.
Datos que se encuentran tan presentes en nuestra realidad como los propios átomos y sus elementos, pero que encierran tantas interrogantes difíciles de descifrar, para lo cual se requieren importantes esfuerzos por parte de la ciencia y la industria, que en particular, en el ámbito de la información, han dado lugar a las Ciencias en Ciencia de Datos, que involucra diversas actividades para brindar contexto a los datos, significados e interpretación para generar aplicativos y soluciones.
Labor multidisciplinaria que requiere de operadores denominados científicos de datos, que no se limita a perfiles de programación, ingeniería e/o informática, sino de las propias ciencias sociales derivado de las diversas perspectivas que se requieren para la interpretación de la realidad social en la cual se espera que los datos produzcan sus efectos.
Lo anterior, debido a que el adecuado tratamiento y procesamiento de la información puede dar lugar a ventajas derivadas en principios de un mejor entendimiento de nuestro entorno y en el que los datos personales cuentan con grandes usos potenciales, tal como se ha logrado observar a partir del procesamiento de grandes grupos de datos, que inclusive pueden predecir o describir diversos fenómenos tales como epidemias, hambrunas, movimientos geopolíticos, inconformidades sociales y hasta tendencias.
En lo individual, destaca la gran capacidad de control y evaluación de la personalidad de los individuos y su injerencia en su entorno social, lo cual, se ha ejemplificado en películas de ciencia ficción como la limitación de la propia autodeterminación y libre albedrío, en películas como Minority Report que predice el comportamiento criminal o supuestos de la vida real, en donde las autoridades de inteligencia de un Estado han iniciado sus actividades de vigilancia a partir de búsquedas de Google a partir de pedidos sospechosos o preguntas en torno a actividades criminales que han activado protocolos de seguridad, en personas que no tienen ningún nivel de peligrosidad o que no encuadran con el perfil esperado.
Lo anterior, aunado a que ciertos procesamientos son estratégicos, tales como los de Google, en los cuales existe una gran cantidad de información de calidad sobre los gustos de las personas, derivado de las preferencias de búsqueda que podrían ser catalogadas como íntimas e inclusive sensibles, mismas, que seleccionadas correctamente pueden estar libres de sesgos con relación a otras pruebas invasivas, incluidas las evaluaciones psicométricas, por lo que ciertas que coinciden con la data de esta colaboración como que las personas no pueden mentirle a Google, y a su vez, que la consciencia social sobre el uso de nuestra información personal constituye un eufemismo, sobre el cual existe una necesidad imperante de abordar crudamente.
Perspectivas desde las cuales, se justifica de sobremanera la garantía social de la seguridad en el entorno digital, pero que para el cierre de la presente colaboración, quisiera virar el cauce hacia los datos sobre los cuáles se debe favorecer su explotación en el ámbito gubernamental: los datos abiertos.
Desde la posición anterior, puede apreciarse del gran poder de los datos, por encima de la información, en el entendido de que en la actualidad contamos con la capacidad tecnológica de gestionar el conocimiento a través de procesos automatizados, precisando, que los conceptos: datos, información y conocimiento deben analizarse por separado. Así, tal como los datos de las personas pueden ser explotados y reutilizados en diversas aplicaciones, los datos derivados de cualquier actividad pueden facilitar la propia comprensión de su actividad y finalidades, tal como el caso del gobierno y sus fines.
Esa interpretación de la realidad, le seguirá correspondiendo a la ciencia política a través de procesos cada vez más avanzados, sin embargo, la demanda ciudadana actual debe empezar a adecuarse conforme a las tendencias actuales, para ello, la información que genera el gobierno no debe limitarse a la generación de informes o interpretaciones parciales, sino que, para lograr el acceso a las probables soluciones, debemos empezar a analizar la información, y para ello, debemos dejar que los datos estén a disposición de todos, no sólo para su interpretación, sino para su explotación.
Es así que una de las demandas de un gobierno abierto son los datos abiertos, entendidos éstos como los datos digitales de carácter público que son accesibles en línea que pueden ser usados, reutilizados y redistribuidos por cualquier interesado y que tienen como características ser accesibles, integrales, gratuitos, no discriminatorios, oportunos, permanentes, primarios, legibles por máquinas, en formatos abiertos y de libre uso, ya que a partir de los mismos, de manera independiente a que el gobierno proporcione las interpretaciones, la propia ciudadanía puede implementar los mecanismos para llevar a cabo su uso a través de aplicaciones.
Datos sobre los cuales más adelante, con la finalidad de ejemplificar no solamente sus funcionalidades, sino la complejidad de la ciencia de datos, como la actividad que involucra el procesamiento e interpretación de los datos, como un activo que puede ser de un gran valor al igual que el día de hoy se investiga sobre el bosón de Higgs y la realidad frente a la mecánica cuántica, puede ser, no ser y ser o no ser a la vez un producto de valor.
Hasta la próxima.
Abogado especializado en TICs, privacidad y cumplimiento legal. Maestro en Derecho de las Tecnologías de Información y Comunicación por INFOTEC.