¿Podremos confiar en la tríada Cloud Computing, Big Data y Business Analytics?

http://diplomaticapuntcat.blogspot.com
Joan Soler Jiménez
Es cosa sabida que los datos en formato electrónico pueden estar estructurados, semiestructurados o no-estructurados. Los estructurados lo están en bases de datos; los semiestructurados se «semiorganizan» usando lenguages de marca como el XML; y los no-estructurados los encontramos en sistemas de directorios más o menos organizados ubicados en unidades de red, por ejemplo. Las organizaciones ya hace tiempo que tienen detectado en los no-estructurados el «marrón» de la gestión de la información, y para resolver su descontrol y su volumen en bits aplican tecnología de largo alcance. Un 80% de los datos generados por las organizaciones se encuentran en situación no-estructurada y por este motivo necesitan de soluciones de alto impacto.

Los Sistemas de Gestión de Documentos deben lidiar con estos tres conjuntos de datos y deben «domesticar» los distintos entornos donde se utilizan y producen. Los documentos electrónicos pueden representarse a partir de cualquiera de estos tres tipos de datos. Gestionar estos tres estadios en que se encuentran los datos necesita de soluciones distintas. Evidente es que cuanto más estructurados estén los datos más sencilla parece ser su recuperación, accesibilidad y usabilidad. Pero «estructurar» datos es una tarea ardua, lenta y de timing alargado.

Las soluciones más novedosas que aporta el mercado parecen orientarse a la gestión y explotación de los no-estructurados. Parece difundirse rápidamente la idea de que es poco eficiente y escasamente rendible «estructurar» lo no-estructurado. Se necesita, como hemos dicho, demasiado tiempo, y la estructuración puede ser poco flexible,  poco operativa y de difícil demostración su mejora. Es un debate de profundidad: ¿Debemos destinar más tiempo y recursos en reorganizar los datos no-estructurados en las unidades de red a partir de un cuadro de clasificación organizado según directorios y gestionar «a mano» los documentos electrónicos que encontramos en ellas?¿Es el programario de gestión documental la solución a los datos no-estructurados? ¿Cual es la media temporal que se tarda en implantar efectivamente un gestor documental?¿Bajo el paradigma de la mejora continuada no se puede esconder la incapacidad de poder «estructurar» grandes volúmenes de datos y sus representaciones documentales? La gestión de documentos va a un ritmo infinitamente más lento que la producción de datos que diariamente crean las organizaciones. Y ante este problema, las soluciones del mercado buscan no tanto la «estructuración» como la explotación de datos no-estructurados.
Las tres soluciones más innovadoras que ofrece el mercado hoy en día son: el Cloud Computing, para la externalización de la gestión de la memoria ocupada por los datos producidos; la tecnología Big Data como la que permitirá la recuperación de datos útiles en tiempos exiguos en medio de volúmenes altísimos de datos no-estructurados; y la Business Analytics, la aplicación de racionalización de los datos recuperados para que produzcan información relevante, significativa y útil que nutra las actividades de negocio de las organizaciones.
El Cloud Computing parece ser el sistema que permitirá la disminución de los costes de preservación de grandes volúmenes de datos por parte de las organizaciones, aunque deje a la deriva algunas responsabilidades que tradicionalmente han sido asumidas por estas. Así la función «archivo» puede quedar en entredicho si la responsabilidad final de la preservación de estos datos, sea en una nube pública o privada, se desplaza a los responsables de sistemas y a los gestores de bases de datos. En nuestro campo de estudio, el Cloud Computing ofrece dudas en cuanto a la organización de las responsabilidades y competencias actuales. Hay que estar atentos.
La tecnología Big Data pone en cuestión el esfuerzo realizado los últimos años en la ordenación de los datos «no-estructurados», pero también es cierto que la no-estructuración impide que algunas representaciones documentales puedan tener la fiabilidad jurídica necesaria. Por este motivo, los datos semi-estructurados, la generación de objetos digitales, parece ser aún una necesidad previa a la explotación de los datos mediante cargas de profundidad «big». La seguridad jurídica en fase de vigencia, pero también en fase inactiva y de conservación, debe continuar considerándose en fase de producción, y la consolidación mediante el XML-glu de los objetos digitales, vital. Quizás una estructuración total ya no es viable, si consideramos la ratio tiempo-esfuerzo, pero una semi-estructuración parece ser recomendable mientras la representación documental siga siendo necesaria en entornos jurídicos, administrativos, legales o fiscales de tono tradicional.
La explotación de datos mediante la Business Analytics, una evolución de la Business Intelligence, debe ser una solución importante a medida que los volúmenes de datos se incrementen geométricamente. Una opción interesante, desde el punto de vista diplomático, será que estos sistemas permitan considerar la autenticidad documental mediante la comprobación de todos los elementos que conforman la forma intelectual de las representaciones documentales. ¿Sería viable una ontología de la autenticidad documental mediante algun lenguage tipo RDF o OWL que permitiera verificarla en los documentos electrónicos, sin necesidad de una firma electrónica? ¿Permitirían las aplicaciones de Business Analytics destilar estar comprobación sin necesidad de comprometer la integridad documental? Quizás es ciencia ficción, pero sinceramente creemos que cada vez más rápidamente nos dirigimos hacia nuevas situaciones de confianza en que el documento deviene otro tipo de «representación» de la que conocíamos hasta ahora, y esta debe ser convincente aunque no se parezca en nada a lo conocido.
Share

Deja un comentario