El cloud se ha convertido en un imán para todo tipo de empresas: para startups que no quieren invertir demasiados recursos en construir una infraestructura TI propia, para empresas ya establecidas que aspiran a ganar en eficiencia trasladando algunas aplicaciones y cargas de trabajo a la nube y por para las que ofrecen aplicaciones SaaS o DaaS (data-as-a-service).
Y no solo eso. Teniendo en cuenta las particularidades del mercado y las distintas alternativas que ofrece, cada vez son más las que optan por escenarios multicloud, trabajando a la vez con proveedores como Amazon Web Services, Google Cloud Platform o Microsoft Azure, mientras configuran un despliegue IT híbrido en el que se incluye su centro de datos on premises.
Esto que desde luego tiene muchas ventajas, presenta también distintos retos a superar cuando los usuarios necesitan acceder a una visión completa de los datos que manejan. Los entornos híbridos aumentan la complejidad de la gestión TI de las empresas y suponen deafíos en términos de gobernanza y seguridad de los datos.
Finalmente, hay quetener en cuenta que acceder a esa visión completa de los datos mediante una aproximación tradicional (migración entre fuentes, replicación, transformación, enriquecimiento, etc.) en entornos híbridos/multicloud puede derivar en distintos cuellos de botella, generando todo tipo de ineficiencias. En este sentido y para simplificar la integración de los datos y su análisis posterior.
Virtualización de los datos
Más que nunca, las organizaciones necesitan una estrategia de integración de datos. La forma en la que las empresas han llevado sus silos de datos al cloud ha provocado que la gestión de los mismos sea cada vez más compleja.
Para unificar e integrar, la virtualización de datos puede aliviar en este terreno la complicación que conlleva el despliegue de túneles de datos para extraerlos de cada una de las fuentes en las que se encuentran y trasladarlos después a un data lake, ya sea local o en la nube.
Acceso a silos multicloud
Aunque las ventajas de aproximación multicloud son evidentes (evitar vendor lock-in, ahorro de costes, etc.) la mayoría de los usuarios se enfrentan al mismo problema: al crecer el número de silos de datos, se incrementa la necesidad de contar con conocimientos cada vez más técnicos y especializados en cada uno de estos. Esto no solo limita su integración, sino también que la empresa tenga una visión de los mismos unificada.
Mediante una capa de virtualización de datos los usuarios pueden resolver este problema, al combinar de forma virtual fuentes dispares de datos para crear nuevas vistas lógicas.
Integración eficiente
Las organizaciones deben examinar cómo pueden reducir movimiento y migración de datos, que son habitualmente, las fases más intensivas en tiempo de la integración de los mismos.
Y aquí aunque es cierto que la virtualización de los datos no elimina por completo la necesidad de migrarlos, le da a las organizaciones la posibilidad de dejarlos «intactos», replicando de forma virtualizada solo los necesarios en un data warehouse en la nube.
Sincronizar la virtualización
En escenarios híbridos y multidistribuidos, en la que se almacena información estructurada y no estructurada en una arquitectura multicloud, suele ser difícil encontrar un recurso desde el que acceder a un «conocimiento» uniforme de todos los datos con los que contamos.
Al sincronizar sin embargo la virtualización de los datos con los metadatos y la gestión de datos semánticos con la que contamos, las organizaciones pueden avanzar hacia su integración en dos frentes: metadatos y especificaciones compartidas y modelos de datos semánticos de alto nivel.
Gobernanza
En los entornos híbridos multi-cloud el gobierno de los datos es más complicado. Las organizaciones necesitan asegurarse en este sentido de que cuentan con las mismas reglas, políticas, procesos, etc. en cada uno de los silos en los que almacenan sus datos. Conocer de qué forma se accede y contar con mecanismos que sancionan los accesos indebidos.
En este punto, una capa de virtualización de los datos puede mejorar la forma en la que las organizaciones determinan el acceso a los mismos, estableciendo un punto de acceso único, de modo que solo los usuarios autorizados pueden trabajar con datos sensibles.
Cuellos de botella
Al apostar por la virtualización de los datos, incrementamos su agilidad, reducimos el volumen de las cargas de trabajo y facilitamos que no aparezcan cuellos de botella en el desarrollo y despliegue de aplicaciones y datos.
Fuente: Muy Computer Pro