¿Qué es la gestión del ciclo de vida de los datos?

¿Alguna vez te ha resultado difícil determinar y administrar la información de los datos? Uno de los principales retos a los que se enfrentan las empresas es gestionar adecuadamente la información.

Cuanto más grande es una empresa, más difícil se vuelve administrar los datos que genera de manera consistente y segura. Si bien esto puede parecer un problema benigno al principio, las consecuencias de la mala gestión de los datos pueden conducir rápidamente a cosas como la proliferación de datos, la pérdida de archivos o violaciones de la privacidad que pueden dañar gravemente a una empresa.

Es por eso que es vital para las empresas modernas desarrollar una estrategia integral de administración del ciclo de vida de los datos (DLM) para almacenar y administrar de manera eficiente volúmenes de datos cada vez más grandes. Sigue leyendo para descubrir qué es exactamente la gestión del ciclo de vida de los datos y por qué es tan importante para las empresas basadas en datos de hoy.

¿Qué es la gestión del ciclo de vida de los datos (DLM)?

La gestión del ciclo de vida de los datos se define como «un enfoque basado en políticas para gestionar el flujo de datos de un sistema de información a lo largo de su ciclo de vida, desde la creación y el almacenamiento inicial hasta el momento en que se vuelve obsoleto y se elimina». DLM es el esfuerzo de una organización para administrar sus datos utilizando diferentes técnicas, procesos y herramientas DLM.

Si bien las organizaciones entienden la importancia de los datos, protegerlos, preservarlos y administrarlos es un juego completamente diferente. A este desafío se suman las complejas regulaciones y el hecho de que los datos ahora residen en múltiples lugares: en las instalaciones, en la nube, en máquinas de trabajo remotas y en plataformas SaaS.

Tener una estrategia sólida de DLM ayudará a las empresas a estabilizarse al día con las regulaciones en constante evolución y los requisitos de eDiscovery. DLM permite a las organizaciones aprovechar al máximo sus datos. También les brinda un mayor control sobre los datos de su organización, ayuda a satisfacer las necesidades de archivado, minimiza la carga de TI, reduce los costos de almacenamiento y permite una toma de decisiones más rápida y una rápida recuperación durante una crisis.

La gestión del ciclo de vida de los datos es el proceso de gestión de la información, siguiendo la vida de los datos desde el momento en que se crean y almacenan por primera vez, hasta el momento en que se archivan o destruyen cuando dejan de ser útiles.

Esto asegura que los datos se manejen de manera consistente y responsable, sin importar su origen o propósito. Todo esto se logra a través de políticas automatizadas que se definen de antemano, para minimizar el potencial de error humano en cualquier parte del proceso.

¿En qué se diferencia DLM de ILM?

La gestión del ciclo de vida de los datos y la gestión del ciclo de vida de la información (ILM) a menudo se confunden como sinónimos y se usan indistintamente, ya que ambos son enfoques basados ​​en políticas para la gestión de datos. Sin embargo, estos conceptos están diseñados para diferentes propósitos y existen algunas diferencias importantes entre ellos.

DLM se ocupa del flujo de datos de una etapa a otra, desde la recopilación o creación de datos hasta la eliminación o reutilización. DLM tiene como objetivo responder cuando se deben eliminar ciertos datos, mientras que ILM se ocupa de la relevancia y precisión de la información. La diferencia clave entre DLM e ILM es que DLM opera en archivos completos de datos o registros, mientras que ILM opera en la información que se encuentra en el archivo.

Los productos DLM administran archivos de datos según su tipo, tamaño y madurez. Permiten a las empresas buscar un determinado tipo de archivo de un determinado dentro de los datos almacenados. Por otro lado, los productos de ILM van más allá y permiten a las empresas buscar en varios tipos de archivos una información en particular de manera oportuna, como la dirección de correo electrónico de un cliente.

Si bien ILM a menudo se considera un subconjunto de DLM, tanto DLM como ILM son vitales para la estrategia de protección de datos de una organización.

Objetivos

Las organizaciones manejan más datos que nunca, y esos datos pueden almacenarse en las instalaciones, en entornos de borde, en plataformas en la nube o en cualquier combinación de estas plataformas. La necesidad de una estrategia DLM efectiva nunca ha sido mayor, pero la estrategia debe ser integral para ser efectiva.

Muchos recursos citan los siguientes tres objetivos, o una variación cercana de ellos, como los más importantes para lograr en una estrategia DLM efectiva:

  • Seguridad y confidencialidad de los datos. Los datos deben almacenarse de forma segura en todo momento para garantizar que la información privada, confidencial y demás información delicada esté protegida continuamente contra posibles compromisos.
  • Integridad de datos. Los datos deben ser precisos y fiables independientemente de dónde se almacenen, cuántos usuarios accedan o trabajen con esos datos o cuántas copias de los datos se mantengan.
  • Disponibilidad de datos. Los usuarios aprobados deberían poder acceder a los datos cuando y donde necesiten ese acceso, sin interrupciones en sus flujos de trabajo u operaciones diarias.

La seguridad y la confidencialidad de los datos se han vuelto cada vez más importantes a medida que las organizaciones se enfrentan al creciente cuerpo de regulaciones de cumplimiento, como la Ley Sarbanes-Oxley (SOX), el Reglamento General de Protección de Datos (RGPD), la Ley de Portabilidad y Responsabilidad del Seguro Médico (HIPAA) y la Ley de Privacidad del Consumidor de California (CCPA).

Los expertos en administración de datos enfatizan que la administración del ciclo de vida de los datos no es un producto, sino un enfoque integral para administrar los datos de una organización, que involucra procedimientos y prácticas, además de aplicaciones.

Beneficios

¿Qué obtienes cuando implementas DLM? Lo que debes saber es que cuando una empresa implementa la gestión del ciclo de vida de los datos y asegura un buen manejo de la información que produce en sus operaciones diarias, tiene varias ventajas, que incluyen:

  • DLM te permite cumplir con los requisitos que aplica cada sector de la industria para que se pueda cumplir con el almacenamiento de datos.
  • En este caso garantizar una buena infraestructura de protección de datos, que te ayude en tu seguridad en caso de riesgo o emergencia. Esto también se aplica a la información interna y los datos de los clientes que trabajan con empresas.
  • La extracción y el mantenimiento de la información a lo largo del ciclo de datos permiten que los valores actualizados estén siempre disponibles.
  • Disponibilidad de datos útiles, limpios y precisos a disposición de todos los usuarios. Incrementando así la agilidad y eficiencia de los procesos de la empresa.

Fases

Para que entiendas realmente cuáles son las implicaciones de la aplicación de la gestión del ciclo de vida de los datos para una empresa, es necesario conocer cada fase por la que pasan los datos durante su vida útil.

1. Recopilación de datos

El ciclo de vida de los datos comienza con la recopilación de información. Esto permite la creación de valores que aún no existen, pero que se necesitan como parte de las operaciones de la empresa.

En este caso, la primera experiencia requerida por un elemento de datos es pasar dentro del firewall de la empresa. Esto muestra la recuperación de datos, que se puede definir como una acción para crear valor de datos que aún no existe en la empresa.

Hay tres formas principales en que se pueden capturar los datos, y esto es muy importante:

  • Adquisición de datos: uso de datos existentes que han sido producidos por organizaciones fuera de la empresa.
  • Entrada de datos: crea nuevos valores de datos para empresas por humanos o dispositivos que producen datos para empresas.
  • Recibo de señal: recuperación de datos realizada por el dispositivo, generalmente importante en el sistema de control, pero se vuelve más importante para los sistemas de información con el Internet de las Cosas.

Puede haber otras formas, pero las tres que se han identificado anteriormente tienen un desafío de gobierno de datos más importante. Por ejemplo, en la adquisición de datos, a menudo involucramos contratos que pueden regular cómo las empresas pueden usar los datos que obtienen de esta manera.

2. Mantenimiento de datos

Cuando obtengas datos basados ​​en la primera fase, asegúrare de mantenerlos limpios. En otras palabras, procesarlos para que los procesos comerciales puedan ejecutarse de manera efectiva.

Después de tomar los datos anteriormente, generalmente encontrarás Mantenimiento de datos. Esto se puede definir como el suministro de datos a los puntos donde se produce la síntesis de datos y el uso de datos, idealmente en la forma más adecuada para este fin.

El Mantenimiento de Datos es el tratamiento de datos sin obtener de ellos ningún valor para la empresa. Esto a menudo implica tareas como movimiento, integración, limpieza, enriquecimiento, recuperación de datos modificados, así como procesos conocidos de extracción, transformación y carga.

3. Síntesis de datos

Esta fase del ciclo de vida de los datos no es común a toda la información que se procesa, pero es importante en los casos en que es necesario obtener datos valiosos a través del razonamiento inductivo. Este tipo de análisis también se utiliza en el modelado de riesgos, la contabilidad y las decisiones de inversión.

Esta es una arena analítica que utiliza modelado, como se encuentra en el modelado de riesgo, modelado actuarial y modelado para decisiones de inversión.

La disminución de acuerdo con la lógica deductiva no es parte de esto, lo que sucede en el mantenimiento de datos. Un ejemplo de lógica deductiva es Ventas netas = Ventas brutas – Impuestos. Si conozco las ventas brutas y los impuestos, y conozco la ecuación simple que se acaba de describir, entonces puedo calcular las ventas netas.

4. Uso de datos

En la fase del ciclo de vida, estos datos se caracterizan por la aplicación de los datos recopilados y procesados ​​como parte de la administración de la empresa. Ten en cuenta que en muchas empresas esta información es incluso parte de su modelo de negocio.

Asimismo, debemos demostrar que una adecuada gestión de los datos en esta fase implica conocer las posibles restricciones de uso que puedan tener esta información.

El uso de datos tiene desafíos especiales de gobierno de datos. Uno de ellos es si es legal usar los datos de la forma en que la gente de negocios quiere que se haga. Esto se conoce como «uso de datos permitido».

5. Publicación de datos

Lo que necesitas saber, el uso de la información también se puede hacer fuera del entorno empresarial en sí. En otras palabras, cuando se usa, tal vez su valor de datos único se pueda enviar fuera de la empresa. Esto se puede definir como el envío de datos a ubicaciones fuera de la empresa.

Un ejemplo es cuando alguien envía informes mensuales a sus clientes. Después de que los datos se envían fuera de la empresa, es imposible recordarlos. Los valores de datos incorrectos no se pueden corregir porque están fuera del alcance de la empresa.

En este caso, es posible que el gobierno de datos deba ayudar a decidir cómo se manejarán los datos incorrectos que se han enviado desde la empresa. Lamentablemente, las filtraciones de datos también se incluyen en la publicación de datos.

6. Almacenamiento de datos

El almacenamiento es el primer paso que se da al principio del final del ciclo de vida de los datos.

En esta fase, los datos se almacenan sin más procesamiento. Entonces, en esta fase, los datos esperan su eliminación del entorno de producción activo o su recuperación, si es necesario.

Se necesita saber si el archivo de datos está copiando datos a un entorno donde se almacenan si es necesario nuevamente en el entorno de producción activo y elimina estos datos de todos los entornos de producción activos.
Por lo tanto, los archivos de datos son solo lugares donde se almacenan los datos, pero donde no se realiza mantenimiento, uso o publicación.

7. Limpieza de datos

Una vez que los datos ya no sean útiles para la empresa, los datos deben eliminarse. Este proceso debe llevarse a cabo correctamente para garantizar una buena gestión de los datos.

La importancia de una buena gestión del ciclo de vida de los datos y el seguimiento de todas las fases del ciclo de vida de los datos es crucial para una gran cantidad de acciones que realizan las empresas todos los días.

Prácticas recomendadas de gestión del ciclo de vida de datos (DLM)

Ahora que sabes qué es DLM y por qué tu empresa debería implementarlo, analicemos las mejores prácticas para la implementación. Aunque esta no es una lista exhaustiva de todo lo que necesitas saber al crear una política de administración de datos, estas son algunas de las cosas más importantes que debes recordar.

  • Crea y define tipos de datos que controlen cómo se manejará cada tipo de archivo. Estos tipos de datos pueden ser cualquier cosa, desde recibos hasta datos de clientes y cualquier otra cosa que una organización pueda tener como registro.
  • Utiliza un esquema de nomenclatura coherente que se aplique a todos los datos de tu organización. Al asegurarse de que todo tenga el nombre apropiado, los datos se vuelven más fáciles de administrar y acceder.
  • Guarda nuevos datos a través de un amplio plan de copias de seguridad. Esto garantiza la redundancia y te protege de la posible pérdida de datos por accidentes, desastres y ransomware. Una forma de lograr este tipo de redundancia es mediante el uso de un servicio de almacenamiento en la nube empresarial para almacenar tus datos.
  • Considera implementar un servicio empresarial de sincronización y uso compartido de archivos, que cuenta con múltiples herramientas para automatizar el manejo de la información a lo largo de todas las fases de su vida útil.
  • Archiva los datos si se utilizan con poca frecuencia o si simplemente deben conservarse para cumplir con los estándares normativos. Ejemplos de datos comúnmente archivados son cosas como registros de clientes o recibos de transacciones.
  • Libera espacio destruyendo los datos cuando lleguen al final de su vida útil. Sin embargo, una política adecuada de destrucción o eliminación es fundamental para garantizar que no se elimine accidentalmente nada que deba archivarse para referencia posterior. Es importante que tu empresa conozca las reglamentaciones que se aplican a sus actividades y trate los datos en consecuencia para garantizar el cumplimiento.

Una breve historia de la gestión del ciclo de vida de los datos

Las tecnologías para almacenar datos han existido por más tiempo de lo que muchos imaginarían. Casi en paralelo con la adopción de estas tecnologías hubo un crecimiento en el volumen de datos y, como resultado, la gestión de esos datos a lo largo de su ciclo de vida.

Aquí hay una revisión rápida de la tecnología para almacenar datos, en última instancia, los impulsores detrás de la gestión del ciclo de vida de los datos:

  • Tarjeta perforada mecánica: Inventada en 1890, se usó por primera vez para contar el censo de 1890.
  • Cinta magnética: Inventada en 1928, la cinta magnética se usó originalmente para grabar audio. Su uso se amplió al almacenamiento de datos en 1951 con la invención del UNISERVO I, que se implementó en la computadora UNIVAC I. Las unidades de cinta UNISERVO proporcionaban funciones de lectura y escritura a una velocidad de 12,8 KBps y podían almacenar hasta 184 KB de datos.
  • Unidad de disco duro (HDD): Enviada por primera vez por IBM en 1956, la unidad de disco duro fue diseñada para funcionar con la computadora central IBM 305 RAMAC. Permitió a las empresas registrar y mantener datos en tiempo real y brindó la posibilidad de acceder aleatoriamente a cualquier registro.
  • Virtualización: CP-68 fue el primer sistema operativo de máquina virtual. Fue diseñado para System/360 de IBM.
  • Unidad de estado sólido (SSD): La primera unidad de estado sólido fue lanzada en 1976 por Dataram. Podía albergar hasta ocho placas de memoria con 256 KB de chips RAM.
  • Almacenamiento definido por software (SDS): El concepto de almacenamiento definido por software nació en la década de 1990. El almacenamiento definido por software proporcionó software de almacenamiento de datos para el aprovisionamiento basado en políticas y la gestión del almacenamiento de datos que era independiente del hardware.
  • Almacenamiento en la nube: Creado en la década de 1960, el almacenamiento en la nube se usó más comúnmente a fines de la década de 1990. A fines de la década de 2000, los proveedores de servicios de almacenamiento en la nube, la computación en la nube y SaaS se convirtieron en la corriente principal.

La gestión del ciclo de vida de los datos tiene sus orígenes en la década de 1980 con la introducción del almacenamiento en memoria de acceso aleatorio (RAM) y la transición de tarjetas perforadas mecánicas y almacenamiento en cinta magnética a bases de datos. A medida que disminuyeron los costes de almacenamiento de datos, los volúmenes de datos crecieron.

De ahí empezó el problema. Rápidamente surgieron problemas, como la duplicación de datos, la mala calidad de los datos, los desafíos de seguridad, el respaldo de datos, las dificultades de recuperación y el caos general de demasiados datos con muy poca organización de archivos.

Conclusión

En su nivel más básico, la gestión del ciclo de vida de los datos es simplemente la capacidad de rastrear y gestionar los datos de una empresa a lo largo del tiempo. Un número creciente de organizaciones ya cuenta con programas para brindar actualizaciones y garantizar el flujo continuo de información, pero algunas se están negando a crear un enfoque estructurado para el ciclo de vida de los datos. Las empresas necesitan una herramienta que pueda guiarlos a través de todos estos procesos, desde el concepto hasta la implementación, asegurando que todos sus datos estén protegidos, administrados y entregados de manera efectiva.

Al actualizar tu herramienta de administración del ciclo de vida de los datos con la ayuda de la información de este artículo, puedes asegurarte de que tus datos estén seguros y accesibles, que los datos correctos se utilicen de la manera correcta y que cualquier defecto de datos se descubra y corrija antes. Las nuevas herramientas modernas que pueden reunir fuentes de datos estructurados y no estructurados en toda la empresa ayudan a desglosar los silos de datos y ofrecen una vista de 360 ​​grados a menudo al nivel de un solo cliente.