Na primeira parte desta série de blogs, exploramos os desafios associados ao cenário atual de dados e os motivos pelos quais mais e mais organizações precisam de uma solução automatizada de descoberta de dados para enfrentar esses desafios. A quantidade crescente de dados sendo processados, o cenário regulatório em evolução e a variedade de tecnologias (sistemas legados, data lakes, ferramentas SaaS, etc.) que armazenam e processam dados são apenas alguns dos desafios que as organizações enfrentam quando se trata de dados. Iremos explorar agora o que você deve procurar em soluções de Descoberta de Dados.
As organizações adotam uma série de abordagens para lidar com os desafios de dados. Ainda que a abordagem ideal possa variar com base em fatores internos e externos, existem alguns erros comuns que muitas empresas cometem ao tentar conhecer e governar seus dados:
– Bloqueio e governança excessiva: muitas organizações receiam fazer mau uso de seus dados, resultando em multas, violações de dados ou perda de confiança dos stakeholders. Uma resposta típica para garantir que isso não aconteça é bloquear ou controlar excessivamente os dados. Isso pode significar dar acesso aos dados somente a um número limitado de indivíduos ou cientistas de dados para tentar atender às necessidades de todo o negócio, ou colocar muitos processos de aprovação e burocracia entre as áreas de negócio e os dados de que precisam. Em uma economia data-driven, onde os dados são um ativo e uma vantagem competitiva, esta não é uma solução que pode se aplicar para a maioria das empresas.
– Depender de processos manuais de descoberta de dados: algumas organizações podem optar por abrir mão da implantação de soluções automatizadas de descoberta de dados em favor de uma abordagem manual que talvez seja mais barata e rápida de implementar. Abordagens manuais para descoberta de dados normalmente envolvem o levantamento de informações junto aos responsáveis de TI, que fazem perguntas sobre os tipos de dados, como eles fluem e por que são usados. Embora pesquisas e avaliações desempenhem um papel fundamental nos programas de privacidade, segurança e governança de dados, utilizá-los como o único método de descoberta de dados pode se tornar entediante e um desperdício de recursos. Esta tática geralmente fornece um reflexo desatualizado e impreciso de quais dados existem e como são gerenciados.
Embora o bloqueio de dados e a realização de processos de descoberta manual sejam essenciais para os programas de privacidade, segurança e governança de dados, esses métodos devem ser realizados em conjunto com uma solução automatizada de descoberta de dados, para que as organizações possam lidar com os desafios atuais.
Elementos essenciais de uma solução eficaz de descoberta de dados
Uma solução de descoberta de dados verdadeiramente automatizada ajuda as organizações a entenderem seus dados em seus negócios e nas relações com terceiros. Isto é feito conectando e fazendo a varredura de sistemas de TI, aplicando Inteligência Artificial, aprendizado de máquina e outras tecnologias para classificar, marcar, enriquecer os dados e, em seguida, adicionar ao inventário e tomar ações sobre esses dados de diferentes maneiras. Quase todas as soluções de descoberta de dados são capazes de realizar estas tarefas de alguma maneira; portanto, sua empresa deve se aprofundar ao avaliar a ferramenta mais adequada. Algumas funcionalidades essenciais a serem buscadas em uma solução de descoberta de dados incluem:
– Descoberta nos sistemas conhecidos e desconhecidos – Muitas ferramentas de descoberta de dados exigem que a organização conheça todos os sistemas de TI aos quais se deseja conectar e varrer seu conteúdo. Em grandes organizações é comum que os dados estejam espalhados por centenas ou milhares de sistemas, e a chamada Shadow IT quase sempre está presente de alguma forma. Portanto, é fundamental que a sua solução de descoberta ajude a identificar todos os seus sistemas, fazendo referência às fontes existentes dessas informações em seu negócio, tais como CMDB, IAM, CSPs e ferramentas CASB, para garantir que você tenha um inventário preciso de todos os ativos de dados.
– Indo mais a fundo que os metadados – Algumas soluções de descoberta de dados verificam apenas ao nível dos metadados e tentam fornecer informações sobre os dados que você possui, sem analisar os dados reais. Frequentemente, os dados confidenciais que você deseja identificar não serão encontrados desta maneira. Este pode ser o caso com dados estruturados – talvez dados de cartão de crédito tenham sido inseridos por engano em um campo chamado “Número de Telefone” – e principalmente com dados não-estruturados, tais como arquivos, e-mails, e sistemas com campos de texto livre.
– Abordagem escalável em grandes volumes de dados – Atualmente, a maioria das organizações possui petabytes de dados. Uma solução de descoberta de dados que sempre realiza uma varredura completa de todos os dados não é escalável nem eficiente. Mesmo sendo fundamental aprofundar-se além dos metadados, também é importante adotar uma abordagem escalável que equilibre a varredura de conjuntos completos de dados com varredura de amostras menores de dados, quando apropriado.
– Inteligência Artificial treinada com os dados corretos – IA, aprendizado de máquina e outras tecnologias semelhantes usadas para classificação e enriquecimento de dados são tão boas quanto os dados nas quais foram treinadas. Procure soluções de descoberta que treinem sua tecnologia nos mais atuais requisitos regulatórios, frameworks e definições de dados, a fim de garantir que o contexto de governança adequado seja aplicado aos seus dados.
O último elemento crítico a ser considerado é, uma vez que você conhece seus dados, o que fazer com essas informações? Muitas soluções de descoberta de dados são apenas isso – soluções de descoberta de dados. Depois que os dados são descobertos, essas ferramentas precisam se integrar a outras soluções para ajudar suas equipes de privacidade, segurança e governança de dados a agir e governar os dados. Cada uma dessas equipes tem diferentes casos de uso quando se trata de acionar essas informações.
A equipe de privacidade precisa não apenas processar DSARs e outros pedidos de dados, mas criar registros do processamento de dados pessoais. A equipe de segurança precisa controlar acessos e compreender os riscos apresentados pelos sistemas de TI. A equipe de governança de dados precisa mapear a linhagem dos dados, aplicar políticas de governança e permitir o uso dos dados para análise e valor de negócios. Procure uma ferramenta de descoberta de dados que possa se integrar a essas soluções ou considere uma plataforma capaz de fazer tudo isso.
A OneTrust não apenas ajuda você a descobrir, classificar e conhecer seus dados, mas também fornece a plataforma completa para ajudar as equipes de privacidade, segurança e governança de dados a operacionalizar as ações posteriores, os processos de governança e os relatórios de conformidade que precisam ocorrer após a descoberta. Entre em contato conosco para saber mais sobre OneTrust DataGovernance e OneTrust DataDiscovery.
No próximo blog desta série, discutiremos como a descoberta de dados ajuda as equipes de privacidade a automatizar os desafios do processamento de dados pessoais em conformidade com as regulamentações mundiais de privacidade, incluindo a LGPD.
Leia mais nesta série: Por que sua organização precisa de Descoberta de Dados automatizada?
Assista ao webinar: Automatize seu programa de privacidade com Descoberta de Dados (em inglês)