Na era cloud-first, as abordagens tradicionais de tecnologia de proteção de dados lutam para acompanhar o ritmo de inovação dos tempos modernos. Os dados estão crescendo rapidamente em volume, variedade e velocidade. Eles estão se tornando cada vez mais desestruturados e, portanto, mais difíceis de detectar e, consequentemente, de proteger. Atualmente, a maioria das soluções de DLP depende apenas da análise de dados textuais para detectar quais dados são confidenciais, utilizando padrões de caracteres regulares e técnicas de correspondência de conteúdo aplicadas a tipos de dados "convencionais" (como documentos do Word e planilhas). Essas técnicas já foram revolucionárias; hoje, elas estão ultrapassadas.
Não me entenda mal: é fundamental que o DLP seja equipado com o maior número possível de ferramentas de análise de texto - afinal, se identificável, é o conteúdo em si que é sensível. O DLP deve ser capaz de reconhecer milhares de tipos de dados confidenciais conhecidos e expressões regulares não ambivalentes, além de compreender dados específicos de países e idiomas. Para maior confiabilidade, o DLP também deve ser equipado com mecanismos de impressão digital de dados altamente dimensionáveis que possam memorizar e combinar informações específicas encontradas em bancos de dados e documentos confidenciais. O conteúdo textual deve ser claro e legível para que possa ser aproveitado por esses mecanismos. Para minimizar os falsos positivos, hoje também é fundamental aproveitar o contexto avançado, deep learning, o processamento de linguagem natural (NLP) e outras técnicas automatizadas mais recentes baseadas em ML e IA.
Quando se trata de fontes de dados não estruturados, como imagens, tradicionalmente o reconhecimento óptico de caracteres (OCR) é usado para extrair o texto, que é então digitalizado para identificação de expressão regular (regex) ou análise de correspondência exata.
Devido ao ritmo acelerado da comunicação empresarial moderna, os usuários desenvolveram novos hábitos que tornam a identificação tradicional de dados pouco confiável. Para compartilhar informações com rapidez e mais frequência, os usuários frequentemente compartilham conjuntos de dados não estruturados, como imagens, fazendo capturas de tela ou tirando fotos por meio de um smartphone para transmitir ideias rapidamente, mostrar evidências visuais, fornecer diagramas e slides em qualquer lugar ou mostrar informações de contato a um colega a partir de um repositório de dados como o Salesforce. Esses são apenas alguns exemplos.
Nesses casos, nem mesmo o OCR consegue funcionar bem por causa de imagens de baixa qualidade em que o texto não é claramente legível. Com grandes quantidades de imagens a serem processadas, o OCR e a correspondência de dados também consomem recursos excessivos, introduzindo latência na resposta a incidentes.
Evolução do DLP moderno
Para as empresas modernas, o DLP precisa evoluir. Pense na necessidade do DLP moderno como algo semelhante ao funcionamento de um cérebro humano. Nosso cérebro não precisa necessariamente ler o texto em um documento como uma foto para saber que o documento é, de fato, algo que contém informações de identificação pessoal (PII). Agora, o DLP moderno pode fazer o mesmo.
Para resolver os desafios modernos de DLP, a Netskope foi pioneira na classificação de imagens habilitada por ML. Essa técnica aproveita o deep learning e as redes neurais convolucionais (CNN) para identificar com rapidez e precisão imagens confidenciais sem a necessidade de extração de texto. Ela imita o córtex visual humano, reconhecendo características visuais como formas e detalhes, para compreender a imagem como um todo (da mesma forma que podemos reconhecer que um passaporte é um passaporte sem necessariamente ler os detalhes nele contidos). O ML permite o reconhecimento de recursos mesmo em imagens de baixa qualidade, semelhante aos recursos do olho humano. Isso é fundamental, pois as imagens podem estar borradas, danificadas ou descoloridas, mas ainda assim conter informações confidenciais.
A importância dos classificadores de dados personalizados
Os classificadores de ML da Netskope são líderes do setor e permitem a identificação automatizada de dados confidenciais, revolucionando a categorização de imagens e documentos com precisão excepcional. Essa tecnologia inovadora detecta e protege vários tipos de dados confidenciais, incluindo códigos-fonte, formulários de impostos, patentes, documentos de identificação como passaportes e carteiras de motorista, cartões de crédito e débito, bem como capturas de tela em tela cheia e capturas de tela de aplicações. Os classificadores de ML funcionam em conjunto com a análise de DLP baseada em texto (como identificadores de dados, correspondência exata, impressão digital de documentos, NLP baseada em ML e deep learning etc.), complementando a análise de DLP de um arquivo quando o texto é indecifrável ou difícil de extrair. Eles aumentam muito a precisão da detecção e ajudam a habilitar os controles de DLP em tempo real.
Mas e se eu dissesse que um conjunto de modelos de classificação de ML predefinidos pode não ser suficiente?
Hoje em dia, as organizações também possuem tipos e modelos de documentos proprietários, formulários personalizados e arquivos específicos de cada setor que estão fora do domínio dos classificadores de ML padrão. A tecnologia Train Your Own Classifiers (TYOC) da Netskope revoluciona a proteção de dados ao combinar a força da IA, a adaptabilidade do ML e a conveniência da automação. A TYOC identifica e categoriza automaticamente novos dados com base em uma abordagem do tipo "treine e esqueça". Considere esta analogia: seu cérebro pode reconhecer um documento conhecido, como um passaporte ou um formulário W-2, mas não identificará um novo tipo de documento que você nunca encontrou antes. No entanto, quando seus olhos o veem e seu cérebro aprende suas características, você pode reconhecê-lo facilmente depois. É exatamente assim que o TYOC funciona.
Com TYOC, a Netskope democratizou a proteção de dados de IA e ML, concedendo aos clientes o poder da IA, da automação e do aprendizado adaptativo como parte dos recursos disponíveis atualmente no Netskope Intelligent SSE. As organizações podem adotar esses avanços de ponta para proteger seus dados confidenciais e ficar à frente dos requisitos de proteção de dados em constante evolução. Essa inovação permite que as organizações enfrentem com confiança os desafios de proteção de dados mais formidáveis da atualidade e, ao mesmo tempo, libera os administradores de políticas da maior parte dos processos manuais, permitindo que eles concentrem os recursos humanos em tarefas mais importantes.
O TYOC faz parte do SkopeAI, novo conjunto de inovações de inteligência artificial e machine learning (IA/ML) da Netskope, agora disponível em todo o portfólio SASE da Netskope. As ofertas do SkopeAI usam IA/ML para fornecer proteção de dados moderna e defesa contra ameaças cibernéticas, superando as limitações das tecnologias de segurança legadas e fornecendo técnicas de proteção com velocidade de IA não encontradas em produtos de outros fornecedores de SASE.
Se quiser saber mais, visite nossa página dedicada à SkopeAI ou assista a este vídeo com uma conversa sobre IA com o CTO da Netskope, Krishna Narayanaswamy: