Cloud Done Right: Impulsione melhores decisões e previsões com Machine Learning e Data Lakes
junho 4, 2020 / Unisys Corporation
À medida que assistimos às notícias sobre a crise da COVID-19, o que se tornou evidente é a importância de dados empíricos e análises para informar cidadãos e governos em todo o mundo e capacitá-los a tomar decisões políticas e de saúde. Johns Hopkins, por exemplo, rapidamente criou um lago de dados com feeds de informações de países de todo o mundo sobre estatísticas da COVID-19. Isso se tornou o pilar para o público e os especialistas monitorarem estatísticas diárias de todo o mundo, e a modelagem e as previsões baseadas no aprendizado de máquina ajudaram milhões.
A beleza dos lagos de dados é que sua criação e uso não estão limitados por uma estruturação rígida de dados — eles podem ser ingeridos em seu formato nativo. A nuvem torna isso possível devido a:
- Armazenamento na nuvem barato e sob demanda
- Ferramentas em nuvem integradas e planos para ingestão e limpeza de dados
- Múltiplas camadas de segurança e conformidade na nuvem para proteger recursos
- As mais recentes e inovadoras ferramentas de análise baseadas na nuvem

Uma vez que o lago de dados seja "formado", é imperativo fornecer medidas de segurança e conformidade para proteger tanto a integridade do sistema quanto as informações pessoais e os dados de propriedade intelectual. A segurança do lago de dados na nuvem pode ser governada e protegida dentro de um ambiente de criptografia definido por software e isolamento dinâmico. Os padrões de conformidade (por exemplo, HIPAA, GDPR, NIST) podem ser avaliados, monitorados e impostos usando os melhores serviços e metodologias baseados na nuvem.
A análise na nuvem, a mineração de dados e o aprendizado de máquina podem então ser implementados para fornecer informações acionáveis. Quando se trata de feeds de dados para treinar os modelos de inteligência artificial, mais feeds e dados mais ricos tipicamente produzem mais correlações e insights. As fontes de dados potenciais incluem:
- Armazéns de dados existentes
- Dados móveis, da web e das redes sociais
- IoT e dados do sensor
- Dados demográficos
- Dados de Gerenciamento de Relacionamento com o Cliente (CRM)
De acordo com um relatório recente da Aberdeen, as empresas que implementam e utilizam Data Lakes viram aumentos nas receitas em relação às empresas que não o fizeram. A IDC prevê que o gasto em sistemas cognitivos e de IA atingirá US$77,6 bilhões até 2022.
Em geral, qualquer organização pode utilizar lagos de dados e IA para:
Obtenha informações sobre escolhas de inovação. Um lago de dados pode ajudar suas equipes de P&D a testar suas hipóteses, refinar pressupostos e avaliar resultados, como escolher os materiais certos no design do seu produto, resultando em um desempenho mais rápido, fazer pesquisa genômica levando a medicamentos mais eficazes ou compreender a vontade dos clientes de pagar por diferentes atributos de produtos ou serviços.
Melhore as interações com o cliente. Um lago de dados pode combinar dados de clientes de uma plataforma de CRM com análises de redes sociais, uma plataforma de marketing que inclui histórico de compras e tickets de incidentes para capacitar a empresa a compreender a coorte de clientes mais lucrativa, a causa da perda de clientes e as promoções ou recompensas que aumentarão a lealdade.
Aumente a eficiência operacional A Internet das Coisas (IoT) introduz mais maneiras de coletar dados sobre processos como a fabricação, com dados em tempo real provenientes de dispositivos conectados à internet. Um lago de dados facilita o armazenamento e a execução de análises em dados de IoT gerados por máquina para descobrir maneiras de reduzir custos operacionais e, ao mesmo tempo, aumentar a qualidade.
Organizações líderes em saúde, pesquisa biológica e farmacêutica, logística, finanças e serviços descobriram o valor competitivo e estratégico dos lagos de dados e análises avançadas usando o aprendizado de máquina.
Muito mais do que resultados de TI
Um cliente atual da Unisys, um grande sistema universitário público dos EUA, iniciou uma integração de dados multinuvem e multicampus, culminando na criação de um lago de dados central baseado na nuvem. Esse repositório de dados incluía uma variedade de dados estruturados e não estruturados, incluindo dados de ferramentas de CRM existentes, informações de estudantes e professores, presença, e dados de desempenho de testes, e muito mais dos +500.000 alunos, professores e funcionários.
Embora os resultados de TI sejam notáveis para esse cliente, seu lago de dados está produzindo benefícios ainda maiores da análise preditiva, como identificar estudantes em risco e intervir antes que o mau desempenho, a presença ou outros fatores afetem negativamente seus estudos e sucesso acadêmico.
Na Unisys, não somos apenas proponentes de data lakes e análises para nossos clientes — nós mesmos usamos isso para melhorar continuamente nossos sistemas, serviços e compromisso com os clientes. Os lagos de dados para operações orientadas por IA usam serviços de ingestão, armazenamento e aprendizado de máquina baseados na nuvem e abrangem dados históricos e em tempo real. As fontes de dados incluem ferramentas operacionais, bancos de dados de gerenciamento de configuração (CMDB) e sistemas de gerenciamento de serviços de TI (ITSM). Isso permite que tendências e incidentes sejam previstos e a causa raiz seja identificada de forma inteligente para fornecer um melhor serviço aos nossos clientes [Para uma visão mais detalhada de como os Data Lakes e as Operações orientadas por IA podem impulsionar melhores experiências na nuvem, consulte a CTO da Unisys para tecnologia emergente Suzanne Taylor no artigo mais recente na Revista Forbes .]
As decisões e previsões baseadas em dados que utilizam o aprendizado de máquina fornecerão uma vantagem competitiva às empresas de todos os setores, com os serviços de IA na nuvem abrindo caminho para uma maior adoção. Não hesite em mergulhar com as barreiras de segurança certas para descobrir quais informações estão flutuando em seu lago de dados.