A próxima geração de ferramentas de análise de big data está chegando!

Uma nova ferramenta de análise de big data foi desenvolvida por cientistas da computação no Instituto Politécnico de Worcester, nos Estados Unidos, que ajudará as empresas a entender toda essa inundação de dados!

dados

O professor de ci√™ncia da computa√ß√£o Elke Rundensteiner, da National Science Foundation, est√° liderando uma equipe de estudantes de ci√™ncia de dados que est√£o construindo a pr√≥xima gera√ß√£o de ferramentas de an√°lise de dados, conhecida como SETA. Esse software de c√≥digo aberto espec√≠fico ser√° usado para identificar padr√Ķes em tempo real e fluxos de dados de alto volume e, ao mesmo tempo, analis√°-los e entend√™-los melhor. Em particular, a SETA pode ativar grandes empresas, m√≠dias sociais, centros de detec√ß√£o de golpes, redes de ve√≠culos aut√īnomos, governos e outros usu√°rios a usar o fluxo cont√≠nuo de big data enquanto eles est√£o executando e se transformando em insights. . Segundo o professor, em um mundo onde o big data est√° aumentando constantemente em volume e velocidade, a an√°lise de dados em tempo real se tornou extremamente importante.

O processamento de eventos √© uma maneira de detectar e analisar informa√ß√Ķes recebidas, como compras on-line, aumento e queda dos pre√ßos das a√ß√Ķes, tempo que os usu√°rios permanecem em um site ou se os profissionais de sa√ļde lavam as m√£os. antes de entrar no quarto dos pacientes. Nos dados de entrada, tudo est√° relacionado ao destaque de eventos importantes, para que uma organiza√ß√£o possa responder em tempo real. A SETA poder√° lidar com solicita√ß√Ķes complexas, fornecendo aos usu√°rios informa√ß√Ķes concisas mais baratas e r√°pidas do que nunca.

No entanto, Rundensteiner observou que as ferramentas de an√°lise de dados mais interessantes n√£o foram projetadas para funcionar com dados de streaming. As ferramentas Rundensteiner trabalham com dados, √† medida que s√£o gerados, permitindo que padr√Ķes ainda mais complexos sejam observados em tempo real, para que decis√Ķes importantes possam ser tomadas rapidamente. Al√©m disso, de acordo com o professor, os fluxos de dados est√£o crescendo a tal ponto que as grandes empresas n√£o conseguem entender os dados em tempo real. Se as transmiss√Ķes ao vivo forem gerenciadas, haver√° acesso a novos campos para an√°lise de dados.

Para criar novas ferramentas de an√°lise, o Rundensteiner deve primeiro criar uma nova linguagem de solicita√ß√£o, usada para localizar e recuperar padr√Ķes nos dados. O novo idioma tornar√° a ferramenta mais f√°cil de usar, pois permitir√° que os usu√°rios pesquisem padr√Ķes mais complexos. O professor tamb√©m est√° construindo um novo mecanismo de solicita√ß√£o para processar solicita√ß√Ķes sofisticadas e encontrar os padr√Ķes solicitados. A constru√ß√£o desta m√°quina √© a chave para todo o projeto e fornecer√° todas as respostas para as perguntas desejadas. Em breve, o novo software de an√°lise ser√° testado, usando conjuntos de dados e aplicativos fornecidos por um centro de sa√ļde e uma empresa que processa transa√ß√Ķes financeiras.

Portanto, a nova tecnologia para big data ser√° especialmente √ļtil, especialmente para o setor de sa√ļde, pois pode detectar padr√Ķes que indicam a propaga√ß√£o de uma infec√ß√£o. Em geral, ser√° poss√≠vel ver como os problemas est√£o evoluindo e de onde eles v√™m e, ao mesmo tempo, ferramentas melhores ser√£o constru√≠das para obter as respostas necess√°rias para a enorme onda de informa√ß√Ķes recebidas.