Adam Mohamed Ali Fadlalla
A mineração de dados é o processo de identificação de padrões válidos, novos, úteis e compreensíveis em dados e extração ou descoberta de resumos úteis de padrões de dados ou conhecimento de uma grande quantidade de dados de uma grande quantidade de dados e também chamada de descoberta de conhecimento KDD em bases de dados. Um processo KDD inclui limpeza de dados, data mining, seleção de dados, transformação, integração de dados, avaliação de padrões e apresentação de conhecimento. É um crescimento explosivo de dados de terabytes para petabytes. Confluência de múltiplas disciplinas inclui aprendizagem automática, estatística, inteligência artificial, visualização, computação de alto desempenho, tecnologia de base de dados, algoritmo, reconhecimento de padrões, as suas aplicações incluem análise de dados biológicos e médicos: classificação, análise de clusters e análise de dados de microarranjos, web mining