Última alteração: 2018-06-13
Resumo
Resumo: A mineração de dados é o processo de análise de dados a partir de diferentes perspectivas resumidas em informações úteis, ou seja, é o processo de se encontrar correlação ou padrões entre dezenas de campos relacionais em um grande banco de dados (FAYYAD et al.; 1996, WITTEN; FRANK, 2011). Para Witten e Frank (2011), estes algoritmos de mineração são essenciais em técnicas que procuram explorar dados de forma a produzir modelos de conhecimento, os quais expressam padrões de comportamento dos dados e podem ser extrapolados para a classificação de imagens de satélite. A utilização de técnicas de mineração de dados tem sido muito útil para o sensoriamento remoto. Com o avanço dos sistemas sensores, há uma grande disponibilidade de dados que precisam ser transformados em informações. Assim a utilização de ferramentas de mineração de dados pode aumentar o potencial de análise e aplicações de dados de sensoriamento remoto, reduzindo o tempo de processamento dos dados (KORTING et al., 2011). Segundo Goldschmidt e Passos (2005), há vários métodos de mineração de dados (data mining), destacando-se aqueles baseados em redes neurais, em algoritmos genéticos, em instâncias, em estatística, métodos específicos, métodos baseados em indução de árvores de decisão e ainda métodos baseados em lógica nebulosa. Há vários softwares e algoritmos disponíveis para a mineração de dados, tais como: WEKA, GEODMA (TerraView), e o algoritmo C4.5, criado por Quinlan (1993) e implementado como classificador J4.8 na plataforma WEKA 3.6.8 e no InterIMAGE. Este algoritmo constrói árvores de decisão com base em amostras de treinamento e por um processo recursivo de divisão de dados. Para o Sensoriamento Remoto, mais especificadamente, para a Classificação de Imagens, utilizando-se a técnica GEOBIA, a mineração de dados auxilia na definição de quais atributos deverão ser utilizados para a classificação final das cenas trabalhadas. Normalmente são usadas as arvores de decisão para isso, porém existem outros metodos a partir dos quais é possível chegar a essa definição. O objetivo desse trabalho foi analisar como a Mineração de dados pode auxiliar na classificação de imagens orbitais, principalmente nas de baixa/média resolução espacial, como é o caso das imagens obtidas pelo satelite Landsat 5 e 8. Para atingir o objetivo proposto, foram utilizadas imagens do satélite Landsat 5 e 8 e os programas Ecognition e Weka. A partir das técnicas utilizadas obteve-se respostas satisfatorias, em função da possibilidade de uso de uma gama de atributos extraídos pelo programa Ecognition. Por meio da mineração de dados e da árvore de decisão geradas no software livre WEKA, obteve-se como resultado quais os melhores atributos a serem utilizados para a classificação. Percebeu-se que com o uso da mineração de dados, além da escolha exata entre os limiares de aceitação e o uso de atributos, o tempo para a classificação foi menor, pois já sabia-se quais os melhores atributos e limiares exatos seriam colocados na rede semântica. Sendo assim, entende-se que a Mineração de Dados é uma importante técnica auxiliar na classificação de imagens orbitais, pois diminui o tempo de processamento, o tempo gasto para as escolhas dos atributos e limiares utilizados, facilitando e melhorando a classificação final das imagens estudadas.
Palavras-chave: Analise Espacial, Sensoriamento Remoto, SIG's. GEOBIA, Data Mining.
bibliografia
Fayyad, U.M., Piatetsky,S., Smyth, G.P. (1996) . From data mining to knowledge discovery: an overview. In: Fayyad, U., Piatetsky-S., G., Smyth, P., Uthurusamy, R. (Eds.), Advances in knowledge discovery and data mining. Menlo Park, CA: AAAI Press, , p. 1-30.
Korting, T.S., Dutra, L.V. e Fonseca, L.M.G. (2011). A re-segmentation approach for detecting rectangular objects in high-resolution imagery. IEEE Geoscience and Remote Sensing Letters, 8, pp. 621–625,.
QUINLAN, R. (1993). C4.5: programs for machine learning. San Francisco, USA. Morgan Kaufmann.
GOLDSCHMIDT, R.; PASSOS, E. Data mining - um guia prático. Rio de Janeiro: Elsevier, 2005. 257 p. ISBN (85-352-1877-7).
Witten, I.; Frank, E (2011). Data mining: practical machine learning tools and techniques. 2. Ed. San Francisco, CA: Morgan Kaufmann Publishers.