quarta-feira, 15 de abril de 2009

JAVA: Parse de arquivo XML com DOM

Esse post mostra como efetuar a leitura e o parse de um arquivo tipo XML usando JAVA e a API DOM.

É muito comum a troca de arquivos XML na web, entre aplicações ou mesmo simples feeds via RSS.
O JAVA possui uma API chamada DOM (Document Object Model), com as classes providas por essa API é possível efetuar a leitura de um arquivo XML, extrair informações para objetos.

Abaixo segue um exemplo básico de arquivo XML utilizado para ilustrar o exemplo:

data.xml




8
Eiti Kimura
Development Team
eiti@mycompany.com


9
José da Silva
Human Resources
jose@mycompany.com


10
Karoline Taylor
Tecnology Team
karoline@mycompany.com




A idéia principal seria, extrair dos dados dos empregados (employee) desse arquivo, e retornar uma lista de objetos empregado. Esses objetos podem ser manipulados de inúmeras maneiras, entretanto no nosso exemplo, iremos apenas imprimir os objetos no console para verificar a extração dos dados.

O arquivo XmlDomParser.java mostra como fazer a leitura do arquivo, o parser e a extração dos dados em forma de uma lista de objetos:

XmlDomParser.java

package com.opendevnotes.xml.dom;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.io.StringReader;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.InputSource;

/**
* @author J.P. Eiti Kimura
* @author Thiago Medeiros dos Santos
*/
public class XmlDomParser {

private String xml;

public static void main(String[] args) {

XmlDomParser parser = new XmlDomParser();

// obtem o path do arquivo
URL url = XmlDomParser.class.getResource("data.xml");

// faz a leitura do arquivo e armazena em uma string
File file = new File(url.getPath());
parser.readFile(file);

// faz o parser do arquivo retornando uma lista de employees
List empList = parser.unmarshallEmployees();

// escreve a lista no console
for (Employee emp : empList)
System.out.println(emp);
}

/**
* Lê o arquivo do disco
* @param file
* @return retorna um objeto String com o texto do arquivo lido
*/
public String readFile(File file) {
try {

BufferedReader inp = new BufferedReader(new FileReader(file));

String line;
StringBuilder sb = new StringBuilder();

while ((line = inp.readLine()) != null) {
sb.append(line).append("\n");
}

this.xml = sb.toString();
return sb.toString();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}

return null;
}

/**
* Efetua o parser da String xml
* @return Document
*/
public Document parse() {
try {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = null;

try {

builder = factory.newDocumentBuilder();
} catch (ParserConfigurationException ex) {
ex.printStackTrace();
}

Document doc = builder.parse(new InputSource(new StringReader(this.xml)));
return doc;
} catch (Exception e) {
e.printStackTrace();
}

return null;
}

/**
* Retorna uma listade objetos Employee
* @return
*/
public List unmarshallEmployees() {

List employeeList = new ArrayList();
Document doc = this.parse();

try {
// obtem o primeiro nó filho, o nó raiz
Node root = doc.getFirstChild();

// obtem todos os filhos desse nó
NodeList rootChildren = root.getChildNodes();

// para cada faz a leitura das propriedades
for (int count = 0; count < node =" rootChildren.item(count);" emp =" new">
NodeList rootChildren = root.getChildNodes();
for (int count = 0; count < node =" rootChildren.item(count);">


Para testar os exemplos acima, os dois arquivos (java e xml), devem estar no mesmo pacote, esse exemplo o pacote criado foi: com.opendevnotes.xml.dom.

Dessa forma, pode-se utilizar o Java DOM para ler/parsear arquivos XML preenchendo objetos de interesse. No entanto, o DOM pode ter desempenho ruim com arquivos XML com volume de dados muito grande. Para aplicações de pequeno e médio porte essa solução é amplamente utilizada.

Agradecimentos ao meu amigo Thiago Medeiros dos Santos pela ajuda com o parser XML desse exemplo.

Referências:
http://www.roseindia.net/xml/dom/
http://java.sun.com/j2se/1.4.2/docs/api/org/w3c/dom/package-summary.html

Nenhum comentário: