quarta-feira, 25 de maio de 2011

Oque é XML pt2

Documentos

Se você já está acostumado com a HTML ou a SGML, os documentos XML parecer-lhe-ão familiar. Um documento XML simples é apresentado a seguir:

Exemplo 1: um documento XML simples

<?xml version="1.0"?>
<piada>
<João>Diga <citação>boa noite</citação>, Maria.</João>
<José><citação>Boa noite, Maria.</citação></José>
<aplausos/>
</piada>

Algumas coisas podem sobressair-se para você:

· O documento começa com uma instrução de processamento: <?xml ...?>. Esta é a declaração XML. Embora não seja obrigatória, a sua presença explícita identifica o documento como um documento XML e indica a versão da XML com a qual ele foi escrito.

· Não há declaração do tipo do documento. Diferentemente da SGML, a XML não requer uma declaração de tipo de documento. Entretanto, uma declaração de tipo de documento pode ser fornecida; além disso, alguns documentos irão precisar de uma para serem entendidos sem ambigüidade.

· Elementos vazios (<aplausos/> neste exemplo) tem uma sintaxe modificada. Enquanto que a maioria dos elementos em um documentos envolvem algum conteúdo, elementos vazios são simplesmente marcadores onde alguma coisa ocorre (uma separador horizontal para a marca em <hr> em HTML, por exemplo, ou uma referência cruzada para DocBook's para a marca <xref>). O final /> na sintaxe modificada indica a um programa que processa o documento XML que o elemento é vazio e uma marca de fim correspondente não deve ser procurada. Visto que os documentos XML não requerem uma declaração de tipo de documento, sem esta pista seria impossível para um analisador XML determinar quais marcas são intencionalmente vazias e quais teriam sido deixadas vazias por um erro.
A XML suavizou a distinção entre elementos declarados como EMPTY e elementos que meramente não têm conteúdo. Em XML, é válido usar uma marca de elemento vazio para qualquer um destes casos. Também é válido usar um par de marcas início-fim para elementos vazios: <aplausos></aplausos>. Se a interoperabilidade interessa, é melhor reservar a sintaxe de marcas de elementos vazios para elementos declarados como EMPTY e usar a marca de elemento vazio somente para estes elementos.

Os documento XML são compostos de marcas e conteúdos. Existem seis tipos de marcações que podem ocorrer em um documento XML: elementos, referências a entidades, comentários, instruções de processamento, seções marcadas e declarações de tipos de documento. As seções seguintes introduzem cada um destes conceitos de marcação.

Elementos

Elementos são a mais comum forma de marcação. Delimitados pelos sinais de menor e maior, a maioria dos elementos identificam a natureza do conteúdo que envolvem. Alguns elementos podem ser vazios, como visto acima; neste caso eles não têm conteúdo. Se um elemento não é vazio, ele inicia com uma marca de início , <element>, e termina com uma marca de término, </element>.

Atributos

Atributos são pares de valores nomeados que ocorrem dentro dasmarcas de início após o nome do elemento. Por exremplo:

<div classe="prefácio">

é um elemento div cujo atributo class possui o valor prefácio. Em XML, todos os valores de atributos devem estar entre aspas.

Referências a Entidades

A fim de introduzir a marcação em um documento, alguns documentos foram reservados para identificar o início da marcação. O sinal de menor, < , por exemplo, identifica o início de uma marca de inicio ou término. Para inserir estes caracteres em seu documento como conteúdo, deve haver uma alternativa para representá-los. Em XML, entidades são usadas para representar estes caracteres especiais. As entidades também são usadas para referenciar um texto freqüentemente repetido ou alterado e incluí-lo no conteúdo de arquivos externos.

Cada entidade deve ter um nome único. A definição dos seus próprios nomes de entidades é discutido na seção declarações de entidades. Para usar uma entidade, você simplesmente a referencia pelo nome. As referências às entidades iniciam com o E comercial e terminam com um ponto-e-vírgula.

Por exemplo, a entidade lt insere um literal < em um documento. A cadeia de caracteres <element> pode ser representada em um documento XML como <&lt;element>.

Uma forma especial de referência a entidades, chamada de referência a caracter, pode ser usada para inserir arbitrariamente caracteres Unicode em seu documento. Este é um mecanismo para inserir caracteres que não podem ser diretamente digitados pelo seu teclado.

Referências a caracter podem ter uma das duas formas: referências decimais, &#8478;, e referências hexadecimais, &#x211E;. Ambas se referem ao caracter Unicode número U+211E.

Comentários

Comentários iniciam com <!-- e terminam com -->. Os comentários podem conter qualquer dado, exceto a literal "--". Você pode colocar comentários entre marcas em qualquer lugar em seu documento.

Comentários não fazem parte de um conteúdo textual de um documento XML. Um processador XML não é preciso para reconhecê-los na aplicação.

Nenhum comentário:

Postar um comentário