Como deve ser a estrutura de um XML?


Para o Buscapé, temos um modelo conceitual que deve ser seguido. Caso você possua outro padrão de XML, analisaremos para confirmar se está nos padrões para a captura.


<buscape>
	<data_atualizacao>2012-08-06T09:15:30GMT-3</data_atualizacao>
	<produtos>
		<produto>
			<descricao>Nome/titulo da Oferta</descricao>
			<canal_buscape>
				<canal_url>URL da oferta com os parâmetros necessários para esse canal</canal_url>
				<valores>
					<valor>
						<forma_de_pagamento>Forma de pagamento referente a esse preço ("boleto" ou "cartao_avista" ou "cartao_parcelado_sem_juros" ou "cartao_parcelado_com_juros")</forma_de_pagamento>
						<parcelamento>Quantidade de parcelas (Exemplo: 5x de R$ 100,00)</parcelamento>
						<canal_preco>Preço total (exemplo: "R$ 500,00")</canal_preco>
					</valor>
        	                        .
                	                .
                        		.
				</valores>
			</canal_buscape>
			<canal_lomadee>
				<canal_url>URL da oferta com os parâmetros necessários para esse canal</canal_url>
				<valores>
					<valor>
						<forma_de_pagamento>Forma de pagamento referente a esse preço ("boleto" ou "cartao_avista" ou "cartao_parcelado_sem_juros" ou "cartao_parcelado_com_juros")</forma_de_pagamento>
						<parcelamento>Quantidade de parcelas (Exemplo: 5x de R$ 100,00)</parcelamento>
						<canal_preco>Preço total (exemplo: "R$ 500,00")</canal_preco>
					</valor>
        	                        .
                	                .
                        		.
				</valores>
			</canal_lomadee>
			<id_oferta>Código único da oferta, geralmente pertencente a uma única oferta.</id_oferta>
			<imagens>
                	        <imagem tipo="Veja tabela <a href="#types_img">abaixo</a>">Link da imagem da Oferta</imagem>
                        	.
	                        .
        	                .
	                </imagens>
			<categoria>Categoria da Oferta, o mais completo possível e o mais relevante possível</categoria>
			<isbn>Código ISBN da Oferta</isbn>
			<cod_barra>Código de Barra numérico, se mais de um, separar por vírgula</cod_barra>
			<disponibilidade>Quantidade desta oferta em estoque</disponibilidade>
	                <marketplace>Informa se essa oferta é referente a um marketplace (true|false)</marketplace>
        	        <marketplace_nomeparceiro>Nome loja parceira (opcional)</marketplace_nomeparceiro>
		</produto>
		.
		.
		.
	</produtos>
</buscape>
Tipos de imagem
Chave Descrição
O Imagem OFICIAL que será usada no site, em ambos os canais.
F Imagem na visão frontal do produto. Esta imagem deverá ter dimensão próximo a 600x600.
S Imagem na visão superior. Esta imagem deverá ter dimensão próximo a 600x600.
LE Imagem lateral esquerdo. Esta imagem deverá ter dimensão próximo a 600x600.
LD Imagem lateral direito. Esta imagem deverá ter dimensão próximo a 600x600.
T Imagem traseira. Esta imagem deverá ter dimensão próximo a 600x600.
O1 Imagem genérica. Esta imagem deverá ter dimensão próximo a 600x600.
O2 Imagem genérica. Esta imagem deverá ter dimensão próximo a 600x600.

Para lojistas que vendem produtos de moda e acessórios, a estrutura do XML com as tags cor e tamanho fica da seguinte maneira:


<buscape>
	<data_atualizacao>2012-08-06T09:15:30GMT-3</data_atualizacao>
	<produtos>
		<produto>
			<descricao>Smartphone Motorola Moto G Colors Edition Dual ( 16GB ) Desbloqeuado</descricao>
			<canal_buscape>
				<canal_url>http://www.xxxx.com.br/smartphone-motorola-moto-g-3g-xt1033-preto-box.html?origem=buscape</canal_url>
				<valores>
				        <valor>
						<forma_de_pagamento>boleto</forma_de_pagamento>
						<parcelamento>1x de R$ 699,00</parcelamento>
						<canal_preco>R$ 699,00</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_avista</forma_de_pagamento>
						<parcelamento>1x de R$ 710,90</parcelamento>
						<canal_preco>R$ 710,90</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_parcelado_sem_juros</forma_de_pagamento>
						<parcelamento>8x de R$ 88,90</parcelamento>
						<canal_preco>R$ 710,90</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_parcelado_com_juros</forma_de_pagamento>
						<parcelamento>12x de R$ 67,00</parcelamento>
						<canal_preco>R$ 804,00</canal_preco>
				        </valor>
				</valores>
			</canal_buscape>
			<canal_lomadee>
				<canal_url>http://www.xxxx.com.br/smartphone-motorola-moto-g-3g-xt1033-preto-box.html?origem=lomadee</canal_url>
				<valores>
				        <valor>
						<forma_de_pagamento>boleto</forma_de_pagamento>
						<parcelamento>1x de R$ 725,00</parcelamento>
						<canal_preco>R$ 725,00</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_avista</forma_de_pagamento>
						<parcelamento>1x de R$ 750,90</parcelamento>
						<canal_preco>R$ 750,90</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_parcelado_sem_juros</forma_de_pagamento>
						<parcelamento>8x de R$ 93,75</parcelamento>
						<canal_preco>R$ 750,90</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_parcelado_com_juros</forma_de_pagamento>
						<parcelamento>12x de R$ 69,00</parcelamento>
						<canal_preco>R$ 828,00</canal_preco>
				        </valor>
				</valores>
			</canal_lomadee>
			<id_oferta>417492</id_oferta>
			<imagens>
	                        <imagem tipo="O">http://www.xxxx.com.br/media/product/thumbnail/motorola_xt1033_2_1.jpg</imagem>
	                        <imagem tipo="F">http://www.xxxx.com.br/media/product/thumbnail/motorola_xt1033_2_2.jpg</imagem>
	                        <imagem tipo="S">http://www.xxxx.com.br/media/product/thumbnail/motorola_xt1033_2_3.jpg</imagem>
	                </imagens>
			<categoria>Telefonia / Celulares e Smartphones / Smartphones</categoria>
			<isbn>56598555</isbn>
			<cod_barra>1359875456855</cod_barra>
			<disponibilidade>25</disponibilidade>
	                <marketplace>false</marketplace>
		</produto>
	</produtos>
</buscape>

As tags não precisam estar necessariamente nessa ordem, mas devem conter as informações já descritas anteriormente e estarem dentro de uma estrutura correta para um XML bem formatado.

Como podemos observar, as informações da oferta fazem parte do sub conjunto da tag “”. Sem essa estrutura não é possível realizar a captura, pois o sistema Spider não irá conseguir identificar onde começa e termina uma oferta.

EXEMPLO:


<buscape>
	<data_atualizacao>2012-08-06T09:15:30GMT-3</data_atualizacao>
	<produtos>
		<produto>
			<descricao>Smartphone Motorola Moto G Colors Edition Dual ( 16GB ) Desbloqeuado</descricao>
			<canal_buscape>
				<canal_url>http://www.xxxx.com.br/smartphone-motorola-moto-g-3g-xt1033-preto-box.html?origem=buscape</canal_url>
				<valores>
				        <valor>
						<forma_de_pagamento>boleto</forma_de_pagamento>
						<parcelamento>1x de R$ 699,00</parcelamento>
						<canal_preco>R$ 699,00</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_avista</forma_de_pagamento>
						<parcelamento>1x de R$ 710,90</parcelamento>
						<canal_preco>R$ 710,90</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_parcelado_sem_juros</forma_de_pagamento>
						<parcelamento>8x de R$ 88,90</parcelamento>
						<canal_preco>R$ 710,90</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_parcelado_com_juros</forma_de_pagamento>
						<parcelamento>12x de R$ 67,00</parcelamento>
						<canal_preco>R$ 804,00</canal_preco>
				        </valor>
				</valores>
			</canal_buscape>
			<canal_lomadee>
				<canal_url>http://www.xxxx.com.br/smartphone-motorola-moto-g-3g-xt1033-preto-box.html?origem=lomadee</canal_url>
				<valores>
				        <valor>
						<forma_de_pagamento>boleto</forma_de_pagamento>
						<parcelamento>1x de R$ 725,00</parcelamento>
						<canal_preco>R$ 725,00</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_avista</forma_de_pagamento>
						<parcelamento>1x de R$ 750,90</parcelamento>
						<canal_preco>R$ 750,90</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_parcelado_sem_juros</forma_de_pagamento>
						<parcelamento>8x de R$ 93,75</parcelamento>
						<canal_preco>R$ 750,90</canal_preco>
				        </valor>
				        <valor>
						<forma_de_pagamento>cartao_parcelado_com_juros</forma_de_pagamento>
						<parcelamento>12x de R$ 69,00</parcelamento>
						<canal_preco>R$ 828,00</canal_preco>
				        </valor>
				</valores>
			</canal_lomadee>
			<id_oferta>417492</id_oferta>
			<imagens>
	                        <imagem tipo="O">http://www.xxxx.com.br/media/product/thumbnail/motorola_xt1033_2_1.jpg</imagem>
	                        <imagem tipo="F">http://www.xxxx.com.br/media/product/thumbnail/motorola_xt1033_2_2.jpg</imagem>
	                        <imagem tipo="S">http://www.xxxx.com.br/media/product/thumbnail/motorola_xt1033_2_3.jpg</imagem>
	                </imagens>
			<categoria>Telefonia / Celulares e Smartphones / Smartphones</categoria>
			<isbn>56598555</isbn>
			<cod_barra>1359875456855</cod_barra>
			<disponibilidade>25</disponibilidade>
	                <marketplace>false</marketplace>
		</produto>
	</produtos>
</buscape>

IMPORTANTE:

O campo data_atualizacao deverá ser preenchido seguindo o padrão no formato timestamp ISO-8601:

2012-08-06T09:15:30GMT-3

Sendo assim, esta data deve ser de quando o XML foi gerado ou alterado e não quando fazemos o request para o link do lojista.

No Brasil temos 3 fusos horários diferentes, portanto cabe ao lojista, em sua região, identificá-lo e representá-lo com seu time zone respectivo.

YYYY-MM-DDTHH:MM:SS