Como editoras e livrarias andam [mal]tratando seus [meta]dados por aqui

Na apresentação que Richard Stark fez em Bogotá sobre a questão dos metadados, há uma lista de elementos mínimos que deveriam ser disponibilizados pelos editores para os elos seguintes da cadeia do livro. Para distribuidores e livreiros terem conhecimento de algumas das condições de comercialização do produto. Para o público leitor – e isso é ainda mais importante – de modo a que o livro possa ser facilmente encontrado pelos mecanismos de busca eletrônicos e para que o eventual comprador saiba qual é seu conteúdo.

Alguns desses componentes são ocultos, pois dizem respeito somente à relação editor/distribuidor-livreiro. Outros devem ser necessariamente complementados com informações próprias do distribuidor/livreiro. Na lista apresentada no post anterior, seriam esses: preço (o livreiro tem que especificar seu(s) preços e condições, que são eventualmente diferentes dos do editor); código de desconto proprietário do editor, que tem que ser complementado pelos eventuais descontos dados pelo livreiro; código de disponibilidade do produto, que deve ser complementado pelos códigos do livreiro (disponibilidade de entrega, prazos, etc.); código de devolução (ou das condições de consignação, que são elementos da relação comercial editor/livreiro). Ou seja, de uma lista de trinta, podemos considerar que quatro dizem respeito à relação entre editor-livreiro e que devem ser acrescidos pelas informações das próprias das relações livreiro-comprador final.

Ou seja, haveria vinte e seis categorias de metadados que minimamente deveriam estar presentes, de preferência proporcionadas pelo editor (que conhece melhor que ninguém o produto que está oferecendo), e quatro que seriam acrescidas ou modificadas pelos livreiros. Observemos que algumas dessas categorias são relativamente simples e unívocas: o ISBN (que deve ser único para cada formato) não muda; o código de barras não muda, e outros mais do mesmo gênero. Mas as informações sobre assuntos e sobre o conteúdo interno do livro (ilustrações, tabela de assuntos, índices, informações adicionais sobre autores e ilustradores, etc.) são categorias que podem ser enriquecidas e que, eventualmente, serão cruciais para que o livro seja descoberto no magma em que borbulham os milhões de títulos disponíveis.

Fui atrás de exemplos, como leitor comum, de como editoras e livrarias apresentam seu dados e permitem buscas sobre autores e livros. Obviamente não se trata de pesquisa exaustiva. Como também não tenho acesso aos programas de administração, não posso saber como os sistemas funcionam internamente.

Bem, para ter um padrão de comparação, comecei por pesquisar por tags nos dois grandes sites de livrarias americanas, a Amazon e a Barnes & Noble. Nos dois, coloquei “crimes against women, fiction” na área de busca.

Resultados:

O site da Barnes & Noble retorna 1.065 títulos com esses tags. O da Amazon retorna 966 títulos. Notem como as duas livrarias organizam a página. A da Amazon abre por tipos de livros com tags complementares, inclusive alguns curiosos, relacionados com religião. A B&N é mais simples, cabem mais títulos. A da Amazon já dá, ao lado de cada título, informações sobre os vários formatos (inclusive usados e os links para resenhas de quem comprou o livro antes e para o resumo do livro). Já o da B&N exige que se clique na capa do livro para as informações adicionais. De qualquer forma, os dois sites permitem que o comprador interessado no tema tenha muitas oportunidades de aprofundar a pesquisa e finalmente achar o que deseja.

E no Brasil?

Bem, a coisa muda de figura.

Mudando a busca para “crimes contra mulheres, ficção”, a resposta do site da Livraria Cultura foi assim:

Retorno de 500 títulos sobre o tema. Mas…. Rolando a página, o que vemos?

“Crimes contra” a ordem tributária… Além disso, todos os títulos de ficção apresentados na frente são de livros do James Patterson. Em que ordem será que entram? Como o critério “relevância” apresenta em terceiro lugar um título de direito? Aliás, depois dos romances do Patterson, o que aparece mesmo são títulos de direito. Ou seja, a pesquisa não retorna resultado por tags. Depois dos romances de um determinado autor, só aparecem livros com a palavra “crime” no título. Ou seja, a busca não é confiável. Há um sinal claro de manipulação (livros do mesmo autor), seguidos por resultados de uma simples busca semântica. Podem experimentar: os mecanismos de busca parecem retornar sempre coisas “vagamente” relacionadas, mas nada que ajude realmente o consumidor a achar o que procurou por um daqueles parâmetros. Quem busca romances policiais que envolvam crimes contra mulheres e recebe na primeira página um livro sobre crimes tributários desiste na hora de procurar.

Mas pode ser pior.

O site da Saraiva:

Nada de retorno. O site não faz busca pelo conteúdo do livro. Só acha alguma coisa se a palavra exata estiver no título ou no nome do autor.

Aí, me lembrando de uma velha piada do mercado editorial, coloquei a palavra “lavoura” no campo de busca. Bingo! “Lavoura Arcaica” do Raduan Nassar é o primeiro que aparece. E aparece de novo, como DVD, depois de três outros títulos que tem lavoura no meio. É a verdadeira Salvação da Lavoura!

E o mesmo acontece no site da Livraria Cultura. “Lavoura Arcaica” na cabeça!

Até aqui, então, temos uma constatação. Os sites dos dois maiores varejistas online do Brasil respondem às pesquisas principalmente pela presença da palavra, ou das palavras, no título ou no nome do autor. Além disso, por algum mecanismo lá de dentro (qual será?), pode aparecer os livros de um determinado autor eventualmente relacionado com o assunto, como é o caso do Patterson.

A ordem em que os títulos aparecem no resultado da pesquisa não deve ser aleatória. A Amazon declara que essa ordem é produzida por dois algoritmos que relacionam a) maior quantidade de hits naquele livro por outros compradores; b) a lista de livros anteriormente adquiridos ou procurados por quem consulta (se fez login no site da Amazon e tem conta lá). Esse mecanismo é tão importante que já tem gente especializada em determinar que tipos de tags podem fazer o livro aparecer na frente de outros. Por exemplo, a tag “crime” reúne uma quantidade enorme se livros; já a tag “crime against women” resulta numa seleção menor de livros. Por isso mesmo, para aqueles livros de detetive que têm como tema ou tratam de crimes contra mulheres, é importante colocar essa tag, já que um número relativamente menor de acessos a esse livro o colocará numa posição melhor no resultado da pesquisa. E assim por diante. A Amazon garante que não manipula esses mecanismos. Mas, como os mecanismos são semelhantes aos do Google, onde links pagos ou patrocinados aparecem na cabeça das pesquisas, há quem duvide. Entretanto, depois de fazer várias pesquisas na Amazon (e na Barnes & Noble), nunca vi 404 — Not Found

blacktroop.com

404

Page Not Found

It seems that the page you were trying to reach does not exist anymore, or maybe it has just moved. You can start again from the home or go back to previous page.
aparecerem em seguida títulos do mesmo autor
, como aconteceu no site da Cultura, salvo quando a pesquisa resulta no aparecimento dos livros da série Harry Potter.

A outra forma de se aproximar dos metadados que permitem a busca de um livro é ver como as editoras o apresentam, na suposição (nem sempre verdadeira), de que o visto no seu site contenha elementos enviados para as livrarias.

Tomei o exemplo da Maria José Silveira – para quem não sabe, sou casado com ela – a partir de seu último romance, “Com Esse Ódio e com Esse Amor”, lançado pela Global. O livro é facilmente encontrado no site, quando se pesquisa pelo nome da autora:

Estão lá: título, autora, formato, número de páginas e ISBN. Há foto da capa e um texto descrevendo algumas características e elogiando o livro. Sem assinatura. Acontece que o texto é a orelha do livro, assinada por Ignácio de Loyola Brandão. Uma informação importante, omitida. O preço está na parte de baixo da página. Um único link leva a uma breve biografia da autora, com o título de outro romance de sua autoria grafado errado. E só. O sistema de e-commerce da editora ainda está em montagem.
Até aí, para quem conhece a autora, é fácil. Mas o site da Global tem um mecanismo de pesquisa por “temas”. E são muitos. Mas o romance não está lá. Só irá ser encontrado na lista dos catálogos gerais, na aba de “Literatura Brasileira”.

Em suma, é preciso muita disposição para achar o livro. E, como ele, qualquer livro do qual não se saiba o nome do autor (ou o título, ou o ISBN!). Mas, se isso é do conhecimento de quem busca, qual é a busca?

Vejamos como as livrarias tratam os autores. No caso, nossa autora, Maria José Silveira.

Na Livraria Cultura, a busca pelo nome da autora no formulário de busca avançado, onde se especifica o nome completo, com início no sobrenome, a pesquisa retorna três nomes: “josé maria lacambra, maria lacambra”; “núncio, maria josé silveira” e “silveira, maria josé”. A pesquisa extrapolou o pedido e mandou quem tinha “maria”, “josé” no mesmo nome, ou “silveira, maria josé” mais outro sobrenome.

Tudo bem, o que abunda não prejudica. Clicando sobre o “Silveira, maria josé”, o retorno mostra 35 itens. Bom, nossa autora tem cerca de vinte e poucos livros publicados, incluindo juvenis e infantis, e é também tradutora, e na página inicial aparecem livros de sua autoria e por ela traduzidos.

A busca não distingue entre as duas condições, o que é até bom, já que tradutor também é autor, legal e moralmente falando. Na segunda página da pesquisa aparece o que é outra “Maria José Silveira”, em um livro de pedagogia publicado pela Ibrasa. E outra curiosidade. Na primeira página aparece, sem a foto da capa, o livro “O Voo da Arara Azul”, publicado pela Callis, disponível sob encomenda. Na segunda página aparece o mesmo livro, com a capa, e a declaração de “Esgotado no Fornecedor”. Ou seja, o cadastramento da livraria não dá baixa ou substitui o livro quando a editora envia uma segunda edição.

O curioso no site da Livraria Cultura é que se, na página inicial – sem passar pela busca avançada – for digitado “silveira, maria josé”, o que volta é um resultado de 500 itens. Começa com os livros da Maria José Silveira, é verdade, mas em ordem diferente da outra pesquisa. A razão? Não consegui descobrir. Mas verifiquei que a busca agora retorna todos os livros que tenham como autores alguma “maria josé” e algum “Silveira”. Daí a quantidade de itens.

O exemplo mostra um grau de inconsistência na organização da busca e sua classificação. Já vimos isso na busca por temas e o fenômeno se repete na busca por autor.

Na Saraiva a pesquisa por “Silveira, maria josé” retorna 21 títulos. Não inclui as traduções, mas apresenta como autora uma tradução publicada na antiga Marco Zero (a original, na qual éramos os editores, com o Márcio Souza), de O Papalagui, livro que tem autor e foi traduzido pela Maria José. Outra curiosidade no site da Saraiva: o livro “Uma Amizade Improvável”, escrito pela Maria José em parceria com Ivana de Arruda Leite e Índigo, aparece com o sinal “avise quando estiver disponível”, sem a possibilidade de encomenda. O livro, editado pela Ática, aparece como disponível no site da Cultura, juntamente com outro livro publicado pela mesma editora. Esse livro, “Cabeça de Garota” sofre do mesmo mal que o “Voo da Arara Azul”: aparece duas vezes, a primeira edição como “esgotada no fornecedor”.

Que conclusões se pode tirar disso tudo?

Consegui alguns formulários de envio dos dados de livros das editoras para as livrarias, inclusive o da Saraiva. Mas não o da Cultura. Por isso não vou analisar nem comparar esses formulários. O fato é que a tônica dominante é a da dispersão e inconsistência das informações. As editoras elaboram seus catálogos e possuem mecanismos de envio das informações para as livrarias e distribuidoras basicamente em duas situações: a) no momento do lançamento do livro, os famosos “releases”, que muitas vezes são os mesmos enviados à imprensa, com as informações gerais sobre o livro; b) quando há mudança no preço de capa.

O resultado é um quadro de amadorismo patético na difusão das informações geradas pelas editoras para os canais de comercialização. Em uma situação onde já temos cerca de vinte mil novos lançamentos por ano que, com as reedições, chegam a cerca de cinquenta mil títulos publicados anualmente, e com um catálogo ativo que já deve estar próximo do meio milhão de títulos, essa coisa de mandar planilhas para cada livraria é uma insanidade. É simplesmente impossível processar manualmente essa quantidade de informações, e a diversidade de modelos só complica mais a coisa.

Além das grandes cadeias, existem empresas que se dedicam a prestar serviços para livrarias independentes na manutenção dos sites e principalmente na atualização de informações de novidades e de mudança de preços. Contatei uma dessas empresas que me respondeu candidamente que “mantem uma equipe para entrar em contato com editoras e distribuidoras e atualizar as informações”. Ou seja, na munheca.

Como vimos em alguns dos exemplos acima, mesmo as grandes cadeias, que fizeram investimentos consideráveis em seus sistemas de informatização, não conseguem manter consistência no que aparece nos sites. Os mecanismos de busca, na verdade, são precários e nada amistosos para o consumidor. De fato, a situação pode ser resumida assim: acha o livro quem já sabe o que quer procurar. Coisa que é o contrário do espírito e dos objetivos de um mecanismo de buscas.

E o pior é que o padrão para fazer isso tudo de forma automática, com dados ricos sobre cada livro e atualização constante, já existe. É o ONIX, que já tem mais de dez anos de existência.

A CBL há anos anuncia que “em breve” colocará no ar o CANAL, um catálogo montado a partir do padrão ONIX. Só que não vejo essa iniciativa aparecer.

Acredito que a grande questão é que as editoras e as livrarias ainda não se deram conta da importância de facilitar a descoberta dos livros no meio digital. A informação é desorganizada. E desorganização é o caos. E o caos não facilita a vida, e muito menos ajuda a impulsionar as vendas.

É certo que várias editoras vêm melhorando, nos seus sites, a qualidade das informações dos títulos de seu catálogo. Mas isso não é generalizado, essa melhora não se transfere para os canais de comercialização. A relação título/autor/editora é fraca e as buscas acontecem basicamente nos sites de venda, por autor e por temas.

Talvez a vinda da Amazon para o Brasil provoque um choque sísmico em nossa indústria editorial e livreira e a faça despertar para a importância disso. Se há algo que Jeff Bezos é mestre, realmente, é em facilitar a vida de quem quer comprar os livros. E essa é uma das razões (não a única) do sucesso da Amazon.

5 ideias sobre “Como editoras e livrarias andam [mal]tratando seus [meta]dados por aqui”

  1. Excelente trabalho de investigação, parabéns. O absurdo é que às vezes é mais fácil encontrar informações sobre o livro em uma busca direta no Google do que na pesquisa das lojas. Mais um motivo para autores – na medida do possível – criarem suas próprias páginas web, otimizadas para busca, com informações e links diretos de compra, enquanto não aparecem sistemas que usem os metadados, digamos, civilizadamente.

  2. Caro Felipe, durmo e acordo pensando em como anos de trabalho coletivo de autores, ilustradores, revisores, editores, enfim, podem ser perder no mar digital se não olharmos TODOS para esses metadados. A confiabilidade entre as partes, leitor, livreiro e editor depende deles. Tudo dependerá deles a partir de agora. Por que nós, como coletivo, não vemos isso? Onde estão os bibliotecários nessa hora? A gente esquece que eles existem?

    1. Renata,
      Bibliotecários podem ajudar na definição de tags (etiquetas) do conteúdo dos livros, assim como os autores. Mas a sua difusão é responsabilidade das editoras, e os mecanismos de busca algo que depende também das distribuidores e livrarias. Há anos que escuto falar no CANAL, mas o dito parece estar assoreado. O SNEL já falou em usar o serviço de registro de vendas online da Nielsen, e quero ver se vão falar disso no Congresso do Livro Digital. Ações dispersas e que não chegam a uma conclusão. São problemas que os sócios das instituições têm que resolver, entre si.

  3. Excelente artigo Felipe. Tenho uma bibliotecária na família e entendo a importância de um bom trabalho de organização das obras. Até ler o seu artigo eu desconhecia o tamanho do problema no Brasil. ATambém espero que a Amazon gere uma concorrência construtiva nesse sentido.

  4. Se olhar pelo lado de quanto a Amazon investiu e investe em tecnologia para seu negócio online, veremos que o sucesso deles se deu basicamente por acreditar na Internet como sendo o melhor canal de vendas. O que não acontece com os livreiros e com praticamente todos os outros negócios no Brasil, que ainda não acordaram para o quanto é importante investir e ter boas ferramentas para atender os clientes, baseando seu negócio em um modelo novo e altamente rentável.
    Detalhe: O investimento inicial de alguns milhões na Amazon fez com que se tornasse a gigante de alguns bilhões que é hoje, vendendo expertise e tecnologia para por exemplo novos e rentáveis negócios como o Netflix.

Deixe uma resposta