Já se disse que a estatística é uma forma pseudocientífica de contar mentiras. Outros a idolatram, como se os números refletissem “fatos” de forma mais precisa que qualquer outra coisa. E as evidências abundam sobre as manipulações estatísticas que realmente existem, ainda que a ciência, ou “arte” continue florescente e muito utilizada. O que seria da física quântica e das tecnologias “fuzzy” se não fossem as probabilidades, filhas diletas da estatística?
O terreno mais pantanoso, sem dúvida mora na área das humanidades. Usam-se estatísticas para “provar” qualquer coisa, tratando de modo ligeiro conceitos e definições bem estabelecidas. É o caso, por exemplo da utilização do conceito de censo (análise do conjunto de uma população) com o de survey, que procura retratar uma amostra, – constituída a partir de várias técnicas -, que possa “representar” o conjunto da população, ou pelo menos uma parcela bem definida dessa população. O censo estatístico por excelência é o demográfico, no qual os recenseadores efetivamente contam a população, casa por casa, cobrindo o país inteiro, recolhendo um conjunto de observações que, trabalhadas estatisticamente, permitem estabelecer conjuntos de dados específicos para cada segmento delimitado.
Quando a pesquisa estatística recolhe dados bem definidos em um universo igualmente bem definido, revela-se um valioso instrumento de análise para aquilo que foi perguntado.
A GfK, uma empresa internacional de pesquisa de mercado divulgou em 2017 uma pesquisa que recolheu dados, no verão de 2016 (verão do hemisfério norte), de (1) consumidores, com (2) idade acima de 15 anos que preencheram dados online sobre (3) seus hábitos de leitura, em 17 países, reduzidos a uma mostra estruturada que refletia a (4) composição demográfica dessa população online. Os interessados podem acessar a pesquisa e fazer o download aqui.
A tabela apresentada pela GfK foi a seguinte:
Ou seja, a empresa definiu cuidadosamente o momento da pesquisa, a população objeto da pesquisa (referência aos censos demográficos nacionais), estruturando sua amostra segundo cada um deles e dando o número “n” de entrevistados, e o tipo de pesquisados. Ou seja, uma amostra da população acima de 15 anos de idade, online, que eram consumidores, e responderam a um conjunto predeterminado de perguntas. Restringiu, portanto, de modo inequívoco, o que estava pesquisando, quando e como. O resultado apresentado como “Frequency of reading books – Global GfK survey” pretendia retratar os hábitos de leitura (definidos bem precisamente) de uma população específica.