Em estatística, o problema da classe de referência consiste em decidir qual "Grupo de comparação" deve ser escolhido para calcular a probabilidade aplicável a um caso específico.
Por exemplo, para estimar a probabilidade de uma aeronave sofrer um acidente, podemos observar a frequência de acidentes em diferentes conjuntos envolvendo aeronaves: todas as aeronaves, aeronaves deste modelo, aeronaves utilizadas por esta empresa dos últimos 10 anos, etc. Nesse caso, a aeronave para a qual desejamos calcular a probabilidade de acidente pertence a muitas classes diferentes, sendo que a frequência de acidentes pode variar de acordo com a classe. Não é óbvio qual conjunto poderíamos utilizar para avaliar o caso dessa aeronave específica. Em geral, qualquer aeronave pertence a muitas classes de referência, entre as quais a frequência do atributo de interesse difere.
O problema da classe de é justamente a discussão de qual classe é a mais apropriada para usar quando várias classes diferentes podem ser aplicadas ao caso.
Em estátistica, muitas análises assumem a forma de um silogismo estatístico:
- Uma proporção de são
- é
- Portanto, existe uma chance que seja .
é chamada nesse caso de "classe de referência", com sendo a "classe de atributo" e o objeto individual. O problema da classe de referência nesse caso consiste na pergunta "Como escolher uma classe ?"
Em estatística bayesiana, o problema envolve também decidir como escolher a probabilidade a priori para o resultado em questão (ou, ao considerar múltiplos resultados, uma distribuição de probabilidade a priori).
História
editarEm 1876, John Venn afirmou que "cada objeto ou evento tem um número indefinido de propriedades ou atributos observáveis nele e, portanto, pode ser considerado como pertencente a um número indefinido de classes diferentes de objetos". Esse fato leva a problemas práticos sobre como atribuir probabilidades a um caso singular que apresenta múltiplas características observáveis. Ele usou como exemplo a probabilidade de John Smith, um inglês com tuberculose pulmonar de cinquenta anos, viver até os sessenta e um anos.[1]
O termo "problema da classe de referência" foi posteriormente explicitado por Hans Reichenbach, que escreveu: "Se nos pedirem para encontrar a probabilidade de um evento futuro individual, devemos primeiro incorporar o evento em uma classe de referência adequada. Uma coisa ou evento individual pode ser incorporado em muitas classes de referência, das quais probabilidades diferentes serão encontradas".[2]
As discussões sobre esse problema permeiam não apenas a estatística, mas também a filosofia[3] e áreas aplicadas, como as ciências da vida, por exemplo, envolvendo a previsão de ensaios clínicos.[4]
No livro Anthropic Bias, o filósofo Nick Bostrom explora como o raciocínio baseado em classes de referência pode ser aplicado para pensar sobre a posição de um indivíduo dentro da realidade. Bostrom investiga como raciocinar quando se suspeita que as evidências disponíveis estão enviesadas por "efeitos de seleção de observação", ou seja, quando as evidências apresentadas foram pré-filtradas pela condição de que havia algum observador posicionado adequadamente para "receber" as evidências.[5][6] Esse efeito é às vezes chamado de "princípio antrópico ", "crença de autolocalização" ou "informação indexical ". O livro discute inicialmente a hipótese do Universo bem afinado e suas possíveis explicações, inclusive considerando notavelmente a possibilidade de um multiverso.
Bostrom argumenta contra a Suposição de Autoindicação (SIA - Self-Indication Assumption), termo que ele emprega para caracterizar certas visões existentes, e introduz a Suposição de Autoamostragem (SSA - Self-Sampling Assumption), que postula que você deve pensar em si mesmo como se fosse um observador aleatório de uma classe de referência adequada.
Posteriormente, ele refina a SSA ao utilizar 'observadores-momento' em vez de apenas 'observadores' para solucionar alguns paradoxos envolvendo raciocínio antrópico. Tal refinamento é formalizado como a Suposição de Autoamostragem Forte (SSSA - Strong Self-Sampling Assumption): cada observador-momento deve raciocinar como se fosse selecionado aleatoriamente da classe de todos os observadores-momentos em sua classe de referência[7]. Observador-momento se trata não apenas de considerar o observador como um indivíduo, mas também como um indivíduo localizado em uma certa faixa temporal , quando o próprio observador se encontra no momento de observação: "observador-momento" se refere não apenas à identidade do observador como indivíduo, mas também à sua localização em um instante específico dentro de sua linha de existência temporal. Tais suposições são afetadas de maneira diferente com base na escolha da classe de referência.
Uma possível aplicação do princípio subjacente à SSSA (embora não explicitamente articulada por Bostrom) é a seguinte: se o minuto em que você lê este artigo for selecionado aleatoriamente dentre todos os minutos da vida de todos os seres humanos (passados, presentes e futuros), então há 95% de confiança de que esse evento ocorre após os primeiros 5% de todos os momentos-observador humanos. Se a expectativa de vida média no futuro for o dobro da histórica, isso implica, com 95% de confiança, que N < 10n (onde N é o número total de humanos e n é o número atual). Isso ocorre pois o ser humano médio do futuro contribuiria com o dobro de momentos-observador do que o ser humano médio histórico. Portanto, nesta versão, a estimativa para o tempo até a extinção (no percentil 95) é de 4560 anos [carece de fontes].
Outras aplicações
editarUma aplicação prática na probabilidade Bayesiana envolve a avaliação e criação de uma probabilidade a priori, que é então aplicada a uma função de verossimilhança e atualizada por meio do teorema de Bayes. Considere, por exemplo, que desejamos avaliar a probabilidade de culpa de um réu em um processo judicial com base em evidências de DNA (ou outras evidências probabilísticas). Primeiro, é necessário avaliar a probabilidade a priori de culpa do réu. Considerando que o crime ocorreu em uma cidade de 1.000.000 de habitantes, dos quais 15% atendem aos requisitos de serem do mesmo sexo, faixa etária e descrição aproximada do autor do crime, isso pode sugerir uma probabilidade a priori de culpa de 1 em 150.000. Poderíamos ampliar o escopo e dizer que há, digamos, 25% de chance de o autor do crime ser de outra cidade, mas ainda assim deste país, e construir uma estimativa a priori diferente. Poderíamos dizer que o autor do crime poderia vir de qualquer lugar do mundo, e assim por diante.
Teóricos do direito discutiram o problema da classe de referência, particularmente em relação ao caso Shonubi. No dia 10 de dezembro de 1991 Charles Shonubi, um traficante de drogas nigeriano, foi preso no Aeroporto JFK e condenado por importação de heroína. Sua sentença dependia não apenas da quantidade de drogas traficadas naquela viagem, mas da quantidade total de drogas que se estimava ter importado em sete ocasiões anteriores nas quais não foi pego. Houve debates em cinco processos judiciais distintos sobre como essa quantidade deveria ser estimada. Em "Shonubi III", a acusação apresentou evidências estatísticas envolvendo a quantidade de drogas encontradas com traficantes de drogas nigerianos presos no Aeroporto JFK no período entre a primeira e a última viagem de Shonubi, argumentando que com tais valores seria possível estimar a quantidade importada por ele. Existe debate ainda sobre se essa é a classe de referência correta a ser usada e, em caso afirmativo, por quê.[8][9]
Outras aplicações legais envolvem avaliações, principalmente monetárias. Por exemplo, o valor de uma casa pode ser avaliado usando os dados de um banco de dados de vendas de casa "semelhantes": para decidir quais casas são semelhantes a uma determinada casa, é necessário saber quais características de uma casa são relevantes para o preço. O número de banheiros pode ser relevante, mas não a cor dos olhos do proprietário. Argumenta-se que tais problemas de classe de referência podem ser resolvidos encontrando quais características são relevantes: uma característica é relevante para o preço da casa se o preço da casa covariar com ela (afetar a probabilidade de a casa ter um valor maior ou menor), e a classe de referência ideal para um indivíduo é o conjunto de todas as instâncias que compartilham com ele todas as características relevantes.[10][11]
Ver também
editar- Silogismo estatístico
- previsão de classe de referência
- Viés espectral
- Paradoxo de Simpson
Referências
- ↑ Venn, John (1888). The logic of chance; an essay on the foundations and province of the theory of probability, with especial reference to its logical bearings and its application to moral and social science, and to statistics. London: Macmillan. p. Página 224. Consultado em 29 de janeiro de 2026
- ↑ Reichenbach Hans (1949). The Theory Of Probability. [S.l.: s.n.] p. Página 374. Consultado em 29 de janeiro de 2026
- ↑ Hájek, Alan. «The reference class problem is your problem too» (PDF). pdfs.semanticscholar.org. Consultado em 29 de janeiro de 2026. Cópia arquivada (PDF) em 11 de janeiro de 2018
- ↑ J. Venn,The Logic of Chance (2nd ed, 1876), p. 194.
- ↑ J. Venn,The Logic of Chance (2nd ed, 1876), p. 194.
- ↑ Bostrom, Nick (2002). Anthropic bias: observation selection effects in science and philosophy. Col: Studies in philosophy. New York: Routledge. ISBN 978-0-415-88394-8
- ↑ «Observation Selection Theory and Cosmological Fine-tuning». anthropic-principle.com. Consultado em 30 de janeiro de 2026
- ↑ Colyvan, Mark; Regan, Helen M.; Ferson, Scott (junho de 2001). «Is it a Crime to Belong to a Reference Class». Journal of Political Philosophy (2): 168–181. ISSN 0963-8016. doi:10.1111/1467-9760.00123. Consultado em 30 de janeiro de 2026
- ↑ Tillers, Peter (2005). «If Wishes Were Horses: Discursive Comments on Attempts to Prevent Individuals from Being Unfairly Burdened by their Reference Classes». SSRN Electronic Journal. ISSN 1556-5068. doi:10.2139/ssrn.711858. Consultado em 30 de janeiro de 2026
- ↑ Franklin, James (março de 2010). «Feature selection methods for solving the reference class problem» (PDF). Columbia Law Review Sidebar. 110. Consultado em 30 de Janeiro de 2026
- ↑ Franklin, James (2011). «The objective Bayesian conceptualisation of proof and reference class problems». Sydney Law Review. 33: 545–561. Consultado em 30 de Janeiro de 2026