O número de denúncias de imagens de abuso sexual infantil na internet brasileira aumentou 79%, de janeiro até outubro deste ano, conforme levantamento da Safernet. A ONG brasileira apresentou, em Paris, o primeiro conjunto de dados do projeto Discover, de desenvolvimento de tecnologias de prevenção ao abuso sexual infantil online.
Segundo a Safernet Brasil, o número de denúncias novas (links nunca antes reportados e não duplicados) com imagens de abuso e exploração sexual infantil aumentou 78,93% nos primeiros dez meses deste ano em relação ao mesmo período do ano passado. A Safernet recebeu 60.765 novos links entre 1 de janeiro e 31 de outubro deste ano contra 33.961 links no mesmo período de 2022.
A quantidade de links inéditos denunciando abuso sexual infantil na internet, nestes dez meses de 2023, já supera os 40.572 links inéditos recebidos durante todo o ano de 2022 na Central Nacional de Denúncias, que recebe denúncias de 10 diferentes crimes contra os direitos humanos na internet.
No total, ano passado, a Safernet recebeu 111.929 denúncias, um crescimento de quase 10% em relação às 101.833 de 2021. O patamar superior a 100 mil denúncias por dois anos seguidos não era atingido desde 2011. O total de denúncias é a soma dos links inéditos, separados e enviados às autoridades, mais os links duplicados.
Levantamento de imagens de abuso sexual infantil na internet
De acordo com a Safernet, o primeiro conjunto de dados sobre o assunto reúne 963 palavras-chave em português, inglês e acrônimos (siglas, abreviações, palavras codificadas ou com erros propositais de ortografia ou digitação) usadas por predadores sexuais ao organizar, divulgar, compartilhar ou trocar imagens de abuso e exploração sexual infantil e ou na tentativa de aliciar crianças e adolescentes a produzirem esses conteúdos.
O conjunto de palavras-chave foi pesquisado pela Safernet num universo de 100 mil textos associados a páginas e conteúdos com imagens de abuso e exploração sexual infantil em páginas denunciadas à ONG.
“Esses 963 termos foram coletados durante o processamento das denúncias de imagens de abuso e exploração sexual infantil realizadas pela Safernet no Brasil ao longo dos últimos anos. Essa indexação faz parte do Projeto Discover, e nosso objetivo é que possa ser aproveitado pela comunidade internacional”, explica o presidente da Safernet, Thiago Tavares.
O projeto Discover, da Safernet, é financiado pelo fundo SafeOnline. A Safernet foi uma das vencedoras de um edital da organização em 2021 e tornou-se a primeira instituição latino-americana a obter recursos desse fundo.
Como as palavras ajudarão a detectar conteúdo criminoso?
Usando as palavras-chaves, a indústria, autoridades e pesquisadores selecionados poderão treinar algoritmos de aprendizado por máquinas (machine learning), e aperfeiçoar sistemas de detecção baseados em heurísticas de busca por esses termos. Somadas, essas medidas ajudarão na detecção de conteúdos ilegais e de seus propagadores. O trabalho realizado em busca de imagens ilegais contribuirá para que vítimas também sejam localizadas e identificadas de forma mais rápida, agilizando o combate ao abuso e à exploração sexual no Brasil e em outros países.
Por conceito, heurísticas são padrões comuns de texto ou palavras-chave que podem ser típicos de uma determinada categoria de violação de política.
Conteúdos detectados por heurísticas geralmente são revisados por moderadores de conteúdo humanos antes que uma ação seja tomada sobre o conteúdo. Heurísticas são tipicamente utilizadas para permitir que as plataformas reajam rapidamente a novas formas de violações que surgem online, incluindo novas formas de disseminação de imagens de abuso e exploração sexual infantil.
“Sem conjuntos de dados de treinamento abrangentes, ricos e diversos construídos a partir de fontes em diferentes idiomas, as plataformas podem se tornar cegas e comprometer sua capacidade de sinalizar conteúdo para revisão humana e priorizar a ordem que tal conteúdo é revisado durante o processo de moderação”, afirma Tavares.