Questões Sobre a Extração de Dados das Decisões do STF (Supremo Tribunal Federal): Problemas Classificatórios
Resumo
INTRODUÇÃO
As múltiplas aplicações da inteligência artificial (IA) trazem a perspectiva de criação de sistemas e máquinas capazes de agir de forma relativamente suficiente para resolver problemas e tomar decisões. No âmbito jurídico, esse desenvolvimento já é utilizado para redução de custos e tempo na execução de tarefas.
O Tribunal de Justiça do Distrito Federal e dos Territórios utiliza do Projeto Toth para análise e classificação das petições iniciais de acordo com cada assunto. Com a criação dos desses sistemas, inclusive os voltados para área jurídica, alimentados por matrizes de dados, muitas vezes não há uma correta adequação e identificação daquilo que se busca.
O Supremo Tribunal Federal (STF), por exemplo, na busca de decisões jurisprudenciais sobre direitos autorais no Tesauro do Supremo Tribunal Federal (TSTF), demonstra divergência de resultados encontrados, situação que impacta diretamente no resultado da pesquisa e no processo de busca.
Este trabalho é uma continuidade da pesquisa sobre a busca jurisprudencial no STF focada nos direitos autorais. Conforme apresentado anteriormente, trata-se de uma pesquisa empírica e exploratória que utiliza o método indutivo e qualitativo, além de técnicas próprias e específicas de busca e organização de dados.
DESENVOLVIMENTO
Durante a realização da pesquisa anterior acerca das decisões jurisprudenciais sobre direitos autorais no STF, através do Tesauro do STF, chegamos à uma amostragem de 190 casos (com um lapso temporal de 1950-2019) e que, no caso, apenas 148 casos (77,9%) estavam dispostos corretamente, representando um equívoco de 42 casos (22,1%). Então, conseguimos observar a ausência de dados formatados adequadamente no sistema Tesauro do Supremo, impossibilitando que haja uma devida extração e análise automatizada pelos sistemas e programas de inteligência artificial. Além disso, não devemos esquecer que o STF é o tribunal de mais alta hierarquia, demonstrando a incapacidade de estruturar os bancos de dados das decisões judiciais, que foi alterado ao longo do tempo mas que ainda hoje não é capaz de fornecer um resultado conciso.
Observa-se, assim, além da necessidade de aprimoramento classificatório por parte dos bancos de dados do STF, uma abordagem legislativa acerca da mineração de dados e textos (text and data mining) no Brasil. Pensando nessa situação, há em tramitação na Câmara dos Deputados o Projeto de Lei 21/2020, de autoria do Deputado Eduardo Bismarck (PDT-CE) que trata de forma mais panorâmica as questões em torno da inteligência artificial. O projeto traz acréscimos fundamentais ao atual cenário nacional, estabelecendo princípios basilares e visualizando a utilização da IA tanto no presente quanto no futuro.
Percebe-se, porém, a falta de tutela com relação à prática da mineração de dados e textos no projeto do deputado. Essa situação aos poucos vem sendo modificada, pois houve a inserção do artigo 5°, inciso VIII, do PL 21/2020 no parecer da Deputada Relatora Luísa Canziani (PTB-PR), indicando a possibilidade de disponibilidade de uso de banco de dados e textos que são protegidos por direitos autorais não implicar violação quando estes forem utilizados para treinamento dos sistemas de IA, com a condição de que o titular não perca a exploração normal da obra.
Diante desse cenário, para melhor desenvolvimento dos sistemas de IA aplicados ao direito, é essencial que os dados extraídos das decisões judiciais estejam disponibilizados de forma a viabilizar o desenvolvimento e o aprendizado desses sistemas.
CONSIDERAÇÕES FINAIS
Com o desenvolvimento da pesquisa até esse estágio, é apontada a necessidade de aprimorar o mapeamento das informações e dados relacionados às decisões com o uso da inteligência artificial. Essa organização permite melhor identificar e categorizar os dados de forma a torná-los quantitativamente apreciáveis, além de facilitar o processo de busca de decisões e otimização de tempo pelos seus usuários, com vista a reduzir os erros classificatórios na jurisprudência do STF.
Além dessa urgência de estruturação e concisão, é preciso que tenha previsão legal ou licença pública para autorização de mineração de dados e textos, que apresentaria uma evolução tanto nas pesquisas quanto nos desenvolvimentos de sistemas de inteligência artificial.
Referências
BRASIL. Supremo Tribunal Federal. Tesauro do Supremo Tribunal Federal (TSTF). Disponível em: http://www.stf.jus.br/portal/jurisprudencia/pesquisarVocabularioJuridico.asp. Acesso: 16 ago. 2021.
SB. TJDFT usa Inteligência Artificial para classificar processos judiciais. Tribunal de Justiça do Distrito Federal e dos Territórios, março de 2021. Disponível em: https://www.tjdft.jus.br/institucional/imprensa/noticias/2021/marco/tjdft-usa-inteligencia-artificial-para-classificar-processos. Acesso em: 25 ago. 2021.
BRASIL. Congresso. Câmara dos Deputados. PRL 2 do PL 21/2020. Parecer Preliminar de Plenário n.2 PLEN. Disponível em: https://www.camara.leg.br/proposicoesWeb/prop_mostrarintegra?codteor=2080673. Acesso em: 29 set. 2021.
RAMOS, L. Q; MAGESTE, L. H. D; FRANCO, M. P. Pesquisa Jurisprudencial no STF: Inconsistências e Consequências. Apresentação no VII Congresso Internacional de Propriedade Intelectual, Gestão da Inovação e Desenvolvimento - Propriedade Intelectual, Inovações Disruptivas e Sustentabilidade. Passo Fundo - Rio Grande do Sul. 14 mai. 2021.
SALOMÃO, Luis Felipe. Inteligência Artificial: Tecnologia Aplicada à Gestão Dos Conflitos no âmbito do Poder Judiciário Brasileiro. 2020. FGV Conhecimento. Disponível em: https://ciapj.fgv.br/sites/ciapj.fgv.br/files/estudos_e_pesquisas_ia_1afase.pdf. Acesso em: 23 mar. 2021.
SOUZA. A. R. de; SCHIRRU. L.; ALVARENGA. M. B. Direitos autorais e mineração de dados e textos no combate à Covid-19 no Brasil. Liinc em Revista, v. 16, n. 2, p. e5536, 31 dez. 2020.