Mais dados jurídicos

Em agosto do ano passado, iniciamos nosso repositório de dados. Na ocasião, em parceria com o Grupy RN , participamos de um evento sobre a raspagem de dados jurídicos e disponibilizamos um conjunto de informações sobre processos em tramitação no Supremo Tribunal Federal (STF). Desde então, o Legal Hackers Natal tem se empenhado em ampliar esse repositório para permitir análises e pesquisas jurídicas mais avançadas e complexas. Nesse sentido, em nova colaboração, desta vez com o estudante de Engenharia de Software Felipe Machado, conseguimos o texto integral de decisões monocráticas do STF.

No total, a nova base de dados conta com o texto integral de 397.043 decisões monocráticas, muitas delas já catalogadas por matéria jurídica contida no processo (o que facilitará o desenvolvimento de Aprendizado de Máquina com esses dados).

Para incentivar a pesquisa e a análise, estamos disponibilizando esse conjunto de dados no Kaggle, uma plataforma para ciência de dados. Além disso, pela primeira vez, também estamos oferecendo um kernel para exploração das informações. Esse kernel funciona como uma página na Internet em que o usuário pode executar códigos gratuitamente utilizando uma máquina virtual (uma espécie de “computador na nuvem”) mais potente que um computador doméstico. Aliás, o nosso kernel oferece algumas explicações para que pessoas da área de Tecnologia da Informação possam compreender o conteúdo jurídico dos dados e para que profissionais do Direito possam estudar um pouco de ciência de dados, mas aqui com o diferencial de utilizar dados jurídicos. Vale a pena experimentar!

Dados no Google Drive:

http://bit.ly/Dados_STF

Dados no Kaggle:

https://www.kaggle.com/igorafm/datastf

Kernel dos dados do STF no Kaggle:

https://www.kaggle.com/igorafm/stf-decs-monocraticas