Skip to content

Análise do conteúdo de proposições com word embeddings

License

Notifications You must be signed in to change notification settings

parlametria/embeddings-leis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Embeddings-leis

Usamos word embeddings para analisar as proposições legislativas do Congresso Nacional.

Executando os scripts

Criando ambiente virtual

Para evitar conflitos entre as versões das bibliotecas Python:

python -m venv environment
source environment/bin/activate

Instalando dependências

pip install -r requirements.txt

Extraindo justificativas

Após o download dos arquivos das proposições:

python scripts/extrator_justificativas.py --source <path> > justificativas.csv

Caso não queira o nome das colunas no resultado, use a flag --no-header.

O arquivo resultante conterá as seguintes colunas:

  • arquivo: Nome do arquivo pdf cujo conteúdo foi extraído
  • id: Identificador da proposição
  • numero: Número da proposição
  • tipo: Tipo da proposição
  • texto_anterior: Texto anterior à justificativa
  • justificativa: A justificativa extraída.

About

Análise do conteúdo de proposições com word embeddings

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published