Apresentação

O LexPorBR-Infantil é um léxico de palavras do português brasileiro desenvolvido a partir de legendas de filmes e séries infantis e familiares. Ele foi computado a partir de mais de 130M de palavras token, 190K palavras type e contém 44 colunas de informações lexicais, ortográficas e fonológicas. Mais informações no artigo abaixo.

LexPorBR-Infantil - Artigo STIL2019

Downloads

* LexPorBR-Infantil - Clean *

LexPorBR-Infantil - Raw
LexPorBR-Infantil - Base
LexPorBR-Infantil - Script R

Créditos

Gustavo Estivalet (UFPB/LAPROL)
Nathan Hartmann (USCP/ICMC)
Vanessa Maquiafavel (SpeechTera)
Katerina Lukasova (UFABC/CMCC)
Maria Carthery-Goulart (UFABC/CMCC)
Sandra Aluísio (USP/ICMC)