IATexto é um programa computacional de análise de dados qualitativos baseado em estatística de texto e Inteligência Artificial (IA). O projeto encontra-se em desenvolvimento, com lançamento previsto em 2025.

IATexto é desenvolvido por grupos de pesquisa em ciências humanas e sociais para pessoas de todas as áreas que buscam realizar inferências sobre dimensões e estruturas de significado presentes em bancos de dados textuais. Valorizamos o rigor metodológico e a transparência na produção e divulgação dos resultados em pesquisas qualitativas, garantindo o acesso a informações relevantes à descrição sistemática e objetiva dos procedimentos, técnicas e parâmetros utilizados.

IATexto é um programa gratuito e não impõe limites à utilização de seus recursos. Acreditamos que a ciência é produzida em atividades coletivas e colaborativas, contexto em que o acesso aberto a técnicas e procedimentos de pesquisa é fundamental à democratização do conhecimento científico.

IATexto é desenvolvido com recursos públicos de fomento à pesquisa e à inovação. Para garantir o acesso aberto e ilimitado aos recursos do programa, contamos com o incentivo de programas institucionais por meio de bolsas de pesquisa e recursos de custeio. A nossa rede articula pesquisadores e estudantes de graduação e pós-graduação de universidades públicas brasileiras, que contribuem ativamente para o refinamento metodológico da ferramenta a partir de seus projetos de pesquisa.

IATexto não substitui o papel de quem desenvolve a pesquisa e interpreta os resultados. Compreendemos que o processo de análise de dados resulta de decisões contextualizadas e adaptadas ao fenômeno estudado, objetivos da pesquisa, características do material e fundamentação teórica.

IATexto adota estratégias extrativas de sumarização dos textos analisados e não utiliza Chatbots ou modelos generativos para atribuir significado aos resultados. Enfatizamos a importância do olhar especializado de quem desenvolve a pesquisa, com seus próprios referenciais teóricos e objetivos analíticos, como responsáveis pela condução do processo de interpretação fundamentada nos dados.

IATexto possui configurações pré-definidas que otimizam a análise de textos com características linguísticas e temáticas diversas.

Apesar da utilidade dos parâmetros pré-definidos, o processo de análise é interativo e nem sempre a primeira solução será a mais produtiva diante dos objetivos da pesquisa. Por isso, oferecemos a possibilidade de personalização dos procedimentos em todas as etapas da análise, garantindo que as principais decisões sejam tomadas por quem realiza a pesquisa.

IATexto não dispensa o aprofundamento teórico sobre os modelos estatísticos e de aprendizado de máquina utilizados!

Queremos fazer com que as pessoas implicadas na análise de dados conheçam o significado e a utilidade de cada um dos indicadores e resultados gerados, estimulando o aprendizado e o uso crítico da ferramenta. Por isso, o desenvolvimento do programa prevê o lançamento de um manual de apoio, com conteúdo teórico e prático, ilustrado por exemplos intuitivos e situações reais de pesquisa.

O que faz o IATexto?

IATexto integra abordagens lexicais e neurais em processamento de linguagem natural e análise de dados textuais

Confira algumas características previstas na versão de lançamento:

Organização do corpus

Opções de construção do corpus baseadas em textos e janelas de contexto extraídas de frases e parágrafos.

Pré-processamento de texto:

Opções personalizadas de formatação e uniformização do texto, com aplicação de filtro de palavras auxiliares, redução das palavras à raiz lexical, inclusão de expressões e coocorrências.

Estatísticas lexicais

Descrição do vocabulário em termos de frequência absoluta e relativa, gerando indicadores de importância e especificidade lexical para cada palavra ou expressão incluída na análise.

Modelagem neural e lexical de tópicos

Opções de análise baseadas em redes neurais profundas, métodos estatísticos e de aprendizado de máquina para detecção de tópicos e categorias semântico-lexicais.

Sumarização de texto

Opções de extração automática de palavras importantes e específicas em tópicos e variáveis de contexto.

Gráficos e visualização

Visualização dos resultados em gráficos informativos e interativos, com ênfase na exploração do material em redes semânticas e lexicais.

Análise de textos em diferentes idiomas

Suporte para mais de 10 idiomas, com opções de análise de bancos de dados multilinguísticos