IATexto é um programa computacional de análise de dados qualitativos baseado em estatística de texto e aprendizado de máquina.

IATexto é desenvolvido para pesquisadores de todas as áreas que buscam realizar inferências sobre dimensões e estruturas de significado. Sua abordagem é orientada por pressupostos teóricos da semântica distribucional, um campo da linguística que estuda a maneira como o significado das palavras emerge das relações estabelecidas entre elas e seus contextos de uso. 

Em alternativa a ferramentas computacionais que representam textos como "sacos de palavras", IATexto explora métodos em processamento de linguagem natural para aprendizado automático das características distribucionais do banco de dados analisado. Aspectos semânticos relacionados ao uso de palavras em textos e categorias de análise são armazenados em representações numéricas densas (embeddings), o que facilita a identificação de padrões de relacionamento entre o vocabulário e seus contextos de uso. 

IATexto é um programa gratuito e de código aberto

IATexto é desenvolvido com o apoio de agências públicas de fomento, por meio da concessão de bolsas de pesquisa e recursos de custeio. A versão atual do programa (0.1.0-beta) passa por testes fechados em projetos realizados em parceria com pesquisadores de universidades brasileiras e internacionais. Novas propostas de colaboração podem ser enviadas na página de contato.

Sobre o IATexto

IATexto não substitui o papel de quem desenvolve a pesquisa

IATexto não utiliza chatbots ou modelos generativos para interpretar os resultados e adota abordagens extrativas de sumarização. Análise de dados é um processo que depende de decisões contextualizadas, adaptadas ao fenômeno estudado, objetivos da pesquisa e fundamentação teórica. A proposta do IATexto valoriza a interação da pessoa pesquisadora com os resultados e indicadores gerados, sem substituir a análise crítica e contextualizada dos textos originais.

IATexto possui configurações pré-definidas que otimizam a análise de textos com características linguísticas e temáticas diversas.

Apesar da utilidade dos parâmetros pré-definidos, o processo de análise é interativo e nem sempre a primeira solução será a mais produtiva diante dos objetivos da pesquisa. Por isso, oferecemos a possibilidade de personalização dos procedimentos em todas as etapas da análise, garantindo que as principais decisões sejam tomadas por quem realiza a pesquisa.

Recursos

IATexto integra abordagens estatísticas e de aprendizado de máquina para processamento de linguagem natural e análise de dados textuais

Confira os principais recursos da versão 0.1.0-beta:

Organização do banco de dados

Opções de construção do corpus baseadas em textos e janelas de contexto extraídas de frases e parágrafos.

Pré-processamento de texto:

Opções personalizadas de formatação e uniformização do texto, com aplicação de filtro de palavras auxiliares, redução do vocabulário à raiz lexical, inclusão de expressões e coocorrências.

Estatísticas lexicais

Descrição do vocabulário em termos de frequência absoluta e relativa, gerando indicadores de importância e especificidade lexical para cada palavra ou expressão incluída na análise.

Modelagem de tópicos

Tarefas de modelagem de tópicos por agrupamentos semânticos, utilizando diferentes modelos de análise semântica latente e redes neurais e algoritmos não-supervisionados de identificação de temas e categorias consistentes.

Resultados informativos

Os resultados são acompanhados da identificação de textos relevantes, extração automática de vocabulário representativo de cada agrupamento, testes de hipótese para avaliar a associação entre tópicos e variáveis de contexto, entre outros.

Gráficos e visualização

Visualização dos resultados em gráficos informativos e interativos, com ênfase na exploração do material em redes semânticas.

Análise de textos em diferentes idiomas

Opções compatíveis com bancos de dados multilinguísticos, permitindo analisar simultaneamente textos escritos em dezenas de idiomas