IATexto é um programa computacional de análise de dados qualitativos baseado em estatística de texto e aprendizado de máquina.

IATexto é desenvolvido para pesquisadores de todas as áreas que buscam realizar inferências sobre dimensões e estruturas de significado. Sua abordagem é orientada por pressupostos teóricos da semântica distribucional, um campo da linguística que estuda a maneira como o significado das palavras emerge das relações estabelecidas entre elas e seus contextos de uso. 

Em alternativa a ferramentas computacionais que representam textos como "sacos de palavras", IATexto explora métodos em processamento de linguagem natural para aprendizado automático das características distribucionais do banco de dados analisado. Aspectos semânticos relacionados ao uso de palavras em textos e categorias de análise são armazenados em representações numéricas densas (embeddings), o que facilita a identificação de padrões de relacionamento entre o vocabulário e seus contextos de uso. 

IATexto é um programa gratuito e de código aberto

IATexto é desenvolvido com o apoio de agências públicas de fomento, por meio da concessão de bolsas de pesquisa e recursos de custeio. A versão atual do programa (0.1.0-beta) passa por testes fechados em projetos realizados em parceria com pesquisadores de universidades brasileiras e internacionais. Novas propostas de colaboração podem ser enviadas na página de contato.

Sobre o IATexto

IATexto não substitui o papel de quem desenvolve a pesquisa

IATexto não utiliza chatbots ou modelos generativos para interpretar os resultados e adota abordagens extrativas de sumarização. Análise de dados é um processo que depende de decisões contextualizadas, adaptadas ao fenômeno estudado, objetivos da pesquisa e fundamentação teórica. A proposta do IATexto valoriza a interação da pessoa pesquisadora com os resultados e indicadores gerados, sem substituir a análise crítica e contextualizada dos textos originais.

IATexto possui configurações pré-definidas que otimizam a análise de textos com características linguísticas e temáticas diversas.

Apesar da utilidade dos parâmetros pré-definidos, o processo de análise é interativo e nem sempre a primeira solução será a mais produtiva diante dos objetivos da pesquisa. Por isso, oferecemos a possibilidade de personalização dos procedimentos em todas as etapas da análise, garantindo que as principais decisões sejam tomadas por quem realiza a pesquisa.

Recursos

IATexto integra abordagens estatísticas e de aprendizado de máquina para processamento de linguagem natural e análise de dados textuais

Confira os principais recursos da versão 0.1.0-beta:

Organização do banco de dados

Opções de construção do corpus baseadas em textos e janelas de contexto extraídas de frases e parágrafos.

Pré-processamento de texto:

Opções personalizadas de formatação e uniformização do texto, com aplicação de filtro de palavras auxiliares, redução do vocabulário à raiz lexical, inclusão de expressões e coocorrências.

Estatísticas lexicais

Descrição do vocabulário em termos de frequência absoluta e relativa, gerando indicadores de importância e especificidade lexical para cada palavra ou expressão incluída na análise.

Modelagem de tópicos

Tarefas de modelagem de tópicos por agrupamentos semânticos, utilizando diferentes modelos de análise semântica latente e redes neurais e algoritmos não-supervisionados de identificação de temas e categorias consistentes.

Resultados informativos

Os resultados são acompanhados da identificação de textos relevantes, extração automática de vocabulário representativo de cada agrupamento, testes de hipótese para avaliar a associação entre tópicos e variáveis de contexto, entre outros.

Gráficos e visualização

Visualização dos resultados em gráficos informativos e interativos, com ênfase na exploração do material em redes semânticas.

Análise de textos em diferentes idiomas

Opções compatíveis com bancos de dados multilinguísticos, permitindo analisar simultaneamente textos escritos em dezenas de idiomas

Exemplos

IATexto 0.1.0-beta

A versão atual do IATexto ainda passa por testes fechados, mas já é possível conferir algumas imagens no exemplo abaixo. O banco de dados utilizado foi formado pelos textos de todos os capítulos da 3ª edição do livro Psicologia social: Temas e Teorias (Torres et al., 2023). A obra pode ser integralmente acessada na página da editora.

Sobre Nós

Yuri Sousa

Pesquisador responsável e desenvolvedor do IATexto

Yuri Sousa é professor adjunto do Instituto de Psicologia e Serviço Social da Universidade Federal da Bahia (IPSS/UFBA) e pesquisador do Programa de Pós-Graduação em Psicologia (PPGPSI/UFBA). Possui graduação, mestrado e doutorado em psicologia pela Universidade Federal de Pernambuco (UFPE), com estágio doutoral no Laboratoire de Psychologie Sociale da Aix-Marseille Université (AMU/França) e pós-doutorado no Centro de Estudos de Comunicação e Sociedade da Universidade do Minho (UMinho/Portugal).

Interessado pela articulação entre rigor acadêmico e inovação tecnológica, seu trabalho com o IATexto busca facilitar o acesso da comunidade científica a recursos avançados de análise qualitativa com estatística e aprendizado de máquina. Nesse projeto, Yuri Sousa é o pesquisador responsável pela concepção, desenvolvimento e integração dos fluxos de processamento, técnicas de exploração e visualização dos resultados, entre outros recursos incluídos na versão 0.1.0-beta do IATexto.

Grupos de pesquisa associados

Financiamento institucional

Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)

A versão 0.1.0-beta do IATexto foi desenvolvida pelo pesquisador Yuri Sousa durante seu Pós-Doutorado no Exterior (PDE), realizado no Centro de Estudos de Comunicação e Sociedade (CECS) da Universidade do Minho (UMinho/Portugal), sob a supervisão da Profa. Dra. Rosa Cabecinhas. A pesquisa foi financiada com uma bolsa PDE/CNPq e integra o projeto de cooperação internacional Inovações científicas, representações sociais e comparação intercultural Brasil/França: estratégias teórico-metodológicas de triangulação na pesquisa psicossocial, coordenado pela Profa. Dra. Maria de Fátima de Souza Santos. Esse projeto foi contemplado pela Chamada Pública MCTI/CNPq 14/2023, destinada a apoiar projetos internacionais de pesquisa científica, tecnológica e de inovação.

Fundação de Amparo à Ciência e Tecnologia do Estado de Pernambuco (FACEPE)

O desenvolvimento da versão final do IATexto será viabilizado com recursos de Auxílio a Projetos de Pesquisa (APQ – Universal/FACEPE), concedidos ao projeto Estratégias teórico-metodológicas na pesquisa psicossocial sobre conflitos bioéticos articulados ao embrião humano, coordenado pela Profa. Dra. Renata Lira dos Santos Aléssio. Após a conclusão da versão beta no início de 2025, os recursos APQ têm sido destinados à contratação de serviços de consultoria, revisão de códigos-fonte e desenvolvimento da versão final do IATexto, com lançamento previsto até 2026.

Doações

IATexto é uma ferramenta gratuita e de código aberto. Se você valoriza isso e quer incentivar a evolução do projeto, considere fazer uma doação.

As contribuições serão prioritariamente destinadas a corrigir erros, desenvolver novas funcionalidades e manter a infraestrutura necessária. Eventuais excedentes serão diligentemente aplicados na compra de  livros e cafés para o autor. :) 

Agradecemos pela contribuição!
IATexto é um projeto de inovação aberta que visa democratizar o acesso a tecnologias avançadas de processamento e análise de dados textuais. Atualmente, o projeto recebe apoio institucional de duas agências de fomento e também aceita doações como forma de apoio direto.

Apoio