IATexto é um programa computacional de análise de dados qualitativos baseado em estatística de texto e Inteligência Artificial (IA). O projeto encontra-se em desenvolvimento, com lançamento previsto em 2025.
IATexto é desenvolvido por grupos de pesquisa em ciências humanas e sociais para pessoas de todas as áreas que buscam realizar inferências sobre dimensões e estruturas de significado presentes em bancos de dados textuais. Valorizamos o rigor metodológico e a transparência na produção e divulgação dos resultados em pesquisas qualitativas, garantindo o acesso a informações relevantes à descrição sistemática e objetiva dos procedimentos, técnicas e parâmetros utilizados.
IATexto é um programa gratuito e não impõe limites à utilização de seus recursos. Acreditamos que a ciência é produzida em atividades coletivas e colaborativas, contexto em que o acesso aberto a técnicas e procedimentos de pesquisa é fundamental à democratização do conhecimento científico.
IATexto é desenvolvido com recursos públicos de fomento à pesquisa e à inovação. Para garantir o acesso aberto e ilimitado aos recursos do programa, contamos com o incentivo de programas institucionais por meio de bolsas de pesquisa e recursos de custeio. A nossa rede articula pesquisadores e estudantes de graduação e pós-graduação de universidades públicas brasileiras, que contribuem ativamente para o refinamento metodológico da ferramenta a partir de seus projetos de pesquisa.
IATexto não substitui o papel de quem desenvolve a pesquisa e interpreta os resultados. Compreendemos que o processo de análise de dados resulta de decisões contextualizadas e adaptadas ao fenômeno estudado, objetivos da pesquisa, características do material e fundamentação teórica.
IATexto adota estratégias extrativas de sumarização dos textos analisados e não utiliza Chatbots ou modelos generativos para atribuir significado aos resultados. Enfatizamos a importância do olhar especializado de quem desenvolve a pesquisa, com seus próprios referenciais teóricos e objetivos analíticos, como responsáveis pela condução do processo de interpretação fundamentada nos dados.
IATexto possui configurações pré-definidas que otimizam a análise de textos com características linguísticas e temáticas diversas.
Apesar da utilidade dos parâmetros pré-definidos, o processo de análise é interativo e nem sempre a primeira solução será a mais produtiva diante dos objetivos da pesquisa. Por isso, oferecemos a possibilidade de personalização dos procedimentos em todas as etapas da análise, garantindo que as principais decisões sejam tomadas por quem realiza a pesquisa.
IATexto não dispensa o aprofundamento teórico sobre os modelos estatísticos e de aprendizado de máquina utilizados!
Queremos fazer com que as pessoas implicadas na análise de dados conheçam o significado e a utilidade de cada um dos indicadores e resultados gerados, estimulando o aprendizado e o uso crítico da ferramenta. Por isso, o desenvolvimento do programa prevê o lançamento de um manual de apoio, com conteúdo teórico e prático, ilustrado por exemplos intuitivos e situações reais de pesquisa.
O que faz o IATexto?
IATexto integra abordagens lexicais e neurais em processamento de linguagem natural e análise de dados textuais
Confira algumas características previstas na versão de lançamento:
Organização do corpus
Opções de construção do corpus baseadas em textos e janelas de contexto extraídas de frases e parágrafos.
Pré-processamento de texto:
Opções personalizadas de formatação e uniformização do texto, com aplicação de filtro de palavras auxiliares, redução das palavras à raiz lexical, inclusão de expressões e coocorrências.
Estatísticas lexicais
Descrição do vocabulário em termos de frequência absoluta e relativa, gerando indicadores de importância e especificidade lexical para cada palavra ou expressão incluída na análise.
Modelagem neural e lexical de tópicos
Opções de análise baseadas em redes neurais profundas, métodos estatísticos e de aprendizado de máquina para detecção de tópicos e categorias semântico-lexicais.
Sumarização de texto
Opções de extração automática de palavras importantes e específicas em tópicos e variáveis de contexto.
Gráficos e visualização
Visualização dos resultados em gráficos informativos e interativos, com ênfase na exploração do material em redes semânticas e lexicais.
Análise de textos em diferentes idiomas
Suporte para mais de 10 idiomas, com opções de análise de bancos de dados multilinguísticos