Por meio de uma metodologia para análise lexicométrica a partir da produção bibliográfica dos(as) docentes – concebida como “árvore” –, a Pró-Reitoria de Pós-Graduação e Pesquisa (ProPGPq), a Superintendência de Tecnologia da Informação (STI) e a Coordenadoria de Rede de Bibliotecas da Unifesp (CRBU) mapearam a produção acadêmica dos mais de 2 mil orientadores(as) credenciados(as) nos programas de pós-graduação da Universidade Federal de São Paulo (Unifesp).
Diante do grande volume de dados e informações disponíveis, o grupo responsável utilizou ferramentas de Tecnologia da Informação e Comunicação (TIC) para extrair, transformar e analisar esses dados, e também para gerar visualizações em formato de "mapas" desse corpo textual, expondo uma representação gráfica da pesquisa feita na universidade. Desenhar esse "mapa" de maneira visualmente atraente para fins de divulgação dos produtos entregues à sociedade foi um dos objetivos dos(as) pesquisadores(as).
"A importância deste trabalho está no mapeamento das principais áreas de produção acadêmica da Unifesp, no âmbito da pós-graduação, demonstrando a importância da pesquisa acadêmica nela desenvolvida nas oito unidades acadêmicas analisadas. É notável como seus resultados permitem ver os principais pontos de contato entre áreas e programas de pós-graduação, o que é de imensa utilidade para se pensar projetos e novas formas de cooperação entre pesquisadores", relata o grupo formado por Andréa Slemian, Ângela Tavares Paes e Mauricio dos Santos Palazzuoli, que teve também a colaboração de Alexsandro Cardoso Carvalho e Andreia do Carmo.
A ideia da equipe é que o trabalho desenvolvido com um caráter exploratório possa ser ampliado para a universidade como um todo o mais rápido possível. Assim, eles almejam contribuir tanto para discussão sobre as formas atuais de gerenciamento de dados científicos, propondo formas inteligíveis e significativas de visualização e análise, como de divulgação dos resultados dos produtos científicos da universidade pública à sociedade.
O processo e resultados
Para a extração e compilação organizada dos dados contidos na plataforma Lattes do Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), foi utilizada a ferramenta scriptLattes. Esse software retirou o conteúdo da produção bibliográfica, especificamente títulos de artigos, livros e de capítulos de livros (incluindo em inglês, que foram traduzidos), presente nos currículos de 2.181 docentes credenciados(as) como orientadores(as) na pós-graduação stricto sensu da Unifesp. O período compreendido para a análise foi desde o início da década de 1970, quando se iniciou a pós-graduação na instituição, até 31 de dezembro de 2019.
Valendo-se de um software específico, chamado IRaMuTeQ, foram feitas as análises dessas informações separadamente por unidades universitárias (UUs), sendo oito, no total, e para a Unifesp no geral. A partir do banco de dados, foram realizadas: Análise Fatorial de Correspondência (AFC) - Classificação pelo método de Reinert (gráfico cartesiano), Classificação Hierárquica Descendente - CHD (dendrograma) e Análise de Similitude (grafo), também para cada UU e para a universidade. Elas poderão ser conferidas na publicação de resultados que será feita em breve.
A distribuição dos pesquisadores(as) por unidade universitária e a média de publicações por pesquisador(a) se apresentaram da seguinte forma:
A Análise Fatorial de Correspondência (AFC) da Unifesp apresenta um gráfico das palavras, distribuídas em um plano cartesiano, onde o tamanho da fonte é proporcional à força do elo entre a palavra e sua classe. Já a posição e a distância entre palavras e entre palavras e o ponto central do plano são influenciadas pela correlação entre palavras e entre palavra e sua classe: