Visualizando Dados Bibliográficos: o Uso do VOSviewer como Ferramenta de Análise Bibliométrica de Palavras-Chave na Produção das Humanidades Digitais

Renan Marinho de Castro (renan.castro@fgv.br), Fundação Getulio Vargas, Brazil and Ricardo Medeiros Pimenta (ricardopimenta@ibict.br), Instituto Brasileiro de Informação em Ciência e Tecnologia, Brazil

Bibliographic data visualization: the use of VOSviewer as a tool for keywords bibliometric analysis on Digital Humanities production

O objetivo dessa pesquisa é mapear, através da identificação de termos de palavras-chave, quais as principais atividades presentes nas humanidades digitais construindo e visualizando mapas bibliométricos oriundos de uma revisão de literatura deste tema. Dessa forma é proposta uma análise desses dados a partir da utilização do software VOSviewer para construção de redes de relacionamento dos termos provenientes das bases: Web Of Science (WoS) e Scopus. Assim, foram gerados grafos de palavras-chave baseados nos termos atribuídos à literatura registrada nessas duas bases de dados. Buscamos dessa forma combinar essas duas análises a partir da construção de dois mapas distintos e possibilitar seu cotejamento.

Partindo dessa proposta, elaboramos uma expressão de busca 1 para dar conta de recuperar a publicação sobre digital humanities em inglês, espanhol e português nas bases de dados eleitas para esta revisão. Adotou-se como padrão a opção de filtro que contemplasse o ‘ abstract’, sendo o campo 'resumo' escolhido como foco da recuperação por apresentar maiores concentrações de termos relacionados à indicação temática dos documentos. Os resultados reportados pelas buscas foram exportados no formato compatível com o VOSviewer, no caso da Web Of Science, 'Tab Delimited (Win)' e no caso da Scopus, o formato 'CSV'. Foram recuperados na Web Of Science 1067 documentos e, na Scopus, 1575.

De posse dos arquivos extraídos, utilizamos do recurso de criação de grafos baseados em co-ocorrência de palavras-chave. Essa análise oferece as opções 'Author´s keywords' e 'Keywords Plus', por isso elegemos a opção 'all keywords' que engloba essas duas modalidades, além do método de full counting que atribui o mesmo peso para cada link em co-ocorrência. Na WoS foram totalizadas 2826 palavras-chave com exigência mínima de 8 ocorrências para integrar a análise, essa filtragem resultou em 38 núcleos conectados. No caso da Scopus também elegemos a opção 'all keywords' para contemplar as palavras-chave atribuídas pelos próprios autores ( Author´s Keywords) além da opção 'index keywords', cuja atribuição é proveniente da base. Foram, assim, identificadas 5195 palavras-chave e a nota de corte elevada à recorrência mínima de 15 vezes. Essa configuração produziu um grafo com 64 (após desambiguação: 61) termos com núcleos de conexão entre si. Este grafo também considerou o método 'full counting'.

Figure 1. Figura Grafo de palavras-chave da produção registrada na Web Of Science com 'nós' calculados segundo seu link total de força.

Na sequência produzimos dois mapas baseando-se nas respectivas fontes de literatura e, baseados nestas, geramos, além dos dois mapas, a mineração dos termos mais recorrentes que servem de base para construção do grafo. O grafo respectivo à WoS possui 6 clusters compostos por 10 termos no de maior tamanho e 4 no menor. A análise de clusters permite identificar que dentre estes há clusters estreitamente relacionados às bibliotecas digitais e à ciência da informação (C.I.) (por exemplo termos como information e technology), como no caso do cluster 1. Também há um cluster relacionado às técnicas de visualização (cluster 2). O cluster 3 volta a apresentar termos relacionados à C.I. como archive, digitization e libraries. Já o cluster 5 volta-se às técnicas das humanidades digitais como text mining e machine learning.

Figure 2. Figura Grafo de palavras-chave da produção registrada na Scopus com 'nós' calculados segundo seu link total de força.

O grafo com dados da Scopus também possui 6 clusters tendo no maior deles 16 termos e, no menor, 7. Também é possível perceber a recorrência de um cluster voltado às técnicas de visualização (cluster 4: visualization, data visualization e gis) bem como a reverberação da presença da C.I. com os termos digital libraries, digital archives e digital collections (cluster 2). Outras técnicas das humanidades digitais reincidem como data mining e text mining (cluster 3), além de outros termos relacionados à ciência da informação: archives, libraries e digitization (cluster 5). Vale destacar que o termo com maior peso foi digital libraries tanto na WoS como na Scopus.

Dessa forma os mapas permitem visualizar termos e conceitos mais presentes na literatura e, consequentemente, possibilitam a clarificação da relação entre eles. Apesar da grande rede de relacionamento que os mapas exibem é possível, mesmo interpretando apenas os clusters criados, contemplar, por exemplo, as áreas principais que interagem para formar a ideia de humanidades digitais na literatura. Além disso, sobretudo, o cotejamento dos grafos provenientes de cada repositório de literatura permite corroborar quais termos se consolidam através de sua reincidência nos mapas.


Appendix A

Bibliography
  1. DACOS, Martin. (2011). Manifesto das Humanidades Digitais. ThatCamp Paris, [S.l.] 26 mar. 2011. Disponível em: < https://tcp.hypotheses.org/497> Acesso em 10 out. 2016.
  2. ECK, Nees Jan Van; WALTMAN, Ludo. (2016) VOSviewer Manual. Disponível em http://www.vosviewer.com/documentation/Manual_VOSviewer_1.6.5.pdf Acesso em 10 de julho de 2017
  3. KOLTAY, Tibor. (2016) Library and information science and the digital humanities: perceived and real strengths and weaknesses.  Journal of documentation, 72(4), pp. 781-792.
  4. TANG, Muh-Chyun; CHENG, Yun Jen; CHEN, Kuang Hua. (2017) A longitudinal study of intellectual cohesion in digital humanities using bibliometric analyses, Scientometrics, v.113, n.2, pp.985-1008, nov. 2017.
Notes
1.

A expressão de busca aplica às bases selecionadas pode ser representada pela string (((((("Digital Humanities")) OR (("Humanidades Digitales ")) OR (("Humanidades Digitais"))))))