The Future of Digital Humanities, Smart Big Data: A Postscript from a Research Fellowship at Trier Center for Digital Humanities in Germany
(디지털인문학의 미래, 스마트 빅데이터: 독일 트리어 디지털인문학 센터 CLS 연구 펠로우 후기)

Published in Digital+Humanities, 2024

Recommended citation: Kim, B. (2024). The Future of Digital Humanities, Smart Big Data: A Postscript from a Research Fellowship at Trier Center for Digital Humanities in Germany. Digital+Humanities. 30. 57–70. https://doi.org/10.5281/zenodo.13293696

Online link
Download paper here

Abstract

This paper introduces the concept of “smart big data” as a new paradigm in Digital Humanities (DH) research, based on the author’s fellowship experience at the Trier Center for Digital Humanities (TCDH) in Germany. It addresses the current trend of increasing big data utilization in Korean DH research, while highlighting concerns about the lack of consideration for data quality and humanistic characteristics. As an alternative, the paper proposes the concept of smart big data, which combines the scale and diversity of big data with the qualitative excellence of smart data. The study suggests methods for constructing smart big data, including the adoption of advanced machine-readable data formats and the use of artificial intelligence technologies, particularly Large Language Models (LLM) and Retrieval-Augmented Generation (RAG). Furthermore, it emphasizes the importance of international DH research experience while arguing for the need for creative adaptation and development that considers the unique context of Korean humanities.

초록

이 글은 독일 트리어 디지털인문학 센터(TCDH)에서의 연구 펠로우십 경험을 바탕으로, 디지털인문학(DH) 연구의 새로운 패러다임인 “스마트 빅데이터” 개념을 소개하고 한국 DH 연구의 발전 방향을 제시한다. 최근 한국의 DH 연구에서 빅데이터 활용이 증가하는 추세이나, 데이터의 질적 수준과 인문학적 특성에 대한 고려가 부족하다는 우려가 제기되고 있다. 이에 대한 대안으로 스마트 빅데이터 개념을 제안하며, 이는 빅데이터의 규모와 다양성, 스마트 데이터의 질적 우수성을 결합한 것이다. 이 연구는 고급 기계가독형 데이터 포맷의 도입과 인공지능 기술, 특히 대규모 언어 모델(LLM)과 검색 증강 생성(RAG)을 활용한 스마트 빅데이터 구축 방안을 제시한다. 또한 해외 DH 연구 경험의 중요성을 강조하면서, 한국 인문학의 고유한 맥락을 고려한 창조적 수용과 발전의 필요성을 주장한다.