Distant Reading on ‘Jeohui’ ― A Study on the Diachronic Changes of Two Types of ‘Jeohui’ Applying an ELECTRA-Based Semantic Classification Model and N-gram Analysis
(멀리서 읽는 “저희”― ELECTRA 기반 의미 분류 모델과 N-gram을 활용한 두 가지 ‘저희’의 통시적 변화 양상 연구)

Published in DAEDONG MUNHWA YEON'GU, 2024

Recommended citation: Seo, J., Ha, N., Kim, M., Han, J., Kim, B., & Park, S. (2024). Distant Reading on ‘Jeohui’ ― A study on the diachronic changes of two types of ‘Jeohui’ applying an ELECTRA-based semantic classification model and N-gram analysis. Daedong Munhwa Yeon'gu, 128, 513–548. https://doi.org/10.18219/ddmh..128.202412.513

Online link
Github
Download paper here

Abstract

This paper adopts quantitative research methodologies collectively referred to as “distant reading” to analyze the characteristics of two types of the term “Jeohui” found in modern Korean novel texts. By applying these findings to an expanded dataset up to the present day, the study examines the diachronic trends in the usage of “Jeohui” to understand its overall patterns of change. Utilizing digital methodologies such as an ELECTRA-based semantic classification model and N-grams, the research provides a macro-level view of the trajectories of the two types of “Jeohui” in the data from newspapers (Chosun and Donga), spanning approximately 1954 to 2024.
The study examines the broader trends in the usage of the term “Jeohui”, which have previously been discussed only sporadically and in a limited scope, to explore how its usage became established and how its meaning has evolved over time. Additionally, it conducts collocation analyses of the two types of “Jeohui” across different periods, offering extensive examples of vocabulary associated with each usage. Through this, the paper aims to lay the groundwork and provide direction for future research on “Jeohui”.

초록

본 논문에서는 멀리서 읽기(distant reading)로 통칭되는 정량적 연구방법론을 채택하여 근대 소설 텍스트에 나타나는 두 가지 ‘저희’의 특징을 분석하고, 이를 오늘날에 이르는 확장된 데이터에 적용하여 ‘저희’의 사용 추이를 통시적으로 고찰함으로써 전체적인 변화 양상을 파악하고자 한다. 이를 위해 ELECTRA 기반 의미 분류 모델과 N-gram 등의 디지털방법론을 활용하여 약 1954년부터 2024년까지의 조선·동아 신문데이터에 나타나는 ‘저희’의 두 유형이 그리는 추이를 거시적으로 들여다본다. 본 논문은 기존에 산발적이고 한정적으로만 언급되었던 ‘저희’ 사용의 큰 흐름을 확인함으로써 ‘저희’의 용법이 정착되는 과정과 의미상의 변화를 탐색하였다. 또한 각 시대별로 두 가지 ‘저희’의 연어 분석을 진행하여 각 용법과 연관되는 어휘들의 풍부한 사례들을 제공함으로써 향후 ‘저희’ 연구를 위한 토대를 마련하고 방향성을 제시하고자 하였다.