1911년 브리태니커 백과사전, 웹사이트로 재탄생!

by DD
1개월 전
조회수 16

1911년 브리태니커 백과사전의 구조화된 웹 버전(Structured Web Version)이 공개되어, 37,000개 이상의 기사 접근성을 향상시킴

섹션 레벨 구조(Section-Level Structure), 상호 참조 링크, 원본 페이지 스캔 링크 등 다양한 기능 제공

사용자들은 검색 품질(Search Quality), 탐색 기능, 구조적 문제에 대한 피드백을 제시함

기사 내용의 과거 시대적 특징(Historical Characteristics)과 현대 텍스트와의 차이점에 대한 흥미로운 논의가 진행됨

데이터 파싱 및 구조화 과정

프로젝트는 1911년 브리태니커 백과사전의 37,000개 이상의 기사를 재구성하는 데 중점을 두었다. 특히, 헤딩(Heading), 다중 페이지 기사, 표, 수학 수식, 언어, 각주, 그림 등 다양한 요소들을 처리해야 했다. 개발자는 이러한 복잡한 요소들을 정확하게 파싱하고, 구조화된 데이터 모델(Structured Data Model)로 변환하여 웹사이트에서 사용 가능하게 만들었다.

검색 기능 구현 및 개선

사용자들은 웹사이트의 검색 품질(Search Quality)에 대한 피드백을 제공했다. 개발자는 기사 메타데이터(길이, 볼륨 등)를 활용하여 전체 텍스트 검색(Full-Text Search) 기능을 구현했다. 또한, 검색 결과의 정확성을 높이기 위해 다양한 검색 알고리즘과 기술을 적용했을 것으로 예상된다. 사용자 피드백을 기반으로 검색 기능을 지속적으로 개선해 나갈 것으로 보인다.

사용자 인터페이스 및 탐색 기능

웹사이트는 섹션 레벨 구조, 상호 참조 링크, 원본 페이지 스캔 링크 등 다양한 탐색 기능을 제공한다. 사용자는 기사 내에서 클릭 가능한 목차(Clickable Table of Contents)를 통해 원하는 섹션으로 빠르게 이동할 수 있다. 또한, 원본 페이지 스캔 링크를 통해 원본 자료와 웹 버전을 비교하며 정보를 확인할 수 있다. 이러한 기능들은 사용자 경험을 향상시키는 데 기여한다.

과거 텍스트의 구조적 특징

댓글에서는 1911년 백과사전 기사의 구조적 특징(Structural Characteristics)과 현대 텍스트와의 차이점을 지적한다. 특히, 기사 내용의 톤과 구조가 현대 텍스트와 다르며, 저자의 주관적인 의견이나 감정적인 표현이 포함되어 있다는 점을 언급한다. 예를 들어, 코펜하겐에 대한 기사에서 지리적 설명과 함께 해전 묘사(Naval Battle Narration)가 상세하게 묘사되어 있다.

Britannica11.org – a structured edition of the 1911 Encyclopædia Britannica