외부 데이터셋을 활용하여 Microsoft Access에서 게임 정보를 시각적으로 조회하고 분석하는 방법을 설명한다. 본 예제에서 사용된 데이터는 실습 목적이며, 실제 최신 정보와는 다를 수 있다.
데이터 수집 및 전처리
원본 데이터 확보
공개 데이터 플랫폼에서 게임 관련 데이터셋을 검색하여 다운로드한다. 로그인 후 필요한 데이터를 선별한다.
데이터 정제 과정
다운로드한 원본 테이블의 속성을 분석하여 세 가지 범주로 구분한다. 레코드 수가 많은 경우 분석에 적합한 규모로 샘플링하며, 각 행을 고유하게 식별할 수 있는 식별자 컬럼을 추가한다. 최종적으로 세 개의 Excel 파일로 분리 저장하며, 모든 파일에 공통 식별키를 포함시킨다.
개념적 설계
개체-관계 구조
게임 개체를 중심으로 세 가지 관점에서 정보를 분리한다. 각 개체는 독립적으로 존재하며, 공통 식별자를 통해 논리적 연결이 가능하다.
논리적 스키마
- 순위 정보(
순위ID, 순위, 게임명, 개발사) - 평가 정보(
평가ID, 추천수, 평점, 평가참여수) - 상세 정보(
상세ID, 출시일, 용량, 언어지원, 장르)
물리적 구현
Access는 파일 자체가 하나의 데이터베이스 역할을 하므로, 별도의 CREATE DATABASE 구문이 필요 없다. 다음은 이에 상응하는 개념적 표현이다.
-- 개념적 표현 (Access에서는 직접 실행 불필요)
-- CREATE DATABASE 게임정보;
순위 정보 테이블
| 컬명 | 자료형 | 길이 | Null 허용 | 제약조건 |
|---|---|---|---|---|
| 순위ID | 짧은 텍스트 | 3 | 아니오 | 기본키 |
| 순위 | 정수 | 기본값 | 아니오 | |
| 게임명 | 짧은 텍스트 | 40 | 아니오 | |
| 개발사 | 긴 텍스트 | 50 | 예 |
CREATE TABLE 순위정보 (
순위ID CHAR(3) PRIMARY KEY,
순위 INT NOT NULL,
게임명 CHAR(40) NOT NULL,
개발사 VARCHAR(50)
);
평가 정보 테이블
| 컬럼명 | 자료형 | 길이 | Null 허용 | 제약조건 |
|---|---|---|---|---|
| 평가ID | 짧은 텍스트 | 3 | 아니오 | 기본키 |
| 추천수 | 정수 | 기본값 | 아니오 | |
| 평점 | 정수 | 기본값 | 아니오 | |
| 평가참여수 | 정수 | 기본값 | 아니오 |
CREATE TABLE 평가정보 (
평가ID CHAR(3) PRIMARY KEY,
추천수 INT NOT NULL,
평점 SMALLINT NOT NULL,
평가참여수 INT NOT NULL
);
상세 정보 테이블
| 컬럼명 | 자료형 | 길이 | Null 허용 | 제약조건 |
|---|---|---|---|---|
| 상세ID | 짧은 텍스트 | 3 | 아니오 | 기본키 |
| 출시일 | 날짜/시간 | 기본값 | 아니오 | |
| 용량 | 실수 | 기본값 | 아니오 | |
| 언어지원 | 긴 텍스트 | 35 | 예 | |
| 장르 | 짧은 텍스트 | 10 | 아니오 |
CREATE TABLE 상세정보 (
상세ID CHAR(3) PRIMARY KEY,
출시일 DATE NOT NULL,
용량 FLOAT NOT NULL,
언어지원 VARCHAR(35),
장르 CHAR(10) NOT NULL
);
데이터 적재
준비된 Excel 파일에서 전체 데이터를 복사하여 Access 테이블의 데이터시트 뷰에 붙여넣는 방식으로 초기 데이터를 로드한다. 이 방식은 대량의 데이터를 빠르게 삽입할 수 있는 간편한 방법이다.