지난 시간에는 척도와 R프로그램에서 패키지를 인스톨 하는 방법을 알아봤습니다. 이번에는 R프로그램을 통해서 어떻게 데이터를 시각화 할 수 있는지, 쉽게 말해 어떻게 통계 수치를 그래프로 그려 낼 수 있는지 보겠습니다.
저번 시간에 했던 것 처럼 "BudgetFood"라는 데이터에 접근해야 하는데요. 저번에 알려드린 것 처럼 일단 이 데이터에 접근해야합니다.
library("Ecdat")
attach(BudgetFood)
오른쪽 밑 창에 BudgetFood 에 대한 설명이 나올겁니다. 만약에 보이지 않는다면 오른쪽 밑 창에 속해 있는 탭에서 help를 클릭해보세요.
그중에서 Format을 보면 총 6가지가 나옵니다.
wfood, totexp, age, size, town, sex 이렇게 6개의 카테고리로 나뉘어져 있죠? 이 중에서 Town을 한번 봐봅시다.
size of the town where the household is placed categorised into 5 groups: 1 for small towns, 5 for big ones
가정이 속해있는 도시의 규모를 1부터 5까지 정리했는데요 1이 가장 작은 도시이고 5가 가장 큰 도시이네요.
먼저 도시 1,2,3,4,5에 각각 몇명이 있는지 한번 살펴볼까요?
table(town)
1 2 3 4 5
2903 3986 4362 9883 2838
이렇게 나올겁니다. 이것을 파이모양으로 나타낸다면
pie(table(town))
이번에는 막대그래프로 한 번 나타내보겠습니다. 다른 데이터를 가지고 해보지요 아주 간단한 성별을 가지고 해보겠습니다. 조사한 데이터에 남녀가 각각 몇명인지를 알아보는거지요 이것도 마찬가지로 일단 남녀 각각 몇명인지 알아볼까요?
table(sex)
man woman
20624 3347
남자가 압도적으로 많습니다. 아마도 조사한 시기가 1980년대인 점도 있을 것이고, 스페인에서는 아마도 남자가 대체적으로 가계관리를 하는 걸지도 모르겠습니다. 이것을 막대 그래프로 표현해 봅시다.
barplot(table(sex))
왼쪽 옆에 단위가 대충 적혀져 있어서 파이모양의 그래프보다는 정보를 읽기가 조금 더 수월하네요. 하지만 이렇게 양쪽의 데이터가 너무 많이 차이가 난다면 데이터가 적은 쪽을 정확히 파악하기란 조금 어렵습니다.
지금까지 봐온 그래프와 table명령어는 절대빈도를 보는 것입니다. 절대빈도란 위에서 보신바와 같이 데이터의 빈도가 상대적인 것이 아닌 절대적으로 나타나는 것인데요. 다시 말해서 그래프가 퍼센트로 나타난다면 그것은 상대빈도를 나타내는 것이고 위와 같이 남자라고 답한 사람이 몇명인지 정확히 알 수 있는 정보라면 절대빈도라고 할 수 있습니다. 그럼 다음 시간에는 상대빈도와 그 그래프를 그리는 법을 한번 알아보도록 하겠습니다.
'내가 터득한 R 프로그램' 카테고리의 다른 글
[R프로그래밍]히스토그램의 함정 (0) | 2018.07.06 |
---|---|
[R프로그래밍] 상대빈도, 2차원 빈도 (0) | 2018.06.24 |
[통계] 척도, R 프로그램 패키지 인스톨 (0) | 2018.06.15 |
[R프로그래밍] 몇가지 법칙과 간단한 함수 (0) | 2018.05.11 |
[R 프로그래밍] R 프로그램을 시작한다 (0) | 2018.05.03 |