- 이번 글에서는 분석할 데이터에 대한 기본적인 통계적 정보 확인 및 이에 대한 그래프를 그리는 방법을 이야기 하고자 한다.
- 먼저 분석할 데이터를 R Studio에서 생성한 프로젝트에 삽입해준다.
- 메뉴얼에서는 데이터에 있는 날짜/시간 포맷을 쉽게 다루기 위하여 "lubridate" 패키지 설치를 권장하고 있다. (자세한 내용은 메뉴얼 참고)
- R Studio 콘솔 창에 아래와 같이 코드를 작성하면 설치되며, 만약에 설치가 되지 않는다면 "openair" 패키지와 마찬가지로 우측 "package" 탭에서 "Install"을 클릭 후, 검색과 설치를 진행하면 된다.
- 패키지 설치 후, "mydata" 변수에 데이터 파일을 "import"한다.
- 이 때, 데이터 파일이 프로젝트 폴더에 위치하지 않는다면, " " 안에 데이터 파일이 위치하고 있는 "절대경로"를 넣어야한다.
mydata <- import("openair_example_data_long.csv")
- 다음으로 데이터의 기본적인 통계 정보를 확인하는 방법이다.
- "summary"라는 간단한 코드로 데이터 내 각 물질별 최소값, 최대값, 중간값, 평균값 등을 확인할 수 있다.
summary(mydata)
- 앞서 "summary" 코드로 확인된 내용을 그래프 형식으로 표현할 수 있다.
summaryPlot(mydata)
- "summaryPlot"에서 여러 조건 코드를 추가하여 형태 및 내용을 변경 및 추가할 수 있다.
참고문헌 : OpenAir 메뉴얼 http://www.openair-project.org/PDF/OpenAir_Manual.pdf
댓글 없음:
댓글 쓰기