US EPA PMF 모델 기본 사용법 (데이터 요약 정보 확인) - KJT's Blog

Storage for Knowledge

Hot

Post Top Ad

Study is the best friend!

2019-08-26

US EPA PMF 모델 기본 사용법 (데이터 요약 정보 확인)


  • PMF 프로그램에 오염물질 농도 및 불확도 파일을 삽입하면, PMF 프로그램에서는 그 데이터를 바탕으로 다양한 요약 정보를 기본적으로 표시해준다. 
  • 요약 내용은 "Concentration/Uncertainty", "Concentration Scatter Plot", "Concentration Time Series", "Data Exceptions" 탭에서 확인이 가능하다.
그림 1
  • "Concentration/Uncertainty" 탭에서는 삽입된 오염물질 농도 및 불확도 데이터를 바탕으로 "S/N", "최소값(Min)", "25 백분위 값(25th)", "중앙값(50th)", "75 백분위 값(75th)", "최대값(Max)" 등과 같은 간단한 통계 정보를 보여준다. 
  • 그리고 오른쪽에는 농도와 불확도 데이터를 바탕으로 "Scatter Plot" 형태의 그래프를 보여준다.
  • 전형적인 농도와 불확도의 관계는 "Scatter Plot"에서 하키 스틱 형태를 가진다.
그림 2
  • "S/N"은 농도(Signal), 불확도(Noise)로 계산된 값이다.
    • 불확도를 초과하는 농도 값만 Signal로 계산에 이용한다.
    • 불확도 2배의 값을 가지는 오염물질의 S/N 비는 "1" 이며, 주로 이 값을 넘어가면 "good" signal로 판단한다.
    • 각 오염물질의 "카테고리(Cat)" 설정 시 중요한 매개변수가 된다. 
    • 오염물질 농도(x), 불확도(s) 사이의 계산 방법은 그림 3과 같다. 
그림 3
  • 오염물질별 카테고리 지정은 이 후에 실행될 PMF 모델링 내에서 각 오염물질들의 기여도를 계산할 때 중요한 역할을 하는 부분이다. 
  • 주로 S/N 비, 결측 샘플 수, 검출 한계 미만의 샘플 수, 샘플링 및 분석 시 에러, 예상 배출원,  물질의 반응성 등에 대한 자세한 지식을 바탕으로 카테고리를 결정하는 것이 가장 이상적이다.
  • 만약에 이러한 정보들이 부족하다면 S/N비를 사용하여 결정할 수 있다. 
  • PMF 메뉴얼에서는 S/N비가 0.5보다 작으면 "Bad", 0.5~1 이면 "Weak"으로 결정한다고 되어 있다. 하지만 이는 연구자의 역량으로 변경이 가능할 것이다. 
    • Strong : 샘플 및 불확도 변경 없이 모든 데이터 사용
    • Weak : 모든 샘플 사용하지만, 불확도를 기존 값의 3배로 변경
    • Bad : 모든 샘플 및 불확도 정보를 PMF 모델링에서 제외
  • 화면 하단에 있는 "Total Variable (Defaults to Weak)" 버튼은 오염물질들이 이루는 전체 성분을 표시해준다. 여기에서는 모든 오염물질이 PM2.5의 구성요소이므로 PM2.5를 "Total Varible"로 지정해준다. 
  • 이 후 PM2.5 부분은 굵은 글씨로 바뀌게 되고, 카테고리가 "Weak"으로 자동으로 바뀌게 된다. 
그림 4
  • "Concentration Scatter Plot" 탭에서는 오염물질 사이의 상관 관계 확인 및 배출원 및 배출원 범주에 대한 예상을 할 수 있다. 
  • 각 오염물질 간 one-to-one 그래프선형 회귀 그래프를 확인할 수 있다.
  • 마우스를 데이터 점으로 가져가면 아래쪽에 날씨/시간, X/Y축 오염물질의 농도가 나타나고, 그 옆으로 회귀 그래프의 회귀식이 나타난다. 
그림 5
  • "Concentration Time Series"탭에서는 시간 패턴에 따른 농도 변화 및 비정상적 이벤트 여부를 확인할 수 있다.
  • 최대 10개의 오염물질을 동시에 선택해서 비교해볼 수 있으며, 패턴 분석을 통해 배출원 공유 여부의 예상이 가능하고, 모델링 진행 시 제외해야할 데이터를 확인하고 바로 제외할 수 있다. 
  • 특정 데이터를 제외하고자 할 때에는 데이터를 클릭한 후, "Exclude Samples" 버튼을 클릭하면 실행된다. 이는 데이터의 삭제가 아니라 모델링 진행에서 제외되는 개념이다.
  • 제외된 데이터를 다시 추가하고 싶으면, 제외된 데이터를 선택한 후, "Restore Samples" 버튼을 클릭하면 된다.
  • 마우스 클릭으로 데이터 선택이 어려울때에는 근처에 있는 다른 데이터를 클릭한 후, 키보드의 좌/우 키로 데이터 선택이 가능하다.
그림 6
  • "Data Exceptions" 탭에서는 이전의 모든 탭에서 실행된 "카테고리 설정", "제외된 데이터" 등과 같은 내용이 표시된다. 
  • 연구자는 이러한 정보를 검토하여 PMF 모델링 실시 전 데이터의 최적화를 확인해야한다. 
  • 이 보고서는 화면에서 마우스 오른쪽 클릭을 통해 저장할 수 있다. 
그림 7



참고문헌

  1. EPA Positive Matrix Factorizatoin (PMF) 5.0 Fundamentals and User Guide, https://www.epa.gov/sites/production/files/2015-02/documents/pmf_5.0_user_guide.pdf

댓글 없음:

댓글 쓰기

Post Top Ad

Play with Study!