Page 691 - NEIC_FINAL REPORT_Appendix
P. 691

 •
•
กระบวนการทวนสอบข้อมูลโดยตรวจจับความผิดปกติเจ้าหน้าที่ของทางสนพ. อาศัยประสบการณ์การทํางานและความรู้ความเชี่ยวชาญส่วนบุคคลในการ ตรวจจับความผิดปกติเพียงอย่างเดียวซึ่งไม่สามารถนํามาเขียนเป็นเกณฑ์ มาตรฐานได้อย่างชัดเจน
ในกรณีที่เจ้าหน้าที่ของสนพ.มีความสงสัยว่าข้อมูลไม่ถูกต้องเนื่องมาจากมี ความผิดปกติเกิดขึ้น กระบวนการท่ีทาง สนพ. ดําเนินการติดต่อไปยังหน่วยงาน เข้าของข้อมูลเพื่อตรวจสอบข้อมูลอาจใช้เวลานาน
ที่ปรึกษาเสนอให้มีฐานข้อมูลเพิ่มเติมจาก Master Database อีก 2 ฐาน คือ (i) Staging เพื่อนําข้อมูลดิบที่ได้รับมาเตรียมการสําหรับนําไปใช้ต่อ (ii) Profile เพื่อ เก็บข้อมูลที่ประมาณการสําหรับข้อมูลท่ียังไม่ได้รับ หรือข้อมูลที่เป็น Outlier ก่อนท่ี จะนําข้อมูลเข้าระบบฐานข้อมูลปัจจุบันของ สนพ.
- ในอนาคต เมื่อศูนย์ฯ มีการเก็บข้อมูลเพิ่มเติมไว้ใน Data Lake เพื่อรองรับ การจัดทําระบบข้อมูลขนาดใหญ่ (Big Data) ข้อมูลท่ีจะเข้ามาใน Data Lake ควรมีการ สร้างโซนข้อมูลแบ่งออกเป็น 5 โซน คือ (i) โชนข้อมูลชั่วคราว (Transient Zone) (ii) โซนข้อมูลดิบ (Raw Zone) (iii) โซนข้อมูลที่เชื่อถือได้ (Trusted Zone) (iv) โซนข้อมูล พร้อมใช้งาน (Refined Zone) และ (v) โซนตัวอย่างข้อมูล (Sandbox Zone)
-
-
-
•
• •
อีกท้ังเสนอให้ใช้ Time Series Analysis เพ่ือพยากรณ์ข้อมูลในอนาคต ข้อเสนอวิธีการพยากรณ์ข้อมูล
ข้อมูลท้ังหมดเป็นข้อมูลท่ีถูกเก็บตามเวลาหรือTimeSeriesDataมักจะมี Trend และ/หรือ Seasonality
ใช้เทคนิคการวิเคราะห์อนุกรมเวลาแบบถดถอย(TimeSeriesRegression)
ในการพยากรณ์ค่าข้อมูลในกรณีที่แหล่งข้อมูลส่งข้อมูลมาล่าช้าทั้งนี้ทางสนพ. ต้องระบุชัดเจนว่าข้อมูลใดบ้างที่มาจากการพยากรณ์ รวมถึงเผยแพร่ รายละเอียดที่ชัดเจนถึงกระบวนการวิเคราะห์ท่ีใช้
 3/9/63 - 10



















































































   689   690   691   692   693