Page 692 - NEIC_FINAL REPORT
P. 692
5 - 88
5.3-57
Strategic Design and Development Study of the National Energy Information Center to Support National Energy Plan โครงการศึกษาการจัดทําาแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์สารสนเทศพลังงานแห่งชาติ เพื่อรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data) ในการขับเคล่ือนแผนพลังงานของประเทศไทย
โครงการศึกษาการจัดทําแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์
สารสนเทศพลังงานแห่งชาติเพื่อรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data)
ในการขับเคลื่อนแผนพลังงานของประเทศไทย รายงานฉบับสมบูรณ์
นอกจากนี้ ในการพยากรณ์ข้อมูล ไม่ว่าจะเป็นการพยากรณ์ข้อมูลในระยะสั้นหรือยาว หากมีการนําข้อมูล ที่พยากรณ์ไปใช้ต่อหรือจําเป็นต้องเผยแพร่ค่าพยากรณ์ดังกล่าว จะต้องมีข้อความชัดเจนว่าเป็นข้อมูลในส่วนใดบ้าง เป็นข้อมูลที่เกิดขึ้นจริง และข้อมูลใดบ้างมาจากการพยากรณ์ รวมถึงจะต้องแจ้งรายละเอียดของวิธีการที่ใช้ในการ พยากรณ์อย่างชัดเจนเพื่อให้ผู้ที่ใช้ข้อมูลต่อไม่เกิดความสับสนและมีความมั่นใจในข้อมูลที่ได้จากการพยากรณ์นี้ และเมื่อทาง สนพ. ได้รับข้อมูลล่าสุดจากแหล่งข้อมูลแล้ว จะต้องมีการปรับปรุงข้อมูลจากข้อมูลที่ได้จากตัวแบบ พยากรณ์มาเป็นข้อมูลจริง
5.3.4.5 การตรวจสอบความผิดปกติของข้อมูล (Outlier Detection)
การตรวจสอบความผิดปกติเป็นหนึ่งในการทวนสอบข้อมูลที่สําคัญเช่นเดียวกัน เพราะการทราบ ความผิดปกติของข้อมูลจะทําให้ผู้ที่ทํางานตระหนักและค้นหาสาเหตุของความผิดปกติของข้อมูลที่เกิดขึ้น ซึ่งอาจเกิดได้หลายสาเหตุ ไม่ว่าจะเป็นความผิดพลาดจากมนุษย์ (Human Error) ซึ่งอาจเกิดจากความผิดพลาดของ เจ้าหน้าที่คีย์ข้อมูล หรือการส่งข้อมูลที่ผิดพลาดโดยระบบ ซึ่งอาจเกิดจากการนําข้อมูลต้นทางผิด Field เข้ามา เป็นต้น
แม้ว่าในปัจจุบันทางเจ้าหน้าที่ใน สนพ. จะตรวจสอบความผิดปกติของข้อมูลโดยอาศัยประสบการณ์และ ความรู้ความเชี่ยวชาญส่วนบุคคลเพียงอย่างเดียวซึ่งไม่อาจนํามาเขียนเป็นมาตรฐานหรือเกณฑ์ที่ชัดเจนได้ แต่ในอนาคตเมื่อมีข้อมูลจํานวนมหาศาลที่ทาง สนพ. ต้องดูแล การพึ่งพิงองค์ความรู้และประสบการณ์ส่วนบุคคล ของเจ้าหน้าที่ยังคงเป็นสิ่งสําคัญอยู่ เพียงแต่ทาง สนพ. ควรมีเครื่องมือในการอํานวยความสะดวกในการทํางาน เพื่อตรวจจับข้อมูลที่มีความผิดปกติ อันได้แก่ เครื่องมือวิเคราะห์ (Analytic Tools) ซึ่งสามารถนําเสนอข้อมูล ในรูปแบบกราฟต่าง ๆ (Visualization) มาช่วยตรวจจับข้อมูลผิดปกติโดยอาจมีการเปรียบเทียบกับค่าในอดีตได้ อาทเิ ช่น
- กรณีที่ข้อมูลเป็นข้อมูลรายปี สามารถทําการเปรียบเทียบข้อมูลแต่ละปีว่ามีความผิดปกติได้ โดยใช้แผนภาพกล่อง (Box Plot) ซึ่งจะเห็นข้อมูลผิดปกติชัดเจน หรือนําข้อมูลรายปีมาสร้าง Time Plot ซึ่งคือการ Plot ข้อมูลกับปี ผู้ใช้งานก็จะสามารถตรวจจับความผิดปกติได้เช่นกัน (รูปที่ 5.3-22 และ รูปที่ 5.3-23 แสดงตัวอย่างของ Box Plot และ Time Plot ตามลําดับ)