Page 678 - NEIC_FINAL REPORT
P. 678
5 - 74
โครงการศึกษาการจัดทําแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์
สารสนเทศพลังงานแห่งชาติเพื่อรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data)
ในการขับเคลื่อนแผนพลังงานของประเทศไทย รายงานฉบับสมบูรณ์
รูปที่ 5.3-15 สรุปโซนข้อมูลท้ัง 5 ใน Data Lake เพ่ือให้ข้อมูลที่จัดเก็บมีความถูกต้อง ซึ่งจะสร้าง ความมั่นใจกับผู้ใช้งานข้อมูลต่อไป กระบวนการและระบบทวนสอบจึงมีความสําคัญเป็นอย่างมาก
2) กระบวนการในการทวนสอบและการทําความสะอาดข้อมูลสําหรับข้อมูลเข้าฐานข้อมูล
การออกแบบกระบวนการทวนสอบและการทําความสะอาดข้อมูลสําหรับข้อมูลเข้าฐานข้อมูล สามารถเขียนเป็นขั้นตอนได้ ดังนี้
1. ตรวจสอบว่าได้รับข้อมูลภายในวันที่ 1 ของเดือนแล้วหรือไม่ หากยังไม่ได้รับข้อมูลจะมี ระบบแจ้งเตือนคร้ังท่ี 1 เพื่อให้พนักงานที่เกี่ยวข้องได้ติดตามไปยังแหล่งข้อมูล
- ในกรณีที่ได้รับข้อมูลภายในวันที่ 1 ของเดือนแล้ว ให้ข้ามไปข้อ 7
- ในกรณีที่ยังไม่ได้รับข้อมูลภายในวันที่ 1 ของเดือน ให้ไปข้อ 2
2. ในกรณีที่ยังไม่ได้รับข้อมูลภายในวันที่ 1 ของเดือน พนักงานจะต้องติดตามสอบถาม
ไปยังแหล่งข้อมูล ครั้งที่ 1
3. ตรวจสอบว่าได้รับข้อมูลภายในวันที่ 8 ของเดือนแล้วหรือไม่ หากยังไม่ได้รับข้อมูลจะมี
ระบบแจ้งเตือนครั้งที่ 2 เพื่อให้พนักงานที่เกี่ยวข้องได้ติดตามไปยังแหล่งข้อมูลอีกครั้ง -ในกรณทีี่ได้รับข้อมูลภายในวันที่8ของเดือนแล้วให้ข้ามไปข้อ7
- ในกรณีท่ียังไม่ได้รับข้อมูลภายในวันท่ี 8 ของเดือน ให้ไปข้อ 4
4. ในกรณีที่ยังไม่ได้รับข้อมูลภายในวันที่ 8 ของเดือน พนักงานจะต้องติดตามสอบถาม ไปยังแหล่งข้อมูล คร้ังที่ 2
5. ตรวจสอบว่าได้รับข้อมูลภายในวันที่ 10 ของเดือนแล้วหรือไม่
- ในกรณีท่ีได้รับข้อมูลภายในวันที่ 10 ของเดือนแล้ว ให้ข้ามไปข้อ 7
- ในกรณีท่ียังไม่ได้รับข้อมูลภายในวันที่ 10 ของเดือน ให้ไปข้อ 6
6. ในกรณีท่ียังไม่ได้รับข้อมูลภายในวันที่ 10 ของเดือน จะต้องใช้ข้อมูลในอดีตในการประมาณการ เพ่ือเตรียมข้อมูลสําหรับรายงานในวันที่ 12 ของเดือน ซึ่งค่าที่ได้จากการประมาณการ ตลอดจน รายละเอียดวิธีการ ผู้รับผิดชอบ วันและเวลาที่ประมาณการ จะต้องถูกจัดเก็บในฐานข้อมูล Profile รวมถึง Metadata ในส่วน Data Quality ให้เรียบร้อย (QA5 ความสามารถในการ ตรวจสอบได้ (Auditability)) และข้ามไปข้อ 10 สําหรับรายละเอียดขั้นตอนการประมาณการ จะได้กล่าวถึงต่อไปในหัวข้อ 5.3.4.4
7. ในกรณีที่ได้รับข้อมูลแล้ว ให้ตรวจสอบข้อมูลเบื้องต้นและความผิดปกติของข้อมูล โดยตรวจสอบประเด็นต่าง ๆ ดังน้ี
5.3-43
Strategic Design and Development Study of the National Energy Information Center to Support National Energy Plan โครงการศึกษาการจัดทําาแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์สารสนเทศพลังงานแห่งชาติ เพื่อรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data) ในการขับเคล่ือนแผนพลังงานของประเทศไทย