Page 675 - NEIC_FINAL REPORT
P. 675

โครงการศึกษาการจัดทําแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์ สารสนเทศพลังงานแห่งชาติเพื่อรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data) ในการขับเคลื่อนแผนพลังงานของประเทศไทย
รายงานฉบับสมบูรณ์
   ตัวอย่างดัชนีชี้วัด
- จํานวนและร้อยละของข้อมูลที่มีค่า ผิดปกติเม่ือเทียบกับข้อมูลในอดีต
- จํานวนของชุดข้อมูลที่มีความซ้ําซ้อน 5.3.4.2 วิธีการและเครื่องมือในการทวนสอบและทําความสะอาดข้อมูล (Data Cleansing)
1) กระบวนการในการทวนสอบและการทําความสะอาดข้อมูล(เขียนเป็นProcessFlowchart–
แผนผังกระบวนการ และข้ันตอน)
เมื่อศูนย์สารสนเทศพลังงานแห่งชาติดําเนินการจัดเก็บและให้บริการข้อมูลพลังงานที่ครบวงจงจร แก่หน่วยงานต่าง ๆ ทั้งภายในและภายนอกกระทรวงพลังงาน รวมถึงให้บริการข้อมูลกับองค์กรภาครัฐและเอกชน อื่น ๆ และผู้ใช้งานข้อมูลทั่วไปอีกด้วย การทวนสอบและทําความสะอาดข้อมูล (Data Cleansing) เพ่ือให้ม่ันใจได้ว่า ข้อมูลในระบบน้ันมีความถูกต้องจึงเป็นส่ิงท่ีสําคัญย่ิง
กระบวนการทํางาน ณ ปัจจุบัน สนพ. มีความร่วมมือกับองค์กรต่าง ๆ ทั้งภาครัฐและเอกชน ในการส่งข้อมูล และทาง สนพ. รวบรวมที่ได้มาจัดทํารายงานสถิติต่าง ๆ เพื่อนําไปเผยแพร่ในเว็บไซต์ในทุก ๆ วันที่ 12 ของทุกเดือน แม้ว่า ณ ปัจจุบัน ข้อมูลที่ทาง สนพ. ได้รับจะอยู่ในรูปแบบไฟล์ PDF หรือ Excel โดยข้อมูล ส่วนใหญ่จะได้รับผ่านทาง Email ถึงผู้รับผิดชอบข้อมูลนั้น ๆ โดยตรง และมีข้อมูลบางส่วนท่ีทาง สนพ. นํามาจาก Website ภายนอกโดยตรง จากนั้นจึงนําข้อมูลเข้าระบบฐานข้อมูลโดยการ key in โดยตรงหรือการ import ขึ้นอยู่กับความเหมาะสมในแต่ละกรณี ซึ่งปัจจุบันทาง สนพ. มีฐานข้อมูลกลางเพียงฐานข้อมูลเดียวในการเก็บข้อมูล ทุกอย่าง
สําหรับในอนาคตทั้งระยะที่ 1 และ 2 จะมีข้อมูลเข้าหลากหลายรูปแบบและหลากหลายช่องทางมากขึ้น ซึ่งนอกเหนือจากรูปแบบ PDF, Excel และ Website แบบเดิมแล้ว หากหน่วยงานภายนอกมีความพร้อม ในการให้บริการข้อมูลอัตโนมัติผ่าน APIs ทางศูนย์ฯ ก็ควรจะเชื่อมต่อฐาน APIs ในการดึงข้อมูลเข้ามายังฐานข้อมูล โดยตรง เพื่อลดความผิดพลาดในการ Key In ข้อมูลของพนักงาน (Human Error) รวมถึงการลดความล่าช้า ในการส่งผ่านข้อมูลระหว่างพนักงาน สําหรับฐานข้อมูลในอนาคต นอกจากฐานข้อมูลเดิมที่เป็น Master Database ในการเก็บข้อมูลดิบหรือ Transactions ต่าง ๆ ตามการออกแบบฐานข้อมูลในอนาคต ให้มีฐานข้อมูล 2 ฐานข้อมูล เพิ่มเติม ได้แก่
กระบวนการตรวจสอบ ประเด็นการตรวจสอบ Complex Validation QA4 Accuracy
         QA3 Consistency
   - จํานวนและร้อยละของข้อมูลที่มีค่า ผิดปกติเมื่อเทียบกับข้อมูลในอดีต
 QA6 Uniqueness
   5.3-40
 Final Report
รายงานฉบับสมบูรณ์
5 - 71

















































































   673   674   675   676   677