Page 676 - NEIC_FINAL REPORT
P. 676

5 - 72
นอกจากนี้ ในอนาคต ทาง สนพ. ยังมีการเก็บข้อมูลเพิ่มเติมไว้ใน Data Lake เพื่อรองรับการจัดทํา ระบบข้อมูลขนาดใหญ่ (Big Data) ข้อมูลที่จะเข้ามาใน Data Lake เช่น ข้อมูล Streaming หรือข้อมูลจาก IoT ต่าง ๆ ซึ่งเทคโนโลยีปัจจุบันสามารถทําการส่งถ่ายข้อมูล (Ingest) จากแหล่งต่าง ๆ มากองไว้ใน Data Lake และผู้ใช้ สามารถนําข้อมูลมากรองเมื่อต้องการหยิบใช้ข้อมูลได้ทันที อย่างไรก็ตาม แนวปฏิบัติที่ดีที่สุด (Best Practice Framework) ในการจัดการข้อมูลที่ใน Data Lake และมีการใช้การอย่างแพร่หลาย คือ การสร้างโซนข้อมูลโดยใช้ ลักษณะการใช้งานของข้อมูลเป็นเกณฑ์ในการแบ่งโซน ซึ่งสามารถแบ่งออกเป็น 5 โซน ดังนี้
a. โชนข้อมูลชั่วคราว(TransientZone)
โซนข้อมูลชั่วคราวเปรียบเสมือนโซนรองรับการส่งถ่ายข้อมูลเข้า Data Lake หรือ Loading Zone โดยข้อมูลในโซนนี้จะมีระบบทวนสอบในเบื้องต้น เช่น ข้อมูลที่ส่งมาครบถ้วนหรือไม่ รวมไปถึงการแปลง ข้อมูลซึ่งระบุไว้ในส่วนการออกแบบการจัดการวงจรชีวิตของข้อมูลที่ได้กล่าวไปถึงก่อนหน้าอีกด้วย เช่น การปิดบังข้อมูล (Data Masking) ในข้อมูลที่อ่อนไหว (Sensitive Data) ซึ่งหากข้อมูลผ่านการตรวจสอบและ ประมวลผลเบื้องต้นแล้วจะทําการย้ายข้อมูลไปยังโซนอื่นที่มีความเหมาะสมต่อไป โดยเครื่องให้บริการ ที่ทําการประมวลผลการทํางานในโซนนี้จะถูกจัดอยู่ใน Security Domain: External Services เนื่องจาก เป็นการรับข้อมูลจากภายนอก และเมื่อทําการตรวจสอบและประมวลผลเบื้องต้นเสร็จแล้ว ก็จะทําการส่งข้อมูล เข้าสู่ฐานข้อมูลผ่านทาง Ingres SQL Server เพื่อให้ฐานข้อมูลหลัก ทําการดึงข้อมูลเข้าสู่งฐานข้อมูลหลักต่อไป
b. โซนข้อมูลดิบ(RawZone)
โซนข้อมูลดิบจะรองรับข้อมูลดิบ ซึ่งอาจเป็นข้อมูลที่ผ่านการปิดบังข้อมูลมาแล้ว (Masked Data) หรือจะเป็นแปลงค่าข้อมูลอ่อนไหวเป็นค่าอื่น (Tokenized Data) เพื่อสร้างความปลอดภัย ของข้อมูล (Data Security) ในการจัดการกับข้อมูลอ่อนไหว โดยทั่วไปผู้ที่เข้าถึงข้อมูลในโซนนี้ได้ จะเป็นนักวิเคราะห์ข้อมูลหรือนักวิเคราะห์ระบบ โดยในการจัดการข้อมูลดิบ จะถูกจัดการในฐานข้อมูลหลัก ใน Security Domain : Data Center (ดูหัวข้อ 6.5 ประกอบ) เพื่อให้มั่นใจได้ว่าข้อมูลที่เก็บในโซนนี้ จะมีความปลอดภัย แล้วจะเมื่อต้องการการประมวลผลโดยนักวิเคราะห์ข้อมูล ข้อมูลจะถูกส่งออกจาก Security Domain : Data Center ออกไปยัง Read Scale Out SQL Server ใน Security Domain : Processing Farm เพื่อรองรับการวิเคราะห์ข้อมูลต่อไป
5.3-41
Strategic Design and Development Study of the National Energy Information Center to Support National Energy Plan โครงการศึกษาการจัดทําาแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์สารสนเทศพลังงานแห่งชาติ เพื่อรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data) ในการขับเคล่ือนแผนพลังงานของประเทศไทย
a. b.
โครงการศึกษาการจัดทําแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์
สารสนเทศพลังงานแห่งชาติเพื่อรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data)
ในการขับเคล่ือนแผนพลังงานของประเทศไทย รายงานฉบับสมบูรณ์
Staging เพื่อนําข้อมูลดิบท่ีได้รับมาเตรียมการสําหรับนําไปใช้ต่อ
Profile เพ่ือเก็บข้อมูลที่ประมาณการสําหรับข้อมูลที่ยังไม่ได้รับ หรือข้อมูลที่เป็น Outlier ก่อนท่ีจะนําข้อมูลเข้าระบบฐานข้อมูลปัจจุบันของ สนพ.
 




















































































   674   675   676   677   678