Page 574 - NEIC_FINAL REPORT
P. 574

b. ป็ระเด็นทั้้ต้องพัิจารณา
i. ข้้อมููลยังไมูมูค้วามูทั้ันสำมูัยเพั้ยงพัอสำวนมูากช้้า1.5ถึง2เดอ้น(เหัมู้อนกับระบบป็ัจจุบันข้องสำนพั.)
ii. ข้้อมููลทั้้ได้รับผานระบบ APIs จะเป็็นข้้อมููลทั้มู้ ้ความูสำมูาํา เสำมูอมูากยิงข้ึน สำว นในกรณ้ทั้หั้ นวยงานภายนอกยังไมูมู้
ระบบน้ ความูสำมูําาเสำมูอ หัร้อบางครังไมูมูข้้ ้อมููล จะเหัมูอ้ นกันกับระบบทั้้ดําาเนินการอยใู นป็ัจจุบันข้อง สำนพั.
iii. เมู้อข้้อมููลทั้้ได้รับเป็ล้ยนรูป็แบบ เช้น ไฟล์ Excel จะต้องจัดรูป็แบบโดยผู้รับผิดช้อบ เพั้อใหั้สำามูารถนําาเข้้าสำู
ระบบได้ (เช้นเด้ยวกับระยะทั้้ 1) 2. Process Data
a. ระบบงานในระยะทั้้ 2
i. เพั้อลดข้้อผิดพัลาดในการนําาเข้้าข้้อมููล จึงจําาเป็็นต้องใช้ซึ่้ อฟต์แวร์ สำําาหัรับการนําาเข้้าข้้อมููลแบบอัตโนมูตั ิ เพั้อลด
การ Key-in ทั้้ไมูจําาเป็็น โดยตอยอดจากซึ่อฟต์แวร์ จากระยะทั้้ 1 ทั้มู้ ้การทั้ําาความูสำะอาดข้้อมููล (Cleansing Data) เบ้องต้น เพั้อใหั้เป็็นอัตโนมูตั ิในรูป็แบบ End-to-end มูากยิงข้ึน โดยข้ันตอนน้ ศึูนย์ฯ อาจพัิจารณาเลอ้ กใช้้ระบบหัร้อซึ่อฟต์แวร์ระดับ องค์กร สำําาหัรับการทั้ําา ETL Data Integration ในทั้้องตลาดมูาป็ระยุกต์ใช้้ โดยเล้อกใช้้เฉพัาะฟังก์ช้ันทั้จ้ ําาเป็็น โดยซึ่อฟต์แวร์ ดังกลา ว ยกตัวอยา งเช้น Microsoft SSIS, Informatica, Talend, Data Oracle Integrator เป็็นต้น
ii. พััฒนาฐานข้้อมููลใหัมู โดยตอยอดจากฐานข้้อมููลเดิมูซึ่ึงไมูย้ดหัยุนเพั้ยงพัอในการจัดเก็บข้้อมููลข้นาดใหัญ่ (Big Data) โดยอาจจะทั้ําางานรวมูกับฐานข้้อมููลในระยะทั้้ 1 หัรอ้ จะ Transition โดยใช้้ระบบฐานข้้อมููลใหัมูทั้ ังหัมูด ทั้ังน้ข้ึนอยูกับ บริบทั้ และความูต้องข้องศึูนย์ฯ ณ ข้ณะนัน
iii. จัดทั้ําาทั้ะเลสำาบข้้อมููล (Data Lake) เบ้องต้นเพัอ้ จัดเก็บข้้อมููลใหั้เป็็นระบบระเบ้ยบ ตามู Business Glossary โดยจัดการโครงสำร้างและการจัดเก็บข้้อมููลเพัิมูเติมู จากระยะทั้้ 1
iv. พัฒั นาแหัลง จดั เกบ็ ข้อ้ มูลู (Repository) พัรอ้ มูทั้งั ตดิ ตัง ซึ่อฟตแ์ วร์ สำําาหัรบั Archive ข้อ้ มูลู ทั้้หัมูดอายุ เพัอ้ ใหัเ้ ป็น็ ไป็ตามูวงจรช้้วิตข้้อมููล (Data Life Cycle) ทั้้ได้กําาหันด ใน Metadata และใหั้สำอดคล้องกันกับธรรมูาภิบาลข้้อมููล
v. ในข้ันตอนน้การทั้าํา การควบคุมูการเข้้าถึงภายใน (Internal Access Control) ทั้้ป็รึกษาแนะนําาการพััฒนาระบบ Single-Signed-On (SSO) เพั้อกําาหันดสำิทั้ธิแบบศึูนย์กลาง ในการเข้้าถึงข้้อมููล และทั้ําาใหั้การทั้ําางานมู้ป็ระสำิทั้ธิภาพัและ ความูป็ลอดภัยมูากยิงข้ึน ซึ่ึงการจดั ทั้ําาระบบ SSO ในข้ันตอนน้จ ะกาํา หันดสำทั้ิ ธิการเข้้าถึงระบบฐานข้้อมููลและข้้อมููลในทั้ะเลสำาบ ข้้อมููล (Data Lake)
b. ป็ระเด็นทั้้ต้องพัิจารณา
i. ข้้อมููลทั้้ได้ทั้ําาความูสำะอาด (Cleansing Data) แล้ว ซึ่ึงจัดทั้ําาแบบอัตโนมูัติ หัร้อข้้อมููล ทั้้มู้การป็ระมูาณการ
บางสำวนอาจมู้ความูต้องการการตรวจสำอบและย้นยัน โดยผู้รับผิดช้อบกอนทั้จ้ ะนําาเข้้าสำูระบบ ซึ่อฟต์แวร์ทั้้นําามูาใช้้ควรจะต้องมู้ Feature เพั้อใช้้สำําาหัรับการย้นยันข้้อมููลดังกลาว โดยผู้รับผิดช้อบด้วย
ii. การนําาซึ่อฟต์แวร์เข้้ามูาใช้้จะต้องพัิจารณาการจัดทั้ําา ETL/ELT สำําาหัรับการ Load ข้้อมููลทั้ังจากฐานข้้อมููล ข้องศึูนย์ และ สำนพั. ทั้ังทั้้เป็็น Structured data และข้้อมููล ในทั้ะเลสำาบข้้อมููล (Data Lake) ทั้้เป็็นลักษณะ Semi-structured หัรอ้ Unstructured Data เพัอ้ นําาเข้า้ สำรู ะบบ Data Warehouse ในกระบวนการถดั ไป็ (Transform) เพัอ้ ทั้ําาการวเิ คราะหัต์ อ ไป็
iii. เพั้อใหั้การวิเคราะหั์ข้้อมููลใหั้มู้ป็ระสำิทั้ธิภาพั ข้้อมููลทั้้จัดเก็บในฐานข้้อมููลและ ทั้ะเลสำาบข้้อมููล (Data Lake) ข้องศึูนย์ฯ จะต้องมู้การจัดทั้ําา Business Glossary โดยละเอย้ ด
 4 - 46
Strategic Design and Development Study of the National Energy Information Center to Support National Energy Plan โครงการศึกษาการจัดทําาแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์สารสนเทศพลังงานแห่งชาติ เพื่อรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data) ในการขับเคล่ือนแผนพลังงานของประเทศไทย   572   573   574   575   576