Page 593 - NEIC_FINAL REPORT
P. 593
โครงการศึกษาการจัดทําแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์สารสนเทศ
พลังงานแห่งชาติเพ่ือรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data) ในการขับเคล่ือน
แผนพลังงานของประเทศไทย
รูป็ทั้้ 4.3-26 กระบวนการทั้าํา งานข้องศึูนย์สำารสำนเทั้ศึพัลังงานแหังช้าติ ระยะทั้้ 2 ทั้างเลอ้ กทั้้ 1
พัิจารณ์า New Data Set: กระบวนการทั้ําางานข้องศึูนย์สำารสำนเทั้ศึพัลังงานแหังช้าติในระยะทั้้ 2 ทั้างเล้อกทั้้ 1 รูปที่ 4.3-25 กระบวนการทํางานของศูนย์สารสนเทศพลังงานแห่งชาติ ระยะท่ี 2 ทางเลือกที่ 1
ทางเลือกที่ 1 เช่นเดียวกันขั้นตอนในระยะที่ 1 จะเริ่มจาก data operation management team จะพิจารณา
Processing Data: การ Process Data ในข้ันตอนน้จะทั้าํา การป็รับป็รุงจากระยะทั้้ 1 โดยมู้การใช้้ซึ่อฟต์แวร์มูาช้วย ในการทั้ําางาน โดยซึ่อฟตแ์ วรจ์ ะจดั ทั้ําารป็ู แบบ หัรอ้ การ Extract ข้อ้ มูลู จากไฟล์ เช้น PDF หัรอ้ ไฟลร์ ป็ู ภาพัอน้ ๆ เพัอ้ เตรย้ มูข้อ้ มูลู
ว่ามีข้อมูลใหม่ที่ได้รับเพิ่มเติมจากหน่วยงานต้นทางที่ขอข้อมูลหรือไม่ ในกรณีที่มีข้อมูลใหม่ จะต้องพิจารณา
เข้้าสำูระบบฐานข้้อมููลข้องศึูนย์ฯ โดยซึ่อฟต์แวร์จะบริหัารจัดการโดย Information System team
การจัดทํา Data Glossary และ Metadata ที่จะอธิบายถัดไปในหัวข้อเรื่อง Managing New Data Set
Uploading Data: การ Upload Data ในข้ันตอนน้จะทั้าํา การป็รับป็รุงจากระยะทั้้ 1 โดยใช้ซึ่้ อฟต์แวร์ เพั้อตรวจสำอบ ดังรูปที่ 4.3-30
รายงานฉบับสมบูรณ์
เช้นเด้ยวกันข้นั ตอนในระยะทั้้ 1 จะเริมูจาก data operation management team จะพัิจารณา วา มูข้้ ้อมููลใหัมูทั้้ได้รับเพัิมู เติมูจากหันวยงานต้นทั้างทั้้ข้อข้้อมููลหัร้อไมูในกรณ้ทั้้มู้ข้้อมููลใหัมูจะต้องพัิจารณาการจัดทั้าํา DataGlossaryและMetadata
พิจารณา New Data Set: กระบวนการทํางานของศูนย์สารสนเทศพลังงานแห่งชาติในระยะที่ 2 ทั้้จะอธิบายถัดไป็ในหััวข้้อเร้อง Managing New Data Set ดังรปัู ที่่ 4.3-31
วา ข้อ้ มูลู ทั้จ้ ะนําาเข้า้ ระบบนนั มูฐ้ านข้อ้ มูลู รองรบั หัรอ้ ไมู ถา้ มู้ จะทั้ําาการ Upload เข้า้ สำรู ะบบฐานข้อ้ มูลู หัรอ้ ในกรณทั้้ ไ้ มูมู ้ จะเกบ็
Processing Data: การ Process Data ในขั้นตอนนี้จะทําการปรับปรุงจากระยะที่ 1 โดยมีการใช้ ข้อ้ มูลู ทั้เ้ป็น็ รป็ู แบบไฟลล์ งทั้ะเลสำาบข้อ้ มูลู (DataLake)โดยข้นั ตอนน้จะดําาเนนิ การโดยซึ่อฟตแ์ วรแ์ บบอตั โนมูตั ิโดยซึ่อฟตแ์ วร์
ซจะอบฟรติหั์แาวรรจ์มัดกาชาร่วโยดใยนiกnาfoรrทmําaงาtiนonโดsyยsซteอmฟตt์แeวaรm์จะจัดทํารูปแบบ หรือการ Extract ข้อมูลจากไฟล์ เช่น PDF หรือไฟล์ Data Quality Check: เช้นเด้ยวกับระยะทั้้ 1 ซึ่อฟต์แวร์ทั้้บริหัารจัดการโดย information system team จะตรวจ
รูปภาพอื่น ๆ เพื่อเตรียมข้อมูลเข้าสู่ระบบฐานข้อมูลของศูนย์ฯ โดยซอฟต์แวร์จะบริหารจัดการโดย Information
สำอบความูถูกต้อง ความูสำอดคล้อง และความูครบถ้วนข้องข้้อมููล และจะนําาข้้อมููลทั้้ได้รับเข้้าสำู Staging Database และข้้อมููล
System team
แวดล้อมู ทั้้เก้ยวกับความูต้องการทั้้จะการแก้ไข้หัร้อเพัิมูเติมูเข้้าสำู Profiling Database (ข้้อมููลทั้้นําาเข้้า Staging Database
เแพละื่อตbรuวsiจnสesอsบaวn่าdขd้อaมtaูลaทnี่จaะlyนtiําcเtขe้าaรmะบทั้บําากนาั้รนตมรีฐวจาสำนอขบ้อแมก้ไูลข้รออ้กงรรอับหัหนรึงือ) ไม่ ถ้ามี จะทําการ Upload เข้าสู่ระบบ ฐานข้อมูล หรือในกรณีที่ไม่มี จะเก็บข้อมูลที่เป็นรูปแบบไฟล์ลงทะเลสาบข้อมูล (Data Lake) โดยขั้นตอนนี้
Uploading Data: การ Upload Data ในขั้นตอนนี้จะทําการปรับปรุงจากระยะที่ 1 โดยใช้ซอฟต์แวร์ จะยงั ไมูไ ดร้ บั การยน้ ยนั การแกไ้ ข้ หัรอ้ บางสำว นทั้ซึ่้ อฟตแ์ วรไ์ มูสำ ามูารถแกไ้ ข้ไดจ้ ะตอ้ งใหั้ data operation management team
4.3-61
Final Report
รายงานฉบับสมบูรณ์
4 - 65