Page 568 - NEIC_FINAL REPORT
P. 568
4 - 40
iii. เมูอ้ ข้อ้ มูลู ทั้ไ้ ดร้ บั เป็ลย้ นรป็ู แบบ เช้น รป็ู แบบในไฟล์ Excel ทั้าํา ใหัต้ อ้ งจดั รูป็แบบ โดยผรู้ บั ผดิ ช้อบ เพัอ้ ใหัสำ้ ามูารถ นําาเข้้าสำูระบบได้ (เหัมู้อนกับระบบป็ัจจบุ ันข้อง สำนพั.)
2. Process Data
a. ระบบงานในระยะทั้้ 1
i. ใช้้การKey-inข้้อมููลทั้้ไมูสำามูารถนําาเข้้าสำูระบบได้โดยอัตโนมูตัิ(เหัมู้อนกับระบบป็ัจจุบันข้องสำนพั.)
ii. ใช้ก้ ารนําาข้อ้ มูลู ในไฟล์ Excel ตามูรป็ู แบบทั้ก้ ําาหันดเข้า้ สำรู ะบบแบบอตั โนมูตั ิ (เหัมูอ้ นกบั ระบบป็จั จบุ นั ข้อง สำนพั.) i i i . พั ฒั น า ซึ่ อ ฟ ต แ์ ว ร เ์ พั อ้ ทั้ ํา า ก า ร ทั้ ํา า ค ว า มู สำ ะ อ า ด ข้ อ้ มู ลู ( C l e a n s i n g D a t a ) เ บ อ้ ง ต น้ โ ด ย ซึ่ อ ฟ ต แ์ ว ร ต์ อ้ ง มู ค้ ว า มู สำ า มู า ร ถ
ในการจัดการ Missing data การป็ระมูาณการข้้อมููล ทั้ไ้ มูได้รับเบ้องต้น (เช้น การใช้้เทั้คนิค Interpolate) และการแก้ไข้ป็ัญ่หัา ข้้อมููล ทั้เ้ ป็็น Outlier แบบอัตโนมูัติ
iv. การพััฒนาซึ่อฟต์แวร์ดังข้้อด้านบนจะต้องมู้การจัดเตร้ยมูฐานข้้อมููลเพัิมูเติมู ดังน้ (1) ฐานข้้อมููล Staging เพั้อนําา ข้้อมููลทั้ไ้ ด้รับมูาเตร้ยมูการ (2) ฐานข้้อมููล Profile เพั้อเก็บข้้อมููลทั้ต้ ิดตามูการป็ระมูาณการ ระบุข้้อมููลทั้้ยังไมูได้รับ หัรอ้ ข้้อมููล ทั้้เป็็น Outlier กอนทั้จ้ ะนําาข้้อมููลเข้้าระบบฐานข้้อมููลข้องศึูนย์ฯ หัร้อฐานข้้อมููลข้อง สำนพั.
v.พััฒนาระบบฐานข้้อมููลใหัมูใหั้รองรับข้้อมููลทั้้ได้เพัิมูเติมูจากหันวยงานภายใต้กระทั้รวงพัลังงานและหันวยงาน
ภายนอก
vi. จัดทั้ําาโครงสำร้างทั้ะเลสำาบข้้อมููล (Data Lake) เบ้องต้น โดยอาจจะกําาหันด เคร้องคอมูพัิวเตอร์หัร้อ Storage
เฉพัาะในการจัดเก็บไฟล์ เพั้อจัดเก็บข้้อมููลใหั้เป็็นระบบระเบ้ยบ และสำามูารถสำ้บค้นได้ตามู Business Glossary
vii. จัดทั้ําาการควบคุมูการเข้้าถึงภายใน (Internal Access Control) โดยใช้ร้ ูป็แบบ Role-Based Access Control (RBAC) เพัอ้ จดั ทั้ําาการใหัสำ้ ทั้ิ ธิ (Authorization) ใหัก้ บั ผรู้ บั ผดิ ช้อบในศึนู ยฯ์ หัรอ้ หันว ยงานข้อง สำนพั. โดยรายละเอย้ ดเทั้คโนโลย้
RBAC จะกลา วถึงในหััวข้้อถัดไป็
b. ป็ระเด็นทั้้ต้องพัิจารณา
i. ข้้อมููลมูาในรูป็แบบPDFหัร้อExcelบางกรณ้ทั้ําาใหั้ต้องใช้้การKey-inเข้้าสำูระบบ(เหัมู้อนกับระบบป็ัจจุบันข้อง
สำนพั.)
ii. ข้อ้ มูลู มูาไมูสำ มูําาเสำมูอ หัรอ้ บางครงั ไมูมู ข้้ อ้ มูลู โดยเมูอ้ ถงึ วนั ทั้้ 12 ข้องทั้กุ เดอ้ นจะตอ้ งใช้ก้ ารป็ระมูาณการ โดยเมูอ้
ข้้อมููลมูาถึง ซึ่อฟต์แวร์ทั้้พััฒนาจะทั้ําาการป็ระมูาณ ข้อง Missing value การข้จัด Outlier โดยซึ่อฟต์แวร์จะดําาเนินการตามู ข้อ้ กําาหันด เช้น การสำรา้ งเครอ้ งมูอ้ ทั้างสำถติ เิ บอ้ งตน้ และซึ่อฟตแ์ วรด์ งั กลา วจะสำรา้ งเอกสำารการตดิ ตามูและสำถานะข้องข้อ้ มูลู ทั้ไ้ ด้ ป็ระมูาณการหัร้อ Outlier แบบอัตโนมูัติ
3. Transform
a. ระบบงานในระยะทั้้ 1
i. นําาข้อ้ มูลู จากฐานข้อ้ มูลู ป็จั จบุ นั และข้อ้ มูลู จากฐานข้อ้ มูลู ใหัมูมู ารวบรวมู(Aggregate)เพัอ้ จดั ทั้ําารายงานในแงมู มูุ ตาง ๆ เพัิมูเติมูตามูความูต้องการ
ii. พััฒนา Data Model ใน Data Warehouse เพัิมูเติมู เพั้อสำามูารถนาํา ข้้อมููล จากฐานข้้อมููลเดมูิ และฐานข้้อมููล ใหัมูมูาจัดสำร้าง Dashboard หัรอ้ รายงาน ซึ่ึงมู้มูติ ิและมูุมูมูองตา ง ๆ ตามู Use Case ทั้ศึ้ ูนย์ฯ หัร้อ สำนพั. ต้องการ
iii. ข้้อมููลเพั้อการจัดทั้ําา PowerPoint บางสำวนสำามูารถจัดสำร้างแบบอัตโนมูัติ โดยสำามูารถนําา Dashboard หัร้อ รายงานจากระบบ Data Warehouse มูาใช้ป็้ ระกอบ เพั้อลดภาระบางสำวนบางข้ันตอนข้องการจัดทั้าํา PowerPoint
iv. จดั ทั้ําาการเข้า้ ถงึ ข้อ้ มูลู ภายใน (Internal Access Control) โดยใช้ร้ ป็ู แบบ Role-Based Access Control (RBAC) เพั้อกําาหันดสำิทั้ธิ (Authorization) ใหั้กับผู้รับผิดช้อบในศึูนย์ฯ หัร้อหันวยงานข้อง สำนพั. โดยรายละเอ้ยดเทั้คโนโลย้ RBAC จะกลาวถึงในหััวข้้อถัดไป็
b. ป็ระเด็นทั้้เกิดข้ึน
การออกรายงานมู้ความูย้ดหัยุนเพัิมูข้ึนและตรงตามูจุดป็ระสำงค์ทั้้ต้องการข้องศึูนย์และจาก สำนพั. แตเมู้อมู้รายงานใหัมู ๆ หัร้อต้องการรายงานในมูิติอ้น ๆ ยังคงต้องอาศึัย การพััฒนาระบบเพัิมูเติมู
Strategic Design and Development Study of the National Energy Information Center to Support National Energy Plan โครงการศึกษาการจัดทําาแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์สารสนเทศพลังงานแห่งชาติ เพื่อรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data) ในการขับเคล่ือนแผนพลังงานของประเทศไทย