Page 627 - NEIC_FINAL REPORT_Appendix
P. 627
ในการเปลี่ยนแปลงทั้งสามด้านนั้น ทําให้ต้องพัฒนาสถาปัตยกรรมทางเทคโนโลยีที่ตอบสนองต่อความ ต้องการวิสัยทัศน์ โดยต้องเน้นให้สอดคล้องกับกฎหมายที่เกี่ยวข้อง รวมถึงโอกาสการขยายระบบในอนาคต ข้อมูล ที่เรารู้ปริมาณแน่นอน ซึ่งเรามองเป็นเชิง Enterprise level กันอยู่ ถ้ามีโอกาสเป็น web scale ต้องขยายระบบ อย่างไร จึงเสนอการออกแบบแบ่งเป็น 2 ส่วน เพราะธรรมชาติของการประมวลผลของงาน 2 ส่วนนั้นต่างกัน อุปกรณ์อาจเหมือนกันได้แต่จะมีการ config ระบบภายในที่ไม่เหมือนกัน
1. ศูนย์ข้อมูลของสนพ.เน้นการประมวลผลและวิเคราะห์ข้อมูลแบบbatchprocessingเป็นการ ประมวลผลเป็นรอบ อาจจะเป็นข้อมูลรายวัน วิเคราะห์เป็นรอบ ๆ ไป ลักษณะเป็นข้อมูลขนาดใหญ่ เพื่อผลิตรรายงาน บทวิเคราะห์ เป็นข้อมูลในเชิงลึก จากข้อมูลที่เก็บไว้ ข้อมูลย้อนหลัง – ตรงน้ี สนพ. ไม่ควรมีการจัดเก็บข้อมูลเองเลย ควรจะแยกเก็บจากอีกศูนย์หน่ึง เน้นการประมวลผลข้อมูลเป็นหลัก ออกแบบเป็น Enterprise
2. ศูนย์ข้อมูลศูนย์สารสนเทศพลังงานชาติรับข้อมูลขาเข้าจัดเก็บและตรวจสอบความถูกต้องของข้อมูล ซึ่งข้อมูลดิบส่วนใหญ่จะอยู่ท่ีศูนย์ฯ ไม่มีการวิเคราะห์ข้อมูลเชิงลึก อาจเป็นเพียงในเชิงสถิติ ทํางานได้แบบ online โหลดภาระงานจะไม่ใหญ่มาก เน้นการจัดเก็บข้อมูล ประมวลผลข้อมูล และเผยแพร่ข้อมูลตรงน้ี ต้องออกแบบให้เป็น web scale สามารถรองรับ load ที่อาจเกิดขึ้นแบบ ad-hoc ได้เหตุที่ต้องแยก 2 ส่วนออกจากกัน เพราะธรรมชาติในการประมวลผลและการเผชิญหน้ากับข้อมูล มีความแตกต่างกัน
ข้อมูลของ สนพ. เป็นข้อมูลแบบ Batch Processing เพื่อเป็นการผลิตข้อมูลแบบรายเดือนหรือรายวัน ระบบควรรันเป็นรายวัน เพื่อรองรับการร้องขอ ของคณะประชุมต่าง ๆ ซึ่งไม่เกินภาระงานในช่วงเวลาสั้นๆ ซึ่งออกแบบเป็น 5 ส่วน คือระบบฐานข้อมูลเดิม ระบบฐานข้อมูลใหม่ และ data warehouse เพื่อจะได้เก็บข้อมูล ที่ใช้ในการวิเคราะห์ ระบบ ETL ที่เชื่อมระหว่างระบบฐานข้อมูลเดิมและฐานข้อมูลใหม่ เพื่อการแปลงข้อมูลที่อยู่ ในรูป Transactional ให้สามารถใช้ในการวิเคราะห์ข้อมูลได้ ระบบวิเคราะห์ข้อมูลแบบ big data ซึ่งข้อมูลอาจจะ ใหญ่กว่าฐานข้อมูลที่จัดเก็บ ค่อนข้างเปลืองทรัพยากรมาก และส่วนของโครงสร้างพื้นฐานทางเครือข่ายและระบบ ความปลอดภัย
ข้อมูลของศูนย์ฯ จะเน้นการทํางานแบบ online processing จะแตกต่างจากการทํางานของ สนพ. ท่ีออกแบบเป็นแบบ web scale ที่มุ่งเน้นต่อความพร้อมในการใช้งาน ทํายังไงก็ได้ไม่ให้ข้อมูลล่ม ข้อมูลไม่เน้นความ ซับซ้อนไม่เน้นการประมวลผล งาน online ที่ไม่สามารถคาดเดาได้ อาจออกแบบให้เป็นรูปแบบไฮบริด ที่เป็นส่วนผสมระหว่าง ตัว server ของศูนย์ฯ กับ ระบบ cloud ขึ้นอยู่กับภาระงานในแต่ละวัน ซึ่งอาจจะมีการ switch งานได้แบบอัตโนมัติ ซึ่งทําการออกแบบออกเป็น 5 ส่วน คือ ระบบฐานข้อมูล และ data warehouse ระบบประมวลผลข้อมูลแบบ big data (อาจเป็น big data streams) ระบบเช่ือมต่อข้อมูลภายนอก ในลักษณะ API Gateway ทั้งขาเข้าและขาออก เพื่อเชื่อมข้อมูล เป็นส่วนที่เพิ่มเข้ามา การประมวลผลข้อมูลเป็นระบบ ETL แบบ online เพื่อประมวลผลแบบขาเข้าเพื่อไปแสดงผลตอนขาออก และข้อมูลที่เป็น transactional (ขบวนการ work process) และโครงสร้างพ้ืนฐานทางเครือข่ายและระบบความปลอดภัย
ที่ปรึกษาได้ออกแบบการสร้างออกเป็น 2 ส่วน ส่วนของ ACDC data center และในส่วนของ Eppo data center และ ระบบ cloud 2 ชุด
14/4/63 - 6