Page 677 - NEIC_FINAL REPORT
P. 677

โครงการศึกษาการจัดทําแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์
สารสนเทศพลังงานแห่งชาติเพ่ือรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data)
โครงการศึกษาการจัดทําแผนยุทธศาสตร์และออกแบบการพัฒนาศูนย์ ในการขับเคล่ือนแผนพลังงานของประเทศไทย
สารสนเทศพลังงานแห่งชาติเพ่ือรองรับการใช้ข้อมูลขนาดใหญ่ (Big Data) ในการขับเคล่ือนแผนพลังงานของประเทศไทย
c. โซนข้อมูลท่ีเช่ือถือได้(TrustedZone)
โซนข้อมูลที่เชื่อถือได้จะรองรับข้อมูลที่ผ่านการทําความสะอาดข้อมูล (Data Cleansing) c. โซนข้อมูลท่ีเชื่อถือได้(TrustedZone)
และผ่านการทวนสอบ (Data Validation) เป็นที่เรียบร้อยแล้ว เช่นเดียวกันกับข้อมูลในโซนข้อมูลดิบ กล่าวคือ โซนข้อมูลที่เชื่อถือได้จะรองรับข้อมูลที่ผ่านการทําความสะอาดข้อมูล (Data Cleansing)
ข้อมูลในโซนนี้จะถูกเก็บไว้ในฐานข้อมูลหลักใน Security Domain :Data Center เช่นกัน แต่จะถูกเก็บแยก และผ่านการทวนสอบ (Data Validation) เป็นที่เรียบร้อยแล้ว เช่นเดียวกันกับข้อมูลในโซนข้อมูลดิบ กล่าวคือ
Instance หรือ Database เอาไว้
ข้อมูลในโซนนี้จะถูกเก็บไว้ในฐานข้อมูลหลักใน Security Domain :Data Center เช่นกัน แต่จะถูกเก็บแยก
Instance หรือ Database เอาไว้
d. โซนข้อมูลพร้อมใช้งาน(RefinedZone)
โซนข้อมูลพร้อมใช้งานจะรองรับข้อมูลที่ได้ผ่านการตรวจสอบและประมวลผลข้อมูล d. โซนข้อมูลพร้อมใช้งาน(RefinedZone)
ซึ่งข้อมูลที่อยู่อยู่ในโซนนี้จะอยู่ในรปู แบบพร้อมใช้งานสําหรับนักวิเคราะห์ข้อมูลเจ้าพนักงานที่เกี่ยวข้องรวมไปถึง โซนข้อมูลพร้อมใช้งานจะรองรับข้อมูลที่ได้ผ่านการตรวจสอบและประมวลผลข้อมูล
โปรแกรม Application ต่าง ๆ ก็สามารถหยิบข้อมูลในส่วนน้ีไปใช้งานได้ทันที ซึ่งการเก็บข้อมูลในโซนน้ี อาจจะเก็บ ซึ่งข้อมูลที่อยู่อยู่ในโซนนี้จะอยู่ในรปู แบบพร้อมใช้งานสําหรับนักวิเคราะห์ข้อมูลเจ้าพนักงานที่เกี่ยวข้องรวมไปถึง
ได้ทั้งใน Security Domain : Processing Farm และ Security Domain : External Services ขึ้นอยู่กับการ โปรแกรม Application ต่าง ๆ ก็สามารถหยิบข้อมูลในส่วนน้ีไปใช้งานได้ทันที ซึ่งการเก็บข้อมูลในโซนน้ี อาจจะเก็บ
ให้บริการ ซึ่งทั้งสอง Security Domain จะมี Read Scale Out SQL Server ที่จะรับข้อมูลจากฐานข้อมูลหลัก ได้ทั้งใน Security Domain : Processing Farm และ Security Domain : External Services ขึ้นอยู่กับการ
ผ่านทาง Pub/Sub Replication
ให้บริการ ซึ่งทั้งสอง Security Domain จะมี Read Scale Out SQL Server ที่จะรับข้อมูลจากฐานข้อมูลหลัก
ผ่านทาง Pub/Sub Replication
e. โซนตัวอย่างข้อมูล(SandboxZone)
โซนตัวอย่างข้อมูล (Sandbox Zone) หรือที่รู้จักกันอีกชื่อคือ Exploration Zone e. โซนตัวอย่างข้อมูล(SandboxZone)
ซึ่งรองรับข้อมูลเพื่อพร้อมใช้งานสําหรับการวิเคราะห์ข้อมูลและออกรายงานแบบเฉพาะเจาะจง (Adhoc Analysis โซนตัวอย่างข้อมูล (Sandbox Zone) หรือที่รู้จักกันอีกชื่อคือ Exploration Zone
and Reporting) โดยข้อมูลท่ีเข้ามาอยู่ในโซนตัวอย่างข้อมูลนี้อาจจะมาจากข้อมูลในโซนอื่น ๆ ใน Data Lake ได้ ไม่ ซึ่งรองรับข้อมูลเพื่อพร้อมใช้งานสําหรับการวิเคราะห์ข้อมูลและออกรายงานแบบเฉพาะเจาะจง (Adhoc Analysis
ว่าจะเป็น โชนข้อมูลชั่วคราว โซนข้อมูลดิบ โซนข้อมูลที่เชื่อถือได้ หรือโซนข้อมูลพร้อมใช้งาน ก็เป็นได้
and Reporting) โดยข้อมูลที่เข้ามาอยู่ในโซนตัวอย่างข้อมูลนี้อาจจะมาจากข้อมูลในโซนอื่น ๆ ใน Data Lake ได้ ไม่
ว่าจะเป็น โชนข้อมูลชั่วคราว โซนข้อมูลดิบ โซนข้อมูลที่เชื่อถือได้ หรือโซนข้อมูลพร้อมใช้งาน ก็เป็นได้ หลังจากสร้างและเข้าใจโซนข้อมูลใน Data Lake เป็นที่เรียบร้อยแล้ว จะเห็นว่าในกระบวนการ
ทํางานจริง ข้อมูลจะสามารถย้ายจากโซนหนึ่งไปอีกโซนหนึ่งได้
หลังจากสร้างและเข้าใจโซนข้อมูลใน Data Lake เป็นที่เรียบร้อยแล้ว จะเห็นว่าในกระบวนการ
ทรําูปิงที่าน่ 5จ.ร3ิง-1ข5้อคมวูลาจมูะเสชา่อมมูาโรยถงยข้้าอยงจโาซกนโข้ซ้อนมูหูลนใึ่งนไปDอaีกtโaซนLaหkนeึ่งได้
รูปท่ี 5.3-15 ความเชื่อมโยงของโซนข้อมูลใน Data Lake รูปที่ 5.3-15 ความเช่ือมโยงของโซนข้อมูลใน Data Lake
รายงานฉบับสมบูรณ์ รายงานฉบับสมบูรณ์
  5.3-42 5.3-42
Final Report
รายงานฉบับสมบูรณ์
5 - 73
  






























































   675   676   677   678   679