Data Science กับการเปลี่ยนข้อมูลให้เป็นมูลค่าบน Cloud Server

Data Science กับการเปลี่ยนข้อมูลให้เป็นมูลค่าบน Cloud Server

data science

‘Data Science’ หรือ ‘วิทยาศาสตร์ข้อมูล’ เป็นวิธีการที่ใช้รวบรวมข้อมูลเชิงลึกจากทั้ง ข้อมูลที่มีโครงสร้าง และข้อมูลที่ไม่มีโครงสร้าง ที่มีอยู่ภายในฐานข้อมูลของบริษัท โดยนำข้อมูลมาวิเคราะห์สถิติ ไปจนถึงกระบวนการ Machine Learning บน Cloud Server ซึ่งในองค์กรส่วนใหญ่แล้ว ‘Data Scientist’ หรือ ‘นักวิทยาศาสตร์ข้อมูล’ นั้น ทำงานเพื่อเปลี่ยนข้อมูลให้เป็นมูลค่า เพื่อเพิ่มรายได้ พร้อมๆ กับลดต้นทุน เพิ่มความไหลลื่นทางธุรกิจ และช่วยปรับปรุงประสบการณ์ของลูกค้าผ่านการทำงานบน Cloud Server นั่นเอง

Data Scientist ทำงานอย่างไร?

หลายๆ องค์กรที่ให้ความสนใจกับเทคโนโลยี ‘Big Data’ แน่นอนว่าต้องมีคนที่เข้ามาจัดการนั่นคือ ‘นักวิทยาศาสตร์ข้อมูล’ หรือ ‘Data Scientist’ ซึ่งต้องทำหน้าที่ควบคู่กับการทำงานของอีก 2 ฝ่าย คือ ‘Data Analyst’ และ ‘Data engineers’ โดยทั้ง 3 ฝ่ายมีหน้าที่ในการจัดการข้อมูล ดังนี้

– Data Scientist คือ ออกแบบโมเดลจากข้อมูล เพื่อหาช่องทางใหม่ๆ ให้องค์กร

– Data Analyst คือ วิเคราะห์และออกแบบการนำเสนอข้อมูล เพื่อแก้ไขปัญหาส่งต่างๆ ในองค์กร

– Data Engineers คือ ออกแบบช่องทางของข้อมูล วิธีการจัดเก็บ และการใช้งาน

Data Scientist vs. Data Analyst

ทั้งสองหน้าที่จะทำหน้าที่ใกล้ชิดกัน โดยที่นักวิเคราะห์ข้อมูล (Data Analyst) จะอยู่ใต้วิทยาศาสตร์ข้อมูลอีกทีหนึ่ง และทั้งสองต้องเข้าใจตรงกันว่าข้อมูลขององค์กรนั้นเป็นอย่างไร ซึ่งนักวิทยาศาสตร์ข้อมูล (Data Scientist) ก็จะดึงผลลัพธ์จากนักวิเคราะห์ข้อมูล (Data Analyst) มาเพื่อทำการแก้ปัญหาอีกต่อหนึ่งนั่นเอง

Data Science vs. Big Data

ทั้งวิทยาศาตร์ข้อมูล (Data Science) และ Big Data ล้วนเป็นของคู่กัน แต่วิทยาศาสตร์ข้อมูล (Data Science) นั้นใช้เพื่อดึงมูลค่าจากข้อมูลทุกๆ ขนาด ไม่ว่าจะเป็นข้อมูลที่มีโครงสร้าง ไม่มีโครงสร้าง หรือกึ่งมีโครงสร้าง ซึ่ง Big Data นั้น มีประโยชน์แก่นักวิทยาศาสตร์ข้อมูล (Data Science) ในหลายเหตุการณ์มากๆ เพราะว่า ยิ่งมีข้อมูลมากเท่าไหร่ ก็ยิ่งรวมพารามิเตอร์เข้ารูปแบบที่กำหนดไว้ได้มากเท่านั้น

Data Scientist teams

วิทยาศาสตร์ข้อมูล (Data Science) เป็นงานที่ต้องการทีมที่มีความเป็นระเบียบ ซึ่งนักวิทยาศาสตร์ข้อมูล (Data Scientist) ถือเป็นแกนหลักของทีมวิทยาศาตร์ข้อมูล ที่จะทำให้เดินหน้าจากข้อมูลไปยังการวิเคราะห์ และจากนั้นก็ทำการเปลี่ยนข้อมูลที่วิเคราะห์ ไปยังส่วนการผลิตที่เพิ่มมูลค่า ซึ่งต้องอาศัยสกิลและบทบาทหนักมาก  ตัวอย่างเช่น นักวิเคราะห์ข้อมูล (Data Analyst) ควรจะเข้ามาช่วยตรวจสอบข้อมูล ก่อนที่จะทำการนำเสนอให้กับทีม และพยายามรักษารูปแบบข้อมูลไว้ให้เหมือนเดิม ส่วนนักวิศวกรรมข้อมูล (Data engineer) เป็นหน่วยงานที่จำเป็นต่อการสร้างท่อลำเลียงข้อมูล เพื่อทำการตกแต่งเซ็ตข้อมูล ให้สามารถใช้กับส่วนอื่นๆ ของบริษัทได้

องค์ประกอบในการทำ วิทยาศาสตร์ข้อมูล (Data Science)

  1. Data Processing & cleaning
    ขั้นตอนการจัดแบ่งและจัดเตรียมข้อมูลโดยรวม ด้วยการจัดการกับชนิดของชุดข้อมูลที่ไม่เหมือนกัน และนำไปสู่การวิเคราะห์หรือการสร้างแบบจำลองในที่สุด
  2. Analysis & Modelling
    การวิเคราะห์และทำความเข้าใจกับข้อมูลอย่างลึกซึ้ง ในแง่ของสถิติและคณิตศาสตร์ เพื่อสร้างและใช้โมเดล Machine Learning เชิงวิเคราะห์หรือทำนายที่หลากหลาย
  3. Programming languages
    วิทยาศาสตร์ข้อมูลต้องการการทดสอบหลายรูปแบบและการปรับให้เหมาะสม พร้อมกับการสร้างภาพข้อมูล เพื่อดึงข้อมูลเชิงลึกที่ถูกต้องทำการอนุมานทำนายหรือการตัดสินใจ
  4. การจัดการข้อมูล
    อัลกอริธึมและการผลิตขององค์กรต้องมีสภาพแวดล้อมที่เหมาะสม เพื่อจัดเก็บข้อมูลโดยการระบุค่าเครื่องที่เหมาะสม และให้ระบบสามารถทำงานในสคริปต์ที่กำหนดไว้
  5. รูปแบบการตรวจสอบและความรู้เกี่ยวกับโดเมน
    การจัดรูปแบบข้อมูล โดยมองหารูปแบบและสำรองข้อมูลจากการวิเคราะห์และตรวจสอบทุกขั้นตอน เพื่อให้เหมาะสมกับความต้องการของอุตสาหกรรม สิ่งนี้เป็นทักษะที่สำคัญของ นักวิทยาศาสตร์ข้อมูล (Data Scientist)
  6. Communication & Visualisation
    การสื่อสารเป็นทักษะที่สำคัญสำหรับ นักวิทยาศาสตร์ข้อมูล (Data Scientist) ในการสื่อสารแบบจำลองหรือการคาดการณ์ที่พวกสร้างขึ้นมา กับฝ่ายงานที่เกี่ยวของ เพื่อบรรลุเป้าหมายที่วางเอาไว้
  7. Open Source Community
    วิทยาศาสตร์ข้อมูล (Data Science) มักจะสร้างขึ้นด้วยเครื่องมือ Open Source ฉะนั้นการเรียนรู้และทำความรู้จักการทำงานของระบบเหล่านี้ เพื่อสนับสนุนการทำงานของระบบ

ความน่าสนใจของวิทยาศาสตร์ข้อมูล (Data Science)

ความน่าสนใจของวิทยาศาสตร์ข้อมูล (Data Science) ขึ้นอยู่กับความจำเป็นขององค์กรนั้นๆ วิทยาศาสตร์ข้อมูลอาจช่วยองค์กรสร้างเครื่องมือต่างๆ ที่ไว้ใช้ทำนายความล้มเหลวของฮาร์ดแวร์ หรือช่วยให้องค์กรสามารถบำรุงรักษาและป้องกันการ Downtime ที่ไม่ได้วางแผนไว้ได้ และยังสามารถช่วยคาดการณ์ได้ว่าเราควรวางผลิตภัณฑ์ ไว้บนเชลฟ์ของห้าง หรือคาดได้ว่า ด้วยรูปลักษณ์และลักษณะของผลิตภัณฑ์นั้น จะมีความนิยมเป็นอย่างไร เป็นต้น

วิทยาศาสตร์ข้อมูล (Data Science) กำลังเปลี่ยนแปลงโฉมหน้าของอุตสาหกรรมต่างๆ อย่างรวดเร็วด้วยนวัตกรรมข้อมูลกลายเป็นฟังก์ชันหลักขององค์กร เช่น การขาย, การตลาด หรือ การออกแบบผลิตภัณฑ์ก็ตาม ในปัจจุบันล้วนต้องใช้ วิทยาศาสตร์ข้อมูล (Data Science) ในการทำงานทั้งสิ้น

ข้อมูลจาก Gemalto ระบุว่า ดัชนีความเชื่อมั่นด้านความปลอดภัยของข้อมูล ในปี 2018 พบว่า 89% ขององค์กรสามารถใช้งาน วิทยาศาสตร์ข้อมูล (Data Science) เพื่อให้เกิดความได้เปรียบในการแข่งขันทางธุรกิจ

สำหรับองค์กรที่สนใจการทำ ‘Big Data’ สร้างช่องทางระบบการจัดการแหล่งเก็บข้อมูลดิบ (Raw data) ไว้ใน ทะเลสาบข้อมูล (Data Lake) รวมถึง โซลูชันการจัดการแหล่งเก็บข้อมูลใหม่ตามโครงสร้าง ที่เรียกว่า โกดังข้อมูล (Data Warehouse) เพื่อสร้างระบบสำหรับสกัดข้อมูล (Extract) ปรับแต่งโครงสร้างข้อมูล (Transform) และนำไปจัดเก็บ (Load) หรือ ETL จาก Data lake เข้าสู่ Data warehouse

 

เริ่มพัฒนาโซลูชัน ‘Big Data’ กับ Nipa.Cloud ได้เลยวันนี้!

สอบถามเพิ่มเติมได้ที่

LINE : @NipaCloud

Website: https://www.nipa.cloud/

Facebook: https://www.facebook.com/nipacloud/

Inbox: https://www.messenger.com/t/nipacloud

Email: sales@nipa.cloud

Call: 02-107-8251 ต่อ 444

Cloud Computing

Cloud Computing เป็นบริการ หน่วยจัดเก็บข้อมูล และระบบออนไลน์ต่างๆ แบ่งออกเป็น 3 ประเภท ได้แก่ Private, Public, และ Hybrid ถ้าอยากรู้ว่าแบบไหนที่น่าใช้ อันดับแรกต้องดูที่ระดับของความปลอดภัย และฟังก์ชั่นที่ตรงตามความต้องการ ประกอบด้วยลักษณะของ Data ที่จะนำไปใช้ร่วมกับ Cloud นั่นเอง

Public Clouds

Public Cloud คือ รูปแบบการให้บริการ Service และ Infrastructure ผ่านอินเทอร์เน็ต ไม่มีการติดตั้งใด ๆ ในพื้นที่ของผู้ใช้งาน โดยระบบนี้เป็น Cloud ที่มีประสิทธิภาพสูงสุดในการแชร์ทรัพยากร แต่ก็มีข้อด้อยในเรื่องของระบบความปลอดภัยหากเทียบกับ Private Cloud

Public Cloud จะเป็นตัวเลือกที่ดีที่สุดเมื่อ:

  1. Workload มาตรฐานสำหรับ Application ถูกใช้โดยคนจำนวนมาก เช่น E-mail
  2. ต้องการทดสอบและพัฒนา Application Code
  3. มี SaaS (Software as a Service) จากผู้ให้บริการที่เตรียมระบบรักษาความปลอดภัยและแผนการรับมือมาเป็นอย่างดี
  4. ต้องการความสามารถเพื่อรองรับ Workload ที่เพิ่มขึ้นอย่างมากในช่วง Peak Time
  5. มีโครงการหรืองานที่ต้องทำร่วมกับผู้อื่น
  6. ต้องการทำ ad-hoc software development project โดยใช้ PaaS (Platform as a Service) ผ่านทางระบบ Cloud

ข้อควรจำ: ผู้ดำรงตำแหน่งสูงในฝ่าย IT หลายคนกังวลเรื่องความปลอดภัยและความน่าเชื่อถือของ Public Cloud จึงต้องใช้เวลาพิจารณาศึกษาให้มั่นใจก่อนว่าระบบถูกออกแบบมาดี เพื่อป้องกันหรือรับมือได้เมื่อเกิดปัญหา นอกจากนี้การประหยัดงบประมาณในระยะสั้นอาจจะส่งผลเสียในระยะยาวได้

Private Clouds

Private Cloud คือ รูปแบบการให้บริการ Service และ Infrastructure ทั้งหมดจะอยู่ใน Private Network ส่วนตัวของแต่ละบริษัท ระบบนี้มีความโดดเด่นด้านระบบรักษาความปลอดภัยและการควบคุม ซึ่งมีค่าบำรุงรักษา การจัดซื้อ การซ่อมแซม Infrastructure และ Software ทั้งหมดที่ผู้ใช้บริการต้องจ่าย

Private Cloud จะเป็นตัวเลือกที่ดีที่สุดเมื่อ:

  1. มีการทำงานเกี่ยวกับ Data และ Application สำคัญ ซึ่งจะต้องมีความปลอดภัยและการควบคุมการเข้าถึงมาเป็นอันดับแรก
  2. มีการทำธุรกิจที่ใส่ใจเรื่องความปลอดภัยและความเป็นส่วนตัวของข้อมูลเป็นพิเศษ
  3. บริษัทหรือองค์กรมีขนาดใหญ่มากพอที่จะรัน Cloud Data Center อย่างมีประสิทธิภาพได้ด้วยตัวเอง

ข้อควรจำ: เส้นแบ่งระหว่าง Private และ Public Cloud เริ่มจะไม่ค่อยชัดเจน เพราะว่าตอนนี้บางผู้ให้บริการ Public Cloud เริ่มมีบริการเสริมเป็น Private เวอร์ชั่นของ Public Cloud ขึ้นมา และผู้ให้บริการ Private Cloud บางรายก็มีบริการ Public เวอร์ชั่น ที่มีความสามารถไม่ต่างกับ Private Cloud ออกมาเช่นกัน

Hybrid Clouds

Hybrid Cloud เป็นรูปแบบที่ผสมความสามารถของ Public Clouds และ Private Clouds ซึ่งการเลือกใช้ Hybrid Cloud นั้นได้นำความสามารถของ Cloud แต่ละแบบมาใช้ให้เกิดประโยชน์สูงสุดกับธุรกิจแยกเป็นแต่ละส่วนได้ แต่ข้อเสียก็คือ ผู้ใช้บริการต้องคอยตรวจเช็คการทำงานของ Security Platform ที่แตกต่างกัน เพื่อให้แต่ละส่วนสามารถทำงานร่วมกันได้อย่างราบรื่น

Hybrid Cloud จะเป็นตัวเลือกที่ดีที่สุดเมื่อ:

  1. ต้องการใช้ Application แบบ SaaS แต่ต้องการเรื่องความปลอดภัย ดังนั้นผู้ให้บริการ SaaS จึงสร้าง Private Cloud ขึ้นมาภายใต้ Firewall ของทางผู้ให้บริการ โดยผู้ใช้งานจะได้รับ VPN (Virtual Private Network) มาเป็นตัวเสริมความปลอดภัย
  2. เป็นธุรกิจที่ให้บริการในระบบตลาดแบบแนวตั้ง (Vertical Market) ซึ่งประกอบด้วยลูกค้าหลากหลายและเป็นอิสระแยกจากกัน จึงใช้ Public Cloud เพื่อติดต่อกับลูกค้า แต่เก็บข้อมูลของลูกค้าแต่ละรายไว้อย่างปลอดภัยภายใน Private Cloud

ข้อควรจำ: ระบบการจัดการ Cloud Computing จะมีความซับซ้อนสูงขึ้นมาทันที เมื่อต้องจัดการทั้ง Public Cloud, Private Cloud, และ Data Center ภายในไปพร้อมๆ กัน ดังนั้นในการจัดการ Hybrid Cloud จึงจำเป็นต้องมีการเพิ่มความสามารถสำหรับจัดการและจัดกลุ่มการทำงานร่วมของสภาพแวดล้อมที่ต่างกันพวกนี้

ตัวเลือกของ Cloud Computing ที่มีมาให้เลือกอย่างหลากหลายแบบนี้ เมื่อเปรียบเทียบข้อแตกต่างทั้งหมดของทั้ง 3 แบบข้างต้นแล้ว ต่อไปก็เป็นหน้าที่ของผู้ประกอบการว่าจะใช้ Cloud Computing แบบไหนให้เหมาะกับธุรกิจของตนมากที่สุด เพื่อให้เกิดประโยชน์อันสูงสุดและผลลัพธ์ที่ดีกับองค์กร

Cloud Computing เบื้องต้น

ปัจจุบันนี้เทคโนโลยี Cloud Computing ได้รับความนิยมเพิ่มขึ้นเรื่อยๆ โดยเฉพาะกับผู้ประกอบธุรกิจที่ได้นำแพลตฟอร์มต่างๆ ของ Cloud Computing นำมาสร้างรายได้ให้กับบริษัทหรือหน่วยงานของตนเอง และวันนี้เราจะพาไปทำความรู้จัก Cloud Computing ให้ลึกซึ้งยิ่งขึ้น จากศัพท์ที่พบได้ทั่วไปในวงการ Cloud

 

Hybrid Cloud คืออะไร?

Hybrid Cloud คือ ระบบ Infrastructure ใดๆ ก็ตามที่มีการรวมเอาการทำงานของ Private Cloud และ Public Cloud เข้าไว้ด้วยกัน โดย Cloud ทั้ง 2 โมเดลจะร่วมกันจัดการด้าน Provisioning, Resource, และ Service ต่างๆ ให้เหมาะสมกับผู้เช่าใช้ที่สุด โดย Hybrid Cloud มีความ Flexibility และ Portability สูง สามารถทำงานได้กับหลายระบบปฏิบัติการ ที่สำคัญคือ Solution นี้เหมาะกับธุรกิจที่ต้องการรักษาความปลอดภัยของข้อมูล เนื่องจากมีการทำงานด้วยระบบ Encrypted Technology (เทคโนโลยีการเข้ารหัสข้อมูล)

Digital Transformation คืออะไร?

Digital Transformation คือ การเปลี่ยนแปลงไปสู่สิ่งที่ทันสมัยกว่า ด้วยวิธีการนำเทคโนโลยีใหม่ๆ มาปรับใช้ในองค์กรเพื่อตอบสนองความต้องการของลูกค้าให้ดีขึ้น ซึ่งแนวทางการทำงานขององค์กรจะเปลี่ยนไปตามรูปแบบของ Cloud, Social Network, Mobile Platform และ Big Data ที่นำมาใช้งาน โดยมีลักษณะเป็น Data-Driven มากกว่าเดิม หรือมีแรงผลักดันมาจากข้อมูลนั่นเอง

Cloud-Native Applications คืออะไร?

Cloud-native applications คือ โครงสร้าง Application สมัยใหม่ ที่มีมาตรฐานร่วมกัน โดดเด่นด้านความรวดเร็วในการทำงาน สามารถทำงานได้ในทุก Infrastructure ไม่ยึดติดกับ Cloud แบบใดแบบหนึ่ง และมีประสิทธิภาพการ Scalable สูง คือ สามารถทำการ Scale up และ Scale down ได้อย่างรวดเร็ว

Infrastructure as a Service (IaaS) คืออะไร?

IaaS คือ บริการที่ให้เราเข้าถึงระบบ IT Infrastructure รวมไปถึงพวก Resources ต่างๆ เช่น Storage, Network, และ Compute ที่เราต้องการใช้เพื่อรัน Workload ได้แบบ On-demand สามารถเข้าถึงและเลือกใช้ได้ตามใจชอบ โดยจ่ายค่าบริการราคาไม่แพง อิงตามปริมาณการใช้งานจริงเท่านั้น

Platform as a Service (PaaS) คืออะไร?

PaaS คือ Cloud-Based Environment ที่เราสามารถเช่าใช้งานเพื่อพัฒนา ทดสอบ รัน จัดการหรือปรับแต่ง Application เป็นการบริการสภาพแวดล้อมสำหรับ Development โดยที่เราไม่ต้องวุ่นวายเสียเวลาและเสียเงินไปกับการซื้อ สร้าง ดูแล และจัดการ Infrastructure ซึ่งนอกจากจะประหยัดแล้ว ยังช่วยให้ทำงานได้ง่ายและรวดเร็วขึ้น สามารถเปิดตัว Application ออกสู่ตลาดได้ทันใจ

นี่เป็นเพียงคำศัพท์พื้นฐานน่ารู้ในเบื้องต้นเท่านั้นสำหรับผู้ที่กำลังสนใจเรื่อง Cloud Computing อย่างไรก็ดีจะเห็นได้ว่าบริการ Cloud Computing นำเสนอทางเลือกช่วยประหยัดและช่วยให้ทำงานไวขึ้น สามารถเก็บเกี่ยวกำไรได้อย่างเต็มที่ แถมด้วยค่าเช่าบริการที่ไม่แพง ชวนให้ผู้ประกอบการทั้งหลายต้องนำ Cloud Computing มาปรับใช้กันบ้างเสียแล้ว