Covering Disruptive Technology Powering Business in The Digital Age

image
NVIDIA และ Cloudera ได้ร่วมกันหารือผ่านการบรรยายสรุปเสมือนจริง ในการเป็นพันธมิตรสำหรับการทำแพลตฟอร์มข้อมูล
image
สิงหาคม 6, 2021 ข่าว

 

เขียนโดย: Martin Dale Bolima นักข่าวของ AOPG

ในการบรรยายสรุปเสมือนจริงผ่านสื่อที่จัดขึ้นในสัปดาห์นี้, ผู้บริหารจาก NVIDIA, ซึ่งเป็นผู้คิดค้นหน่วยประมวลผลกราฟิก(GPU) และ Cloudera ผู้นำด้านข้อมูลคลาวด์ในองค์กร ได้พูดคุยรายละเอียดปลีกย่อยเกี่ยวกับการเป็นพันธมิตรเมื่อเร็วๆนี้ ซึ่งทั้งสองบริษัทยักษ์ใหญ่ด้านเทคโนโลยีได้ร่วมมือกันเพื่อปรับปรุงเวิร์กโฟลว์ข้อมูล เมื่อวิศวกรข้อมูลถูกโจมตีด้วยชุดข้อมูลขนาดใหญ่เป็นประจำและมีความท้าทายทางธุรกิจที่แตกต่างกัน โดยการทำงานร่วมกันในครั้งนี้จะเห็นได้ว่า RAPIDS Accelerator รุ่นบุกเบิกของ NVIDIA ที่สร้างขึ้นมาสำหรับ Apache Spark 3.0 ได้ถูกรวมเข้ากับ Cloudera Data Platform (CDP) เพื่อให้มั่นใจในความชาญฉลาด, รวดเร็ว และการวิเคราะห์เชิงลึกแม้ว่าปริมาณข้อมูลและความเร็วจะเพิ่มขึ้นเรื่อยๆ

คุณ Scott McClellan ผู้อำนวยการอาวุโสฝ่าย Data Science Product Group ของ NVIDIA และ คุณ Sushiil Thomas รองประธานฝ่าย Machine Learning ของ Cloudera ได้หยิบยกประเด็นในการบรรยายสรุปในครั้งนี้  ซึ่งคุณ McClellan เริ่มต้นด้วยการให้รายละเอียดของการลงทุนในศูนย์ข้อมูลองค์กรของ NVIDIA และและเหตุใดจึงร่วมมือกับ Cloudera ตั้งแต่แรก

คุณ McClellan ได้เน้นย้ำเกี่ยวกับปัญญาประดิษฐ์(AI) และ machine-learning(ML) ว่าได้ผลักดันความต้องการโครงสร้างพื้นฐานของศูนย์ข้อมูลที่เร่งความเร็วและวิธีการที่พันธมิตร NVIDIA-Cloudera สามารถแก้ไขปัญหาวิทยาศาสตร์ข้อมูลที่พบบ่อยที่สุดสามปัญหา ที่องค์กรพบมีดังนี้:

  • โมเดลในการเติบโต, การสร้าง, การฝึกอบรม, และการทำซ้ำนั้นใช้เวลานานมาก
  • โครงสร้างพื้นฐาน CPU ที่มีขนาดใหญ่จะมีราคาสูงมาก
  • การดำเนินการประมวลผลข้อมูลอย่างครอบคลุมอาจเป็นเรื่องยากอย่างเหลือเชื่อ

โดยเฉพาะอย่างยิ่ง CDP ที่เพิ่มประสิทธิภาพด้วย GPU แบบโอเพนซอร์สนี้จะช่วยให้องค์กรต่างๆ ได้ใช้ AI และ ML เพื่อเร่งการรวบรวมและประมวลผลข้อมูล รวมทั้งวิเคราะห์ข้อมูลโดยอัตโนมัติ ผ่านการฝึกอบรมโมเดล AI และ ML  ซึ่งเทคโนโลยีต่าง ๆ เหล่านี้ช่วยทำให้ประสิทธิภาพ CDPs ที่เร่งด้วย GPU ทำงานได้เร็วกว่าระบบเดิมถึง 10 เท่า และเร็วกว่าเซิร์ฟเวอร์ที่ใช้ CPU ประมาณ 5 เท่า

และที่สำคัญไม่แพ้กันคือ องค์กรที่ต้องการปรับใช้ระบบนี้ไม่จำเป็นต้องกังวลเกี่ยวกับการเพิ่มประสิทธิภาพของ data pipeline ที่ใช้ในปัจจุบัน เนื่องจาก Apache Spark ได้ทำงานร่วมกับ CDP อย่างราบรื่น ซึ่งในปัจจุบันมีลูกค้ามากกว่า 2,000 ราย, คู่ค้าประมาณ 4,000 ราย, เซิร์ฟเวอร์ CPU ศูนย์ข้อมูลประมาณ 400,000 เซิร์ฟเวอร์ และข้อมูล 5 เอ็กซาไบต์

คุณ Thomas จาก Cloudera ได้อธิบายว่า “สิ่งที่ลูกค้าสามารถทำได้คือเพิ่มแร็คของเซิร์ฟเวอร์ GPU ในกลุ่ม คลัสเตอร์ ของ Cloudera ที่มีอยู่ และเราจะดูแลส่วนที่เหลือเอง” “ปริมาณงานใด ๆ ของ Spark sequel และปริมาณงานเฟรมข้อมูลของ Spark ที่ในตอนนี้สามารถใช้ประโยชน์จาก GPU ได้ จะสามารถใช้งานได้โดยไม่ต้องเปลี่ยนแปลงแอปพลิเคชันใด ๆ”

ผลลัพธ์ที่ได้จากการอ้างอิงของคุณ Thomas นั้น เป็นโซลูชันที่มีการปรับให้เหมาะสมที่สุดสำหรับองค์กรสมัยใหม่ที่สามารถปรับปรุงความแม่นยำของแบบจำลองและสามารถเรียกการทำซ้ำได้มากขึ้นและรับประกันการเร่งแบบเต็ม stack นอกจากนี้ยังได้รับการสนับสนุนอย่างเต็มที่จาก NVIDIA และ Cloudera ซึ่งหมายความว่า “สามารถใช้สำหรับปริมาณงานในการผลิตในปริมาณมากได้”

ถึงแม้ว่าลูกค้าจะไม่จำเป็นต้องปรับเปลี่ยนแพลตฟอร์มที่มีอยู่แล้ว แต่คุณ McClellan ได้ตั้งข้อสังเกตว่ายังสามารถเพิ่มประสิทธิภาพได้อีก และการทำเช่นนี้จะทำให้เพิ่มโอกาสความเป็นไปได้ในการแก้ปัญหาทางธุรกิจที่อาจเกิดขึ้นในอนาคต

คุณ Thomas กล่าวเสริมอีกว่า “เพียงแค่การรวมบิตที่ถูกต้องเข้ากับ CDP ไม่ว่าคุณจะใช้ Spark sequels หรือเฟรมข้อมูลของ Spark เพื่อการเข้าถึงข้อมูล โดยไม่มีการเปลี่ยนแปลงแอปพลิเคชัน คุณก็จะเห็นประสิทธิภาพที่เพิ่มขึ้นได้ในทันที”

คุณ McClellan และคุณ Thomas ยังได้กล่าวถึงเรื่องราวความสำเร็จของ United States Internal Revenue Service (IRS) เพื่อเน้นย้ำถึงข้อดีของ CDP ที่ได้รับพัฒนาโดย NVIDIA  ซี่งคุณ Thomas ยังได้ยกคำพูดของ คุณ Joe Ansaldi ซึ่งเป็นหัวหน้าฝ่ายเทคนิคของแผนกการวิเคราะห์ประยุกต์และสถิติของ IRS โดยได้ระบุถึงหน่วยงานว่า “ได้เห็นถึงการปรับปรุงความเร็วมากกว่า 10 เท่าโดยมีค่าใช้จ่ายเพียงครึ่งเดียว” สำหรับเวิร์กโฟลว์ด้านวิศวกรรมข้อมูลและวิทยาศาสตร์ข้อมูลตั้งแต่เริ่มมีการทำงานร่วมกันของ NVIDIA-Cloudera ในเดือนเมษายน

อย่างไรก็ตาม CDP ที่เร่งด้วย GPU นั้นได้ถูกตั้งค่าเพื่อให้บริการบนระบบคลาวด์ส่วนตัวเท่านั้น แต่คุณ Thomas ได้ยืนยันกับสื่อว่า “การปรับใช้และการสนับสนุนระบบคลาวด์สาธารณะกำลังจะเกิดขึ้นในเร็วๆ นี้เช่นกัน”

(0)(0)