Covering Disruptive Technology Powering Business in The Digital Age

image
ธนาคารทรัพยากรชีวภาพแห่งชาติ เร่งการประมวลผลข้อมูลจีโนม ด้วย NVIDIA DGX A100 และ NVIDIA Clara Parabrick
image
พฤษภาคม 24, 2021 ข่าว

 

NVIDIA ประกาศแผนการติดตั้งระบบ NVIDIA DGX™ A100 และซอฟต์แวร์เร่งความเร็วการประมวลผลข้อมูลจีโนม NVIDIA Clara Parabricks ให้กับธนาคารทรัพยากรชีวภาพแห่งชาติ (NBT— National Biobank of Thailand) เพื่อช่วยเร่งการประมวลผลข้อมูลทั่วจีโนมของประชากรไทยซึ่งเป็นส่วนหนึ่งของแผนปฏิบัติการบูรณาการจีโนมิกส์ประเทศไทยที่รัฐบาลส่งเสริม ให้การแพทย์จีโนมิกส์เป็นบริการสาธารณสุขมาตรฐานของประเทศ

ในปี 2019  ธนาคารทรัพยากรชีวภาพแห่งชาติซึ่งเป็นหนึ่งในหน่วยงานโครงสร้างพื้นฐานด้านวิทยาศาสตร์และเทคโนโลยีภายใต้สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) ได้รับมอบหมายให้ดำเนินการออกแบบและพัฒนาโครงสร้างพื้นฐานด้านไอทีสำหรับโครงการขับเคลื่อนการแพทย์จีโนมิกส์ของประเทศไทย ชื่อว่า “จีโนมิกส์ประเทศไทย หรือ Genomics Thailand (GeTH)” โดยเป้าหมายพัฒนาให้เกิดการรักษาด้วยการแพทย์จีโนมิกส์ในระบบสาธารณสุขของประเทศ โครงการหลักของ GeTH  ที่จะเริ่มดำเนินการก่อนคือการค้นหาความหลากหลายทางพันธุกรรมอ้างอิงประชากรไทยจำนวน 50,000 ราย (50KGeTH)  ซึ่งจะทำการรวบรวมข้อมูลความหลากหลายทางพันธุกรรมและการกลายพันธุ์ซึ่งอาจจะจำเพาะกับประชากรไทย ข้อมูลการกลายพันธุ์เหล่านี้ร่วมกับความถี่ที่พบได้ในประชะการไทยจึงเป็นข้อมูลพันธุกรรมอ้างอิงของประเทศที่ช่วยระบุตำแหน่งการกลายพันธุ์ ที่เป็นสาเหตุของการเกิดโรคได้อย่างมีประสิทธิภาพและจะมีความสำคัญอย่างมากทางการแพทย์และการให้การรักษาพยาบาล นอกเหนือจากนี้ฐานข้อมูล 50KGeTH  มีประโยชน์อย่างมากในการศึกษาวิจัยด้านพันธุศาสตร์ประชากรทำให้เราเข้าใจพื้นฐานของการย้ายถิ่นฐานของประชากรในอดีตที่เข้ามารวมกันเป็นประชากรไทยในป้จจุบัน

ข้อมูลจำนวนมหาศาลที่ต้องประมวลผล 

ความท้าทายด้านการประมวลผลของโครงการ 50KGeTH นี้คือขนาดเริ่มต้นของข้อมูลลำดับพันธุกรรมทั่วจีโนม (WGS)  ที่ได้จากเครื่องถอดรหัสพันธุกรรมนั้นอาจจะใหญ่มากกว่า 100GB และอยู่ในรูปของลำดับเบสสายสั้นมีความซ้ำซ้อนกันจำนวนมาก และเพื่อระบุตำแหน่งของการกลายพันธุ์จะต้องนำข้อมูลสายสั้นเหล่านี้มาเทียบกับข้อมูลลำดับพันธุกรรมอ้างอิงจีโนมของมนุษย์เพื่อระบุตำแหน่งความหลากหลายทางพันธุกรรมของแต่ละบุคคล กระบวนการนี้ส่งผลให้มีข้อมูลเพิ่มขึ้นสองเท่า ~200GB ต่อตัวอย่าง ธรรมชาติของการประมวลผลที่กล่าวมีเหมาะกับการประมวลผลแบบขนานด้วยหน่วยประมวลผลภาพ (GPU)  ที่สามารถช่วยเร่งกระบวนการประมวลผลทั้งหมดได้อย่างมีประสิทธิภาพ

กระบวนการค้นหาตำแหน่งความหลากหลายทางพันธุกรรมที่เรียกว่า “Variant calling” เป็นหัวใจสำคัญของการแพทย์จีโนมิกส์ การประมวลผลข้อมูลพันธุกรรมทั่วจีโนมของบุคคลที่ถูกต้องและรวดเร็วทำให้ผู้ป่วยได้รับการให้การรักษาที่ตรงจุด เพิ่มคุณภาพชีวิตของผู้ป่วย และลดเวลา/ค่าใช้จ่าย การรักษาในโรงพยาบาล

พลังและกรอบในการประมวลผล

เพื่อเร่งการประมวลผลในการค้นหาความหลากหลายทางพันธุกรรมจากข้อมูลพันธุกรรมทั่วจีโนม NBT  ใช้หลักการประมวลผลแบบขนานบนหน่วยประมวลผลกราฟฟิก NVIDIA DGX A100  ซึ่งถูกพัฒนาเพื่อเป็นระบบสำหรับการประมวลผลสมรรถนะสูงของงานทางด้านปัญญาประดิษฐ์ (AI) โดยภายใน NVIDIA DGX A100  ได้ติดตั้งชิป NVIDIA A100 Tensor Core จำนวนแปดหน่วยซึ่งเพิ่มประสิทธิภาพการประมวลผลด้าน AI ได้สูงถึง 5 เพตาฟล็อปส์ (petaFLOPs) หรือสามารถประมวลผลได้ห้าพันล้านล้านครั้งในหนึ่งวินาทีด้วยความสามารถในการรองรับการประมวลผลขนาดใหญ่ ประสิทธิภาพและความยืดหยุ่นนี้ช่วยให้ NBT สามารถรวบรวมกระบวนการในการวิเคราะห์ทั้งหมดไว้ในระบบโครงสร้างพื้นฐานด้านปัญญาประดิษฐ์นี้เพียงตัวเดียวได้และง่ายต่อการปรับใช้ เพื่อทำให้สามารถใช้งานได้ทันทีไม่ต้องรอการพัฒนาซอฟต์แวร์จีโนมิกส์บนระบบหน่วยประมวลผลกราฟฟิกดังกล่าว NBT  ตัดสินใจใช้ซอฟต์แวร์ในการประมวลผลของ NVIDIA Clara Parabricks ซึ่งรองรับแอพพลิเคชั่นด้านจีโนมิกส์หลายตัว การใช้ CUDA®, HPC, AI และระบบการวิเคราะห์ข้อมูลของ NVIDIA Clara Parabricks  ช่วยให้นักวิจัยสามารถสร้างซอฟต์แวร์จำเพาะที่เร่งการประมวลผลด้วย GPU รวมถึงการพัฒนากระบวนงานและแพลตฟอร์มการคำนวณต่าง ๆ ที่ใช้เพื่อการวิเคราะห์ข้อมูลในขั้นปฐมภูมิทุติยภูมิและตติยภูมิได้โดย NVIDIA Clara Parabricks  มีชุดเครื่องมือที่สนับสนุนการพัฒนาแอปพลิเคชันใหม่ตอบสนองความต้องการที่เปลี่ยนแปลงไปอย่างรวดเร็วของห้องปฏิบัติการทางจีโนมิกส์ที่รองรับการประมวลผลของข้อมูลจำนวนมาก

โซลูชันที่ช่วยเร่งการค้นคว้า

“โซลูชันเร่งความเร็วจาก NVIDIA  ช่วยเพิ่มประสิทธิภาพการค้นหาความหลากหลายทางพันธุกรรมจากข้อมูลพันธุกรรมทั่วจีโนมด้วยความเชื่อมั่นสูง การจับคู่ของ NVIDIA DGX A100 กับ NVIDIA Clara Parabricks  ลดการระยะเวลาการประมวลผลข้อมูลพันธุกรรมและการพัฒนาซอฟต์แวร์เร่งการประมวลผลของเราลงได้สี่เดือน ด้วยโซลูชั่นนี้เวลาในการประมวลผลของผู้ป่วยแต่ละรายยังเร็วมากขึ้น 30 เท่าเหลือเพียงหนึ่งถึงสองชั่วโมง” ดร.ศิษเฎศ ทองสิมา ผู้อำนวยการธนาคารทรัพยากรชีวภาพแห่งชาติ(NBT) กล่าว นอกจากนี้แพลตฟอร์ม A100 ของ NBT ยังสามารถใช้สำหรับงานอื่น ๆ ที่เกี่ยวข้องกับการประมวลผลด้านปัญญาประดิษฐ์ (AI) ภายในของ NBT ได้อีกด้วย

“NVIDIA DGX A100 ช่วยให้นักวิจัยทางวิทยาศาสตร์ในหลายสาขาประสบความสำเร็จในงานค้นคว้าวิจัย ด้วยการนำ NVIDIA DGX  A100 และ NVIDIA Clara Parabricks มาใช้ทำให้ NBT สามารถทำการวิจัยได้เร็วขึ้นและมีคุณภาพสูงขึ้น ซึ่งนำไปสู่การค้นพบข้อมูลจีโนมที่เร็วขึ้นซึ่งเป็นประโยชน์ต่อมนุษยชาติ” เดนนิส อัง ผู้อำนวยการฝ่ายธุรกิจองค์กรสำหรับภูมิภาค SEA และ ANZ ของ NVIDIA กล่าว

(0)(0)