แบนเนอร์หน้าเพจ

ข่าว

นับตั้งแต่ IBM Watson ก่อตั้งขึ้นในปี พ.ศ. 2550 มนุษย์ได้พัฒนาปัญญาประดิษฐ์ทางการแพทย์ (AI) อย่างต่อเนื่อง ระบบ AI ทางการแพทย์ที่ใช้งานได้จริงและมีประสิทธิภาพมีศักยภาพมหาศาลที่จะพลิกโฉมทุกแง่มุมของการแพทย์สมัยใหม่ ทำให้เกิดการดูแลรักษาที่ชาญฉลาด แม่นยำ มีประสิทธิภาพ และครอบคลุมมากขึ้น มอบความเป็นอยู่ที่ดีแก่บุคลากรทางการแพทย์และผู้ป่วย และด้วยเหตุนี้จึงช่วยยกระดับสุขภาพของมนุษย์อย่างมาก ในช่วง 16 ปีที่ผ่านมา แม้ว่านักวิจัย AI ทางการแพทย์จะสะสมตัวอยู่ในสาขาย่อยต่างๆ แต่ในขณะนี้ พวกเขายังไม่สามารถนำนิยายวิทยาศาสตร์มาสู่ความเป็นจริงได้

ในปีนี้ ด้วยการพัฒนาที่ก้าวล้ำของเทคโนโลยี AI เช่น ChatGPT ทำให้ AI ทางการแพทย์มีความก้าวหน้าอย่างมากในหลายด้าน ความก้าวหน้าที่ไม่เคยเกิดขึ้นมาก่อนในด้านความสามารถของ AI ทางการแพทย์: วารสาร Nature ได้ริเริ่มการวิจัยเกี่ยวกับแบบจำลองภาษาขนาดใหญ่ทางการแพทย์และแบบจำลองพื้นฐานภาพทางการแพทย์อย่างต่อเนื่อง Google เปิดตัว Med-PaLM และรุ่นที่พัฒนาต่อยอด ซึ่งสามารถเข้าถึงระดับผู้เชี่ยวชาญในข้อสอบแพทย์ของสหรัฐอเมริกา วารสารวิชาการชั้นนำจะมุ่งเน้นไปที่ AI ทางการแพทย์: Nature เปิดเผยมุมมองเกี่ยวกับแบบจำลองพื้นฐานของ AI ทางการแพทย์ทั่วไป หลังจากบทวิจารณ์ AI ในทางการแพทย์หลายฉบับเมื่อต้นปีนี้ วารสาร New England Journal of Medicine (NEJM) ได้เผยแพร่บทวิจารณ์สุขภาพดิจิทัลฉบับแรกเมื่อวันที่ 30 พฤศจิกายน และได้เปิดตัววารสารย่อย NEJM AI ฉบับแรกเมื่อวันที่ 12 ธันวาคม การพัฒนา AI ทางการแพทย์มีความสมบูรณ์ยิ่งขึ้น: วารสารย่อย JAMA ได้เผยแพร่โครงการริเริ่มการแบ่งปันข้อมูลภาพทางการแพทย์ทั่วโลก สำนักงานคณะกรรมการอาหารและยาแห่งสหรัฐอเมริกา (FDA) กำลังพัฒนาร่างแนวทางสำหรับการควบคุม AI ทางการแพทย์

ด้านล่างนี้ เราจะมาทบทวนความคืบหน้าสำคัญที่นักวิจัยทั่วโลกได้ทำไปในทิศทางของ AI ทางการแพทย์ที่ใช้งานได้ในปี 2023

801

แบบจำลองพื้นฐาน AI ทางการแพทย์

การสร้างแบบจำลองพื้นฐานของ AI ทางการแพทย์ถือเป็นงานวิจัยที่ได้รับความสนใจมากที่สุดในปีนี้อย่างไม่ต้องสงสัย วารสาร Nature ได้ตีพิมพ์บทความวิจารณ์เกี่ยวกับแบบจำลองพื้นฐานสากลของการดูแลสุขภาพและแบบจำลองภาษาขนาดใหญ่ของการดูแลสุขภาพตลอดปีที่ผ่านมา Medical Image Analysis ซึ่งเป็นวารสารชั้นนำในอุตสาหกรรม ได้ทบทวนและคาดการณ์ถึงความท้าทายและโอกาสของการวิจัยแบบจำลองพื้นฐานในการวิเคราะห์ภาพทางการแพทย์ และนำเสนอแนวคิด “สายเลือดของแบบจำลองพื้นฐาน” เพื่อสรุปและชี้นำการพัฒนาการวิจัยแบบจำลองพื้นฐานของ AI ทางการแพทย์ อนาคตของแบบจำลอง AI ขั้นพื้นฐานสำหรับการดูแลสุขภาพกำลังชัดเจนยิ่งขึ้น โดยอาศัยตัวอย่างที่ประสบความสำเร็จของแบบจำลองภาษาขนาดใหญ่ เช่น ChatGPT การใช้วิธีการฝึกฝนล่วงหน้าแบบมีผู้ดูแลตนเองขั้นสูง และข้อมูลการฝึกอบรมจำนวนมาก นักวิจัยในสาขา AI ทางการแพทย์กำลังพยายามสร้าง 1) แบบจำลองพื้นฐานเฉพาะโรค 2) แบบจำลองพื้นฐานทั่วไป และ 3) แบบจำลองขนาดใหญ่แบบหลายโหมดที่ผสานรวมโหมดที่หลากหลายพร้อมพารามิเตอร์ขนาดใหญ่และความสามารถที่เหนือกว่า

โมเดล AI สำหรับการรวบรวมข้อมูลทางการแพทย์

นอกจากโมเดล AI ขนาดใหญ่ที่มีบทบาทสำคัญในงานวิเคราะห์ข้อมูลทางคลินิกขั้นปลายแล้ว เทคโนโลยีที่เป็นตัวแทนของโมเดล AI เชิงกำเนิด (generative AI) ก็ได้ถือกำเนิดขึ้นในการรวบรวมข้อมูลทางคลินิกขั้นต้นเช่นกัน อัลกอริทึม AI สามารถปรับปรุงกระบวนการ ความเร็ว และคุณภาพของการรวบรวมข้อมูลได้อย่างมีนัยสำคัญ

 

ต้นปีนี้ Nature Biomedical Engineering ได้ตีพิมพ์ผลการศึกษาจากมหาวิทยาลัย Straits ของตุรกี ซึ่งมุ่งเน้นการใช้ AI เชิงกำเนิด (generative AI) เพื่อแก้ปัญหาการวินิจฉัยด้วยภาพทางพยาธิวิทยาในการประยุกต์ใช้ทางคลินิก สิ่งแปลกปลอมในเนื้อเยื่อส่วนที่แช่แข็งระหว่างการผ่าตัดเป็นอุปสรรคต่อการประเมินวินิจฉัยอย่างรวดเร็ว แม้ว่าเนื้อเยื่อฝังฟอร์มาลินและพาราฟิน (FFPE) จะให้ตัวอย่างที่มีคุณภาพสูงกว่า แต่กระบวนการผลิตใช้เวลานานและมักใช้เวลา 12-48 ชั่วโมง ทำให้ไม่เหมาะสมสำหรับการใช้งานในการผ่าตัด ทีมวิจัยจึงได้เสนออัลกอริทึมที่เรียกว่า AI-FFPE ซึ่งสามารถทำให้เนื้อเยื่อในส่วนที่แช่แข็งมีลักษณะคล้ายคลึงกับ FFPE อัลกอริทึมนี้สามารถแก้ไขสิ่งแปลกปลอมในเนื้อเยื่อส่วนที่แช่แข็ง ปรับปรุงคุณภาพของภาพ และรักษาคุณสมบัติทางคลินิกไว้ได้ในเวลาเดียวกัน ในการตรวจสอบทางคลินิก อัลกอริทึม AI-FFPE ช่วยปรับปรุงความแม่นยำในการวินิจฉัยของนักพยาธิวิทยาสำหรับชนิดย่อยของเนื้องอกได้อย่างมีนัยสำคัญ ในขณะเดียวกันก็ช่วยลดระยะเวลาในการวินิจฉัยทางคลินิกลงได้อย่างมาก

Cell Reports Medicine รายงานงานวิจัยโดยทีมวิจัยจากวิทยาลัยคลินิกแห่งที่สามของมหาวิทยาลัยจี๋หลิน ภาควิชารังสีวิทยา โรงพยาบาลจงซาน สังกัดมหาวิทยาลัยฟู่ตั้น และมหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยีเซี่ยงไฮ้ [25] งานวิจัยนี้เสนอกรอบการทำงานแบบผสมผสานการเรียนรู้เชิงลึกและการสร้างภาพซ้ำแบบทั่วไป (Hybrid DL-IR) ที่มีความคล่องตัวและความยืดหยุ่นสูง แสดงให้เห็นถึงประสิทธิภาพการสร้างภาพที่ยอดเยี่ยมในการถ่ายภาพด้วย MRI แบบเร็ว, CT ปริมาณรังสีต่ำ และ PET แบบเร็ว อัลกอริทึมนี้สามารถสแกน MR อวัยวะเดียวหลายลำดับได้ภายใน 100 วินาที ลดปริมาณรังสีเหลือเพียง 10% ของภาพ CT และลดสัญญาณรบกวน และสามารถสร้างภาพรอยโรคขนาดเล็กจากการถ่ายภาพ PET ขึ้นใหม่ได้ด้วยความเร่ง 2 ถึง 4 เท่า พร้อมกับลดผลกระทบของสิ่งแปลกปลอมจากการเคลื่อนไหว

AI ทางการแพทย์ร่วมมือกับบุคลากรทางการแพทย์

การพัฒนาอย่างรวดเร็วของ AI ทางการแพทย์ทำให้ผู้เชี่ยวชาญทางการแพทย์พิจารณาและศึกษาอย่างจริงจังถึงวิธีการทำงานร่วมกับ AI เพื่อพัฒนากระบวนการทางคลินิก ในเดือนกรกฎาคมปีนี้ DeepMind และทีมวิจัยจากหลายสถาบันได้ร่วมกันเสนอระบบ AI ที่เรียกว่า Complementary Driven Clinical Workflow Delay (CoDoC) กระบวนการวินิจฉัยจะถูกวินิจฉัยโดยระบบ AI เชิงทำนายก่อน จากนั้นระบบ AI อีกระบบจะประเมินผลจากผลก่อนหน้า หากมีข้อสงสัย แพทย์จะเป็นผู้วินิจฉัยขั้นสุดท้ายเพื่อปรับปรุงความแม่นยำในการวินิจฉัยและประสิทธิภาพในการวินิจฉัย สำหรับการคัดกรองมะเร็งเต้านม CoDoC ช่วยลดอัตราผลบวกลวงลง 25% ด้วยอัตราผลลบลวงที่เท่ากัน และลดภาระงานของแพทย์ลง 66% เมื่อเทียบกับกระบวนการ "อนุญาโตตุลาการอ่านซ้ำ" ในปัจจุบันในสหราชอาณาจักร สำหรับการจำแนกประเภทวัณโรค อัตราผลบวกลวงลดลง 5 ถึง 15 เปอร์เซ็นต์ ด้วยอัตราผลลบลวงที่เท่ากัน เมื่อเทียบกับ AI และกระบวนการทางคลินิกแบบอิสระ

ในทำนองเดียวกัน แอนนี่ วาย. เอ็นจี และคณะ จากบริษัท Kheiron ในลอนดอน สหราชอาณาจักร ได้นำระบบอ่าน AI เพิ่มเติม (ร่วมกับผู้ตรวจสอบที่เป็นมนุษย์) มาใช้เพื่อตรวจสอบผลลัพธ์อีกครั้งเมื่อไม่มีผลการเรียกคืนในกระบวนการอนุญาโตตุลาการอ่านซ้ำ ซึ่งช่วยแก้ปัญหาการตรวจพบที่ผิดพลาดในการคัดกรองมะเร็งเต้านมระยะเริ่มต้น และกระบวนการนี้แทบจะไม่มีผลบวกลวงเลย การศึกษาอีกชิ้นหนึ่งซึ่งนำโดยทีมวิจัยจากคณะแพทยศาสตร์ มหาวิทยาลัยเท็กซัส แมคโกเวิร์น และดำเนินการในศูนย์โรคหลอดเลือดสมองสี่แห่ง ได้นำเทคโนโลยี AI ที่ใช้เอกซเรย์คอมพิวเตอร์เอกซเรย์ (CTA) มาประยุกต์ใช้ในระบบอัตโนมัติเพื่อตรวจหาโรคหลอดเลือดสมองตีบขนาดใหญ่ที่มีการอุดตันของหลอดเลือด (LVO) แพทย์และรังสีแพทย์จะได้รับการแจ้งเตือนแบบเรียลไทม์บนโทรศัพท์มือถือภายในไม่กี่นาทีหลังจากการถ่ายภาพ CT เสร็จสิ้น เพื่อแจ้งให้ทราบถึงความเป็นไปได้ที่จะมี LVO กระบวนการ AI นี้ช่วยปรับปรุงขั้นตอนการทำงานในโรงพยาบาลสำหรับโรคหลอดเลือดสมองตีบเฉียบพลัน ลดระยะเวลาตั้งแต่ประตูถึงขาหนีบตั้งแต่เข้ารับการรักษาจนถึงการรักษา และเพิ่มโอกาสในการช่วยเหลือผู้ป่วยได้สำเร็จ ผลการวิจัยได้รับการตีพิมพ์ในวารสาร JAMA Neurology

โมเดลการดูแลสุขภาพด้วย AI เพื่อประโยชน์ถ้วนหน้า

ในปี 2023 จะมีงานวิจัยดีๆ มากมายที่ใช้ AI ทางการแพทย์เพื่อค้นหาคุณสมบัติที่มองไม่เห็นด้วยตาเปล่าจากข้อมูลที่มีอยู่มากขึ้น ช่วยให้สามารถวินิจฉัยโรคได้อย่างครอบคลุมและคัดกรองได้ตั้งแต่ระยะเริ่มต้น ในช่วงต้นปี Nature Medicine ได้ตีพิมพ์ผลการศึกษาของศูนย์จักษุจงซาน มหาวิทยาลัยซุนยัตเซ็น และโรงพยาบาลในเครือแห่งที่สอง มหาวิทยาลัยการแพทย์ฝูเจี้ยน โดยใช้สมาร์ทโฟนเป็นอุปกรณ์ปลายทาง พวกเขาใช้ภาพวิดีโอที่เหมือนการ์ตูนเพื่อกระตุ้นการจ้องมองของเด็ก บันทึกพฤติกรรมการจ้องมองและลักษณะใบหน้าของเด็ก และวิเคราะห์แบบจำลองความผิดปกติเพิ่มเติมโดยใช้แบบจำลองการเรียนรู้เชิงลึก เพื่อค้นหาโรคตา 16 โรคได้สำเร็จ รวมถึงต้อกระจกแต่กำเนิด หนังตาตกแต่กำเนิด และต้อหินแต่กำเนิด โดยมีความแม่นยำในการตรวจคัดกรองโดยเฉลี่ยมากกว่า 85% วิธีนี้เป็นวิธีทางเทคนิคที่มีประสิทธิภาพและง่ายต่อการเผยแพร่ สำหรับการคัดกรองความบกพร่องทางการมองเห็นในทารกและโรคตาที่เกี่ยวข้องในระยะเริ่มต้นในวงกว้าง

เมื่อปลายปี Nature Medicine ได้รายงานผลงานวิจัยของสถาบันทางการแพทย์และวิจัยมากกว่า 10 แห่งทั่วโลก รวมถึงสถาบันโรคตับอ่อนเซี่ยงไฮ้ และโรงพยาบาลในเครือแห่งแรกของมหาวิทยาลัยเจ้อเจียง ผู้เขียนได้ประยุกต์ใช้ AI ในการตรวจคัดกรองมะเร็งตับอ่อนในผู้ที่ไม่มีอาการในศูนย์ตรวจร่างกาย โรงพยาบาล และอื่นๆ เพื่อตรวจหาลักษณะของรอยโรคในภาพ CT แบบธรรมดา ซึ่งยากต่อการตรวจพบด้วยตาเปล่าเพียงอย่างเดียว เพื่อให้สามารถตรวจพบมะเร็งตับอ่อนในระยะเริ่มต้นได้อย่างมีประสิทธิภาพและไม่รุกราน จากการตรวจสอบข้อมูลจากผู้ป่วยมากกว่า 20,000 ราย แบบจำลองนี้ยังระบุกรณีของรอยโรคที่ไม่พบในทางคลินิก 31 กรณี ซึ่งช่วยปรับปรุงผลลัพธ์ทางคลินิกอย่างมีนัยสำคัญ

การแบ่งปันข้อมูลทางการแพทย์

ในปี 2566 มีกลไกการแบ่งปันข้อมูลที่สมบูรณ์แบบและกรณีที่ประสบความสำเร็จอีกมากมายเกิดขึ้นทั่วโลก ทำให้เกิดความร่วมมือหลายศูนย์และการเปิดเผยข้อมูลภายใต้หลักการของการปกป้องความเป็นส่วนตัวและความปลอดภัยของข้อมูล

ประการแรก ด้วยความช่วยเหลือของเทคโนโลยี AI นักวิจัย AI ได้มีส่วนร่วมในการแบ่งปันข้อมูลทางการแพทย์ Qi Chang และคณะจากมหาวิทยาลัย Rutgers ในสหรัฐอเมริกาได้ตีพิมพ์บทความใน Nature Communications เสนอกรอบการเรียนรู้ของรัฐบาลกลาง DSL ที่อิงจากเครือข่าย Adversarial Synthetic แบบกระจาย ซึ่งใช้ AI เชิงกำเนิดเพื่อฝึกฝนข้อมูลที่สร้างขึ้นเฉพาะของศูนย์หลายแห่ง จากนั้นจึงแทนที่ข้อมูลจริงของศูนย์หลายแห่งด้วยข้อมูลที่สร้างขึ้น รับรองการฝึกอบรม AI โดยอิงจากข้อมูลขนาดใหญ่ของศูนย์หลายแห่ง พร้อมกับปกป้องความเป็นส่วนตัวของข้อมูล ทีมเดียวกันนี้ยังเปิดซอร์สชุดข้อมูลของภาพทางพยาธิวิทยาที่สร้างขึ้นและคำอธิบายประกอบที่เกี่ยวข้อง แบบจำลองการแบ่งส่วนที่ฝึกฝนบนชุดข้อมูลที่สร้างขึ้นสามารถให้ผลลัพธ์ที่ใกล้เคียงกับข้อมูลจริง

ทีมวิจัยของไต้ฉงไห่จากมหาวิทยาลัยชิงหวาได้ตีพิมพ์บทความเกี่ยวกับ npj Digital Health โดยเสนอโครงการ Relay Learning ซึ่งใช้ข้อมูลขนาดใหญ่จากหลายไซต์เพื่อฝึกอบรมโมเดล AI ภายใต้หลักการอธิปไตยของข้อมูลในพื้นที่และไม่มีการเชื่อมต่อเครือข่ายข้ามไซต์ โครงการนี้ช่วยสร้างสมดุลระหว่างความกังวลด้านความปลอดภัยและความเป็นส่วนตัวของข้อมูลกับการมุ่งเน้นประสิทธิภาพของ AI ต่อมาทีมวิจัยเดียวกันนี้ได้ร่วมกันพัฒนาและตรวจสอบ CAIMEN ซึ่งเป็นระบบวินิจฉัยเนื้องอกในช่องอกด้วย CT ทั่วช่องอก โดยอาศัยการเรียนรู้ของรัฐบาลกลาง โดยร่วมมือกับโรงพยาบาล First Affiliated Hospital ของมหาวิทยาลัยการแพทย์กว่างโจว และโรงพยาบาล 24 แห่งทั่วประเทศ ระบบนี้ซึ่งสามารถนำไปประยุกต์ใช้กับเนื้องอกในช่องอกที่พบบ่อย 12 แห่ง มีความแม่นยำในการวินิจฉัยที่ดีขึ้น 44.9 เปอร์เซ็นต์เมื่อใช้เพียงอย่างเดียว เมื่อเทียบกับการใช้โดยผู้เชี่ยวชาญที่เป็นมนุษย์เพียงอย่างเดียว และความแม่นยำในการวินิจฉัยที่ดีขึ้น 19 เปอร์เซ็นต์เมื่อใช้โดยผู้เชี่ยวชาญที่เป็นมนุษย์

ในทางกลับกัน มีโครงการริเริ่มหลายโครงการที่กำลังดำเนินการเพื่อสร้างชุดข้อมูลทางการแพทย์ขนาดใหญ่ระดับโลกที่ปลอดภัย ในเดือนพฤศจิกายน 2566 Agustina Saenz และคณะจากภาควิชาสารสนเทศชีวการแพทย์ คณะแพทยศาสตร์ฮาร์วาร์ด ได้เผยแพร่กรอบการทำงานระดับโลกสำหรับการแบ่งปันข้อมูลภาพทางการแพทย์ที่เรียกว่า Artificial Intelligence Data for All Healthcare (MAIDA) ทางออนไลน์ในวารสาร Lancet Digital Health พวกเขากำลังทำงานร่วมกับองค์กรด้านการดูแลสุขภาพทั่วโลกเพื่อให้คำแนะนำที่ครอบคลุมเกี่ยวกับการรวบรวมข้อมูลและการลบข้อมูลระบุตัวตน โดยใช้เทมเพลต US Federal Demonstration Partner (FDP) เพื่อสร้างมาตรฐานการแบ่งปันข้อมูล พวกเขาวางแผนที่จะค่อยๆ เผยแพร่ชุดข้อมูลที่รวบรวมจากภูมิภาคต่างๆ และสถานพยาบาลต่างๆ ทั่วโลก คาดว่าชุดข้อมูลชุดแรกจะเผยแพร่ในต้นปี 2567 และจะมีการเผยแพร่เพิ่มเติมเมื่อความร่วมมือขยายตัว โครงการนี้เป็นความพยายามที่สำคัญในการสร้างชุดข้อมูล AI ระดับโลก ขนาดใหญ่ และหลากหลายที่เผยแพร่สู่สาธารณะ

หลังจากข้อเสนอนี้ ธนาคาร UK Biobank ได้วางตัวอย่างไว้ ธนาคาร UK Biobank ได้เผยแพร่ข้อมูลใหม่เมื่อวันที่ 30 พฤศจิกายน จากการจัดลำดับจีโนมทั้งหมดของผู้เข้าร่วม 500,000 คน ฐานข้อมูลนี้ซึ่งเผยแพร่ลำดับจีโนมทั้งหมดของอาสาสมัครชาวอังกฤษทั้ง 500,000 คน ถือเป็นฐานข้อมูลจีโนมมนุษย์ที่สมบูรณ์ที่สุดในโลก นักวิจัยทั่วโลกสามารถขอเข้าถึงข้อมูลที่ไม่ระบุตัวตนนี้ และใช้ข้อมูลนี้เพื่อศึกษาพื้นฐานทางพันธุกรรมของสุขภาพและโรคภัยไข้เจ็บ ในอดีตข้อมูลทางพันธุกรรมมีความไวสูงต่อการตรวจสอบ และความสำเร็จครั้งประวัติศาสตร์ของธนาคาร UK Biobank พิสูจน์ให้เห็นว่าการสร้างฐานข้อมูลขนาดใหญ่ระดับโลกที่เปิดกว้างและปราศจากความเป็นส่วนตัวนั้นเป็นไปได้ ด้วยเทคโนโลยีและฐานข้อมูลนี้ ปัญญาประดิษฐ์ทางการแพทย์จะก้าวไปสู่อีกขั้นต่อไปอย่างแน่นอน

การตรวจสอบและประเมินผล AI ทางการแพทย์

เมื่อเทียบกับการพัฒนาอย่างรวดเร็วของเทคโนโลยี AI ทางการแพทย์แล้ว การพัฒนาการตรวจสอบและประเมินผล AI ทางการแพทย์นั้นค่อนข้างล่าช้า การตรวจสอบและประเมินผลในสาขา AI ทั่วไปมักมองข้ามความต้องการที่แท้จริงของแพทย์และผู้ป่วยที่มีต่อ AI การทดลองทางคลินิกแบบสุ่มและมีกลุ่มควบคุมแบบดั้งเดิมนั้นใช้ความพยายามมากเกินไปที่จะรับมือกับการพัฒนาเครื่องมือ AI อย่างรวดเร็ว การปรับปรุงระบบการตรวจสอบและประเมินผลที่เหมาะสมสำหรับเครื่องมือ AI ทางการแพทย์โดยเร็วที่สุดเป็นสิ่งสำคัญที่สุดในการส่งเสริมให้ AI ทางการแพทย์ก้าวกระโดดจากการวิจัยและพัฒนาไปสู่ระดับคลินิกอย่างแท้จริง

ในงานวิจัย Med-PaLM ของ Google ซึ่งตีพิมพ์ในวารสาร Nature ทีมวิจัยยังได้เผยแพร่เกณฑ์มาตรฐานการประเมิน MultiMedQA ซึ่งใช้ในการประเมินความสามารถของแบบจำลองภาษาขนาดใหญ่ในการรับความรู้ทางคลินิก เกณฑ์มาตรฐานนี้ประกอบด้วยชุดข้อมูลคำถามและคำตอบทางการแพทย์ระดับมืออาชีพที่มีอยู่ 6 ชุด ครอบคลุมความรู้ทางการแพทย์ระดับมืออาชีพ งานวิจัย และด้านอื่นๆ รวมถึงชุดข้อมูลฐานข้อมูลคำถามและคำตอบทางการแพทย์แบบออนไลน์ โดยพิจารณาคำถามและคำตอบออนไลน์ระหว่างแพทย์และผู้ป่วย เพื่อพยายามฝึกฝน AI ให้เป็นแพทย์ที่มีคุณสมบัติเหมาะสมจากหลากหลายแง่มุม นอกจากนี้ ทีมวิจัยยังได้เสนอกรอบการทำงานที่อิงจากการประเมินโดยมนุษย์ ซึ่งพิจารณาจากหลายมิติ ได้แก่ ข้อเท็จจริง ความเข้าใจ การให้เหตุผล และอคติที่อาจเกิดขึ้น นี่เป็นหนึ่งในความพยายามในการวิจัยที่เป็นตัวแทนมากที่สุดในการประเมิน AI ในระบบการดูแลสุขภาพที่เผยแพร่ในปีนี้

อย่างไรก็ตาม การที่โมเดลภาษาขนาดใหญ่แสดงให้เห็นถึงระดับการเข้ารหัสความรู้ทางคลินิกที่สูง หมายความว่าโมเดลภาษาขนาดใหญ่มีความสามารถสำหรับงานทางคลินิกในโลกแห่งความเป็นจริงหรือไม่ เช่นเดียวกับนักศึกษาแพทย์ที่สอบผ่านการสอบแพทย์วิชาชีพด้วยคะแนนเต็ม เกณฑ์การประเมินที่ Google เสนออาจไม่ใช่คำตอบที่สมบูรณ์แบบสำหรับหัวข้อการประเมิน AI ทางการแพทย์สำหรับโมเดล AI ในช่วงต้นปี 2021 และ 2022 นักวิจัยได้เสนอแนวทางการรายงานผล เช่น Decid-AI, SPIRIT-AI และ INTRPRT โดยหวังว่าจะเป็นแนวทางสำหรับการพัฒนาและการตรวจสอบความถูกต้องของ AI ทางการแพทย์ในระยะเริ่มต้น ภายใต้เงื่อนไขของการพิจารณาปัจจัยต่างๆ เช่น ความสามารถในการปฏิบัติทางคลินิก ความปลอดภัย ปัจจัยด้านมนุษย์ และความโปร่งใส/ความสามารถในการตีความ เมื่อเร็วๆ นี้ วารสาร Nature Medicine ได้ตีพิมพ์ผลการศึกษาโดยนักวิจัยจากมหาวิทยาลัยอ็อกซ์ฟอร์ดและมหาวิทยาลัยสแตนฟอร์ด เกี่ยวกับการใช้ "การตรวจสอบความถูกต้องจากภายนอก" หรือ "การตรวจสอบความถูกต้องเฉพาะที่แบบซ้ำๆ" เพื่อตรวจสอบความถูกต้องของเครื่องมือ AI

ลักษณะที่ไม่ลำเอียงของเครื่องมือ AI ยังเป็นแนวทางการประเมินที่สำคัญ ซึ่งได้รับความสนใจในปีนี้จากทั้งบทความของ Science และ NEJM AI มักแสดงอคติเนื่องจากจำกัดอยู่เพียงข้อมูลการฝึกอบรม อคตินี้อาจสะท้อนถึงความไม่เท่าเทียมทางสังคม ซึ่งพัฒนาไปสู่การเลือกปฏิบัติทางอัลกอริทึม สถาบันสุขภาพแห่งชาติ (National Institutes of Health) เพิ่งเปิดตัวโครงการ Bridge2AI ซึ่งประเมินว่าใช้งบประมาณ 130 ล้านดอลลาร์สหรัฐ เพื่อสร้างชุดข้อมูลที่หลากหลาย (สอดคล้องกับเป้าหมายของโครงการ MAIDA ที่กล่าวถึงข้างต้น) ซึ่งสามารถใช้เพื่อตรวจสอบความไม่ลำเอียงของเครื่องมือ AI ทางการแพทย์ได้ MultiMedQA ไม่ได้พิจารณาประเด็นเหล่านี้ คำถามเกี่ยวกับวิธีการวัดและตรวจสอบความถูกต้องของแบบจำลอง AI ทางการแพทย์ยังคงต้องมีการอภิปรายอย่างกว้างขวางและเจาะลึก

ในเดือนมกราคม Nature Medicine ได้ตีพิมพ์บทความแสดงความคิดเห็นชื่อ “The Next Generation of Evidence-Based Medicine” โดย Vivek Subbiah จากศูนย์มะเร็ง MD Anderson มหาวิทยาลัยเท็กซัส ซึ่งทบทวนข้อจำกัดของการทดลองทางคลินิกที่ถูกเปิดเผยในบริบทของการระบาดใหญ่ของโควิด-19 และชี้ให้เห็นถึงความขัดแย้งระหว่างนวัตกรรมและการยึดมั่นในกระบวนการวิจัยทางคลินิก สุดท้ายนี้ บทความยังชี้ให้เห็นถึงอนาคตของการปรับโครงสร้างการทดลองทางคลินิก นั่นคือการทดลองทางคลินิกยุคใหม่ที่ใช้ปัญญาประดิษฐ์ นั่นคือ การใช้ปัญญาประดิษฐ์จากข้อมูลการวิจัยในอดีตจำนวนมาก ข้อมูลในโลกแห่งความเป็นจริง ข้อมูลทางคลินิกแบบหลายรูปแบบ และข้อมูลอุปกรณ์สวมใส่ เพื่อค้นหาหลักฐานสำคัญ นี่หมายความว่าเทคโนโลยี AI และกระบวนการตรวจสอบทางคลินิกของ AI อาจส่งเสริมและพัฒนาไปพร้อมๆ กันในอนาคตหรือไม่? นี่คือคำถามที่เปิดกว้างและชวนให้ขบคิดแห่งปี 2023

การกำกับดูแล AI ทางการแพทย์

ความก้าวหน้าของเทคโนโลยี AI ยังก่อให้เกิดความท้าทายต่อการกำกับดูแล AI และผู้กำหนดนโยบายทั่วโลกกำลังดำเนินการอย่างรอบคอบและรอบคอบ ในปี 2562 สำนักงานคณะกรรมการอาหารและยา (FDA) ได้เผยแพร่กรอบการกำกับดูแลที่เสนอสำหรับการเปลี่ยนแปลงซอฟต์แวร์สำหรับอุปกรณ์การแพทย์ปัญญาประดิษฐ์ (ร่างเพื่อการอภิปราย) เป็นครั้งแรก โดยให้รายละเอียดแนวทางที่เป็นไปได้ในการตรวจสอบก่อนนำ AI เข้าสู่ตลาดและการปรับเปลี่ยนซอฟต์แวร์ที่ขับเคลื่อนด้วยการเรียนรู้ของเครื่อง ในปี 2564 สำนักงานคณะกรรมการอาหารและยา (FDA) ได้เสนอ “แผนปฏิบัติการซอฟต์แวร์ที่ขับเคลื่อนด้วยปัญญาประดิษฐ์/การเรียนรู้ของเครื่องในฐานะอุปกรณ์การแพทย์” ซึ่งชี้แจงมาตรการกำกับดูแลทางการแพทย์ที่เกี่ยวข้องกับ AI เฉพาะ 5 ประการ ในปีนี้ สำนักงานคณะกรรมการอาหารและยา (FDA) ได้ออกเอกสารการยื่นเอกสารก่อนนำผลิตภัณฑ์เข้าสู่ตลาดสำหรับคุณลักษณะของซอฟต์แวร์อุปกรณ์อีกครั้ง เพื่อให้ข้อมูลเกี่ยวกับคำแนะนำในการยื่นเอกสารก่อนนำผลิตภัณฑ์เข้าสู่ตลาดสำหรับการประเมินความปลอดภัยและประสิทธิภาพของคุณลักษณะของซอฟต์แวร์อุปกรณ์ของ FDA ซึ่งรวมถึงคุณลักษณะของซอฟต์แวร์อุปกรณ์บางอย่างที่ใช้โมเดลการเรียนรู้ของเครื่องที่ฝึกฝนผ่านวิธีการเรียนรู้ของเครื่อง นโยบายการกำกับดูแลของ FDA ได้พัฒนาจากข้อเสนอเบื้องต้นไปสู่แนวทางปฏิบัติ

หลังจากการประกาศเขตข้อมูลสุขภาพยุโรป (European Health Data Space) ในเดือนกรกฎาคมปีที่แล้ว สหภาพยุโรปได้ตราพระราชบัญญัติปัญญาประดิษฐ์ (AI) ขึ้นอีกครั้ง พระราชบัญญัติฉบับแรกมีเป้าหมายเพื่อใช้ประโยชน์จากข้อมูลสุขภาพให้เกิดประโยชน์สูงสุด เพื่อให้บริการดูแลสุขภาพที่มีคุณภาพสูง ลดความเหลื่อมล้ำ และสนับสนุนข้อมูลสำหรับการป้องกัน การวินิจฉัย การรักษา นวัตกรรมทางวิทยาศาสตร์ การตัดสินใจ และการออกกฎหมาย ควบคู่ไปกับการทำให้มั่นใจว่าประชาชนในสหภาพยุโรปสามารถควบคุมข้อมูลสุขภาพส่วนบุคคลของตนเองได้มากขึ้น พระราชบัญญัติฉบับหลังชี้ให้เห็นอย่างชัดเจนว่าระบบการวินิจฉัยทางการแพทย์เป็นระบบปัญญาประดิษฐ์ที่มีความเสี่ยงสูง และจำเป็นต้องมีการกำกับดูแลที่เข้มงวด การควบคุมดูแลตลอดวงจรชีวิต และการกำกับดูแลก่อนการประเมิน องค์การยาแห่งยุโรป (EMA) ได้เผยแพร่ร่างเอกสารสะท้อนความคิด (Draft Reflection Paper) เกี่ยวกับการใช้ AI เพื่อสนับสนุนการพัฒนา การควบคุม และการใช้ยา โดยเน้นที่การปรับปรุงความน่าเชื่อถือของ AI เพื่อให้มั่นใจในความปลอดภัยของผู้ป่วยและความถูกต้องของผลการวิจัยทางคลินิก โดยรวมแล้ว แนวทางการกำกับดูแลของสหภาพยุโรปกำลังค่อยๆ เป็นรูปเป็นร่างขึ้น และรายละเอียดการนำไปปฏิบัติขั้นสุดท้ายอาจมีรายละเอียดและเข้มงวดมากขึ้น ตรงกันข้ามกับกฎระเบียบอันเข้มงวดของสหภาพยุโรป โครงร่างการกำกับดูแล AI ของสหราชอาณาจักรระบุชัดเจนว่ารัฐบาลวางแผนที่จะใช้แนวทางที่นุ่มนวลและจะไม่ตราพระราชบัญญัติใหม่หรือจัดตั้งหน่วยงานกำกับดูแลใหม่ในตอนนี้

ในประเทศจีน ศูนย์ตรวจสอบทางเทคนิคอุปกรณ์การแพทย์ (NMPA) ของสำนักงานบริหารผลิตภัณฑ์ทางการแพทย์แห่งชาติ (National Medical Products Administration) เคยออกเอกสารต่างๆ มาแล้ว เช่น “จุดตรวจสอบซอฟต์แวร์การตัดสินใจด้วยการเรียนรู้เชิงลึก” “หลักการชี้แนะสำหรับการตรวจสอบการจดทะเบียนอุปกรณ์การแพทย์ปัญญาประดิษฐ์ (ร่างเพื่อแสดงความคิดเห็น)” และ “หนังสือเวียนว่าด้วยหลักการชี้แนะสำหรับการจำแนกและนิยามผลิตภัณฑ์ซอฟต์แวร์ทางการแพทย์ปัญญาประดิษฐ์ (ฉบับที่ 47 ปี 2021)” ในปีนี้ ได้มีการเผยแพร่ “สรุปผลการจำแนกประเภทผลิตภัณฑ์อุปกรณ์การแพทย์ครั้งแรกในปี 2566” อีกครั้ง ชุดเอกสารนี้ทำให้คำจำกัดความ การจำแนกประเภท และการกำกับดูแลผลิตภัณฑ์ซอฟต์แวร์ทางการแพทย์ที่ใช้ปัญญาประดิษฐ์มีความชัดเจนและใช้งานง่ายขึ้น อีกทั้งยังให้คำแนะนำที่ชัดเจนเกี่ยวกับกลยุทธ์การวางตำแหน่งผลิตภัณฑ์และการจดทะเบียนขององค์กรต่างๆ ในอุตสาหกรรม เอกสารเหล่านี้ให้กรอบการทำงานและการตัดสินใจด้านการจัดการสำหรับการกำกับดูแลทางวิทยาศาสตร์สำหรับอุปกรณ์การแพทย์ที่ใช้ปัญญาประดิษฐ์ วาระการประชุม China Medical Artificial Intelligence Conference ที่เมืองหางโจว ระหว่างวันที่ 21-23 ธันวาคม ถือเป็นที่น่าจับตามองอย่างยิ่งว่า การประชุมพิเศษว่าด้วยปัญญาประดิษฐ์ทางการแพทย์จีน (China Medical Artificial Intelligence Conference) ซึ่งจัดขึ้นที่เมืองหางโจว ระหว่างวันที่ 21-23 ธันวาคม จะเป็นเวทีพิเศษเกี่ยวกับการกำกับดูแลทางการแพทย์ดิจิทัลและการพัฒนาคุณภาพสูงของโรงพยาบาลของรัฐ รวมถึงเวทีพัฒนามาตรฐานเทคโนโลยีการทดสอบและประเมินผลอุปกรณ์การแพทย์ที่ใช้ปัญญาประดิษฐ์ ในขณะนั้น เจ้าหน้าที่จากคณะกรรมการพัฒนาและปฏิรูปแห่งชาติ (NDPA) และสำนักงานคณะกรรมการกำกับกิจการโทรคมนาคมแห่งชาติ (NMPA) จะเข้าร่วมการประชุมและอาจเผยแพร่ข้อมูลใหม่ๆ ต่อไป

บทสรุป

ในปี พ.ศ. 2566 ปัญญาประดิษฐ์ทางการแพทย์ได้เริ่มบูรณาการเข้ากับกระบวนการทางการแพทย์ทั้งต้นน้ำและปลายน้ำทั้งหมด ครอบคลุมตั้งแต่การรวบรวมข้อมูลโรงพยาบาล การรวมข้อมูล การวิเคราะห์ การวินิจฉัยและการรักษา ไปจนถึงการคัดกรองชุมชน อีกทั้งยังทำงานร่วมกับบุคลากรทางการแพทย์และควบคุมโรคอย่างเป็นระบบ แสดงให้เห็นถึงศักยภาพในการนำความเป็นอยู่ที่ดีมาสู่สุขภาพของมนุษย์ งานวิจัยปัญญาประดิษฐ์ทางการแพทย์ที่ใช้งานได้จริงกำลังเริ่มต้นขึ้น ในอนาคต ความก้าวหน้าของปัญญาประดิษฐ์ทางการแพทย์ไม่เพียงแต่ขึ้นอยู่กับการพัฒนาทางเทคโนโลยีเท่านั้น แต่ยังต้องอาศัยความร่วมมืออย่างเต็มที่จากภาคอุตสาหกรรม มหาวิทยาลัย และงานวิจัยทางการแพทย์ รวมถึงการสนับสนุนจากผู้กำหนดนโยบายและหน่วยงานกำกับดูแล ความร่วมมือข้ามสาขานี้ถือเป็นกุญแจสำคัญในการบรรลุบริการทางการแพทย์ที่ผสานรวมปัญญาประดิษฐ์ และจะช่วยส่งเสริมการพัฒนาสุขภาพของมนุษย์อย่างแน่นอน


เวลาโพสต์: 30 ธันวาคม 2566