การพัฒนา AI ด้วยข้อมูลส่วนบุคคล โดยหลักการของ Federated Learning
ในปัจจุบันการนำระบบปัญญาประดิษฐ์หรือ AI มาใช้ในด้านการแพทย์และสาธารณสุขนับเป็นก้าวที่สำคัญของวงการ Big Data ไม่ว่าจะเป็นการใช้ AI เพื่อวินิจฉัยอาการป่วย หรือ พยากรณ์การระบาดของโรค ซึ่งถือว่าเป็นเครื่องมือสำคัญโดยเฉพาะในสถานการณ์การแพร่ระบาดของโรค COVID-19 อย่างไรก็ตามในการพัฒนาระบบ AI เหล่านี้จำเป็นต้องมีข้อมูลจำนวนมากเพื่อใช้ในการสอน AI ซึ่งข้อมูลเหล่านี้อาจจะรวมถึงข้อมูลที่อ่อนไหว เช่น ข้อมูลส่วนบุคคล การพัฒนา AI โดยปกป้องความเป็นส่วนตัวของเจ้าของข้อมูลจึงมีความสำคัญอย่างยิ่งสำหรับข้อมูลด้านสุขภาพโดยเฉพาะในปัจจุบันที่มีการบังคับใช้ พรบ. คุ้มครองข้อมูลส่วนบุคคล ถึงแม้ว่าการประกอบชุดข้อมูลเพื่อการวิเคราะห์และพัฒนา AI โดยทั่วไป จะละเว้นข้อมูลส่วนบุคคลที่ระบุตัวตน เช่น ชื่อ ที่อยู่ เบอร์โทรศัพท์ และเลขบัตรประชาชน แต่สำหรับชุดข้อมูลสุขภาพ ข้อมูลทั้งหมดสามารถถือว่าเป็นข้อมูลส่วนบุคคลที่สามารถระบุตัวตนคนไข้ได้ดังนั้น การพัฒนา AI จึงต้องมีหลักการเพื่อปกป้องข้อมูลส่วนบุคคล จึงเป็นที่มาของวิธีการที่เรียกว่า Federated learning ซึ่งเป็นหนึ่งในกลไกการพัฒนา AI ที่สามารถใช้ในการปกปิดข้อมูลส่วนบุคคลได้ (Privacy-preserving Machine Learning) โดย Federated learning เป็นกลไกการเรียนรู้ของ AI ผ่านข้อมูลและโมเดลจากหลากหลายระบบโดยไม่ต้องแลกเปลี่ยนข้อมูลจริงต่อกัน

ในงานสัมมนา CogX ณ กรุงลอนดอน ซึ่งเป็นงานสัมมนาด้าน AI ที่ใหญ่ที่สุดงานหนึ่ง นพ. เอริค โทโป้ล์ แพทย์หัวใจผู้เชี่ยวชาญในงาน AI ทางการแพทย์ ได้ทวีตบทความจากนิตยสาร Nature ที่กล่าวถึงความเป็นไปได้ของการใช้ Federated learning ในการสร้างชุดข้อมูลรูปภาพถ่ายทางการแพทย์ที่มีปริมาณและคุณภาพมากยิ่งขึ้น โดยคุณหมอมีความคิดเห็นว่าการพัฒนากลไกการปกป้องข้อมูลส่วนบุคลลจะมีผลประโยชน์ต่อการสร้างมาตรฐานอุตสาหกรรมที่มีคุณภาพมากยิ่งขึ้นโดยที่สามารถปกปิดข้อมูลภายในแต่ละธุรกิจได้ และสามารถนำข้อมูลไปใช้ปรับปรุงการให้บริการของธุรกิจต่าง ๆ โดยที่ ไม่ต้องเก็บข้อมูลส่วนบุคคลจากลูกค้า
เบลส ทอมสัน CEO ของบริษัท Bitfount ผู้พัฒนาซอฟต์แวร์ด้านการแลกเปลี่ยนข้อมูล ได้กล่าวเพิ่มเติมว่า Federated learning อาจจะมีผลกระทบต่อการค้าผูกขาดในวงการของการพัฒนา AI โดยท่านได้อธิบายว่า Federated learning จะทำให้ผลประโยชน์จากการค้าแบบผูกขาดน้อยลงเพราะการแลกเปลี่ยนข้อมูลเพื่อประกอบการพัฒนา AI จะง่ายขึ้น ซึ่งท่านเป็นผู้ผลักดันกลไกการปกป้องข้อมูลส่วนบุคคลที่เรียกว่า Multi-party computation ซึ่งเป็นการใส่ค่ารบกวนทางสถิติในข้อมูลก่อนนำข้อมูลไปประยุกต์ใช้ต่อ
ฮาซาน มาหมุด นักวิชาการด้าน AI และ Machine learning อาวุโสที่ Digital Catapult ณ สหราชอาณาจักร ซึ่งเป็นองค์กรรัฐที่มีภารกิจด้านการผลักดัน Startup เช่น เดียวกับสำนักงานส่งเสริมเศรษฐกิจดิจิทัล หรือ depa ในประเทศไทย ได้บรรยายว่าหลักการของ Federated learning คือการพัฒนาเครือข่าย AI จาก AI ย่อยหลาย ๆ ตัว โดยแต่ละ AI ย่อยจะมีการพัฒนาขนานกันด้วยชุดข้อมูลเฉพาะของ AI ย่อยนั้น ๆ ส่วนระบบเครือข่ายมีไว้เพื่อเรียนรู้ลักษณะของ AI ย่อยแต่ละตัวเพื่อประกอบเป็น AI หลัก ปัญหาหลักของ Federated learning คือการเชื่อมต่อและการแลกเปลี่ยนข้อมูลระหว่างระบบ AI ย่อยที่มีการพัฒนาในรูปแบบที่แตกต่างกัน เช่น Google Nvidia WeBank ฯลฯ ดังนั้น คุณ ฮาซาน มาหมุด และทีมจึงมีการทำนำร่องระบบ Federated learning และได้กล่าวว่า “ถึงเวลาที่พวกเราจะสร้างระบบกลางที่ทุกคนสามารถเชื่อถือและใช้ได้”

(i) สร้าง AI เริ่มต้นจากข้อมูล AI ระบบกลาง
(ii) สอน AI ด้วยข้อมูลบนเครื่องผู้ใช้งาน
(iii) ส่งผลการเรียนรู้ของ AI บนเครื่องให้กับ AI ระบบกลาง
อย่างไรก็ตาม โอลิเวียร์ ซมิท ผู้อำนวยการด้านยุทธศาสตร์และหัวหน้าด้านจริยธรรม Health Moonshot บริษัทลูกของ Telefonica Innovation Alpha ซึ่งเป็นบริษัทโทรคมนาคมของประเทศสเปน และทีมของเขาได้ทดลองพัฒนา AI โดยปกป้องข้อมูลส่วนบุคคลมาแล้ว 6 โครงการ ท่านมีให้ข้อสรุปว่า “ความฝันของผมที่พวกเราจะได้ใช้เทคโนโลยีเดียวสำหรับทุกโครงการนั้น ไม่เป็นความจริงได้” โดยการประยุกต์ใช้กลไกการปกป้องข้อมูลส่วนบุคคลจะต้องเปลี่ยนไปตามความเหมาะสมกับชุดข้อมูลและโจทย์ แต่ถึงกระนั้น ท่านเห็นถึงความเป็นไปได้ของการพัฒนา AI ด้วยข้อมูลส่วนบุคคลและกล่าวว่า “ทุกกลไกที่เราได้ทดลองใช้ มีหลักการทางคณิตศาสตร์ที่พิสูจน์ได้ว่า ข้อมูลไม่สามารถระบุตัวตนของเจ้าของข้อมูลได้ เพราะฉะนั้นเรามาในถูกทางแล้ว เราแค่ต้องไปให้ถึง”
จะเห็นได้ว่าการพัฒนาระบบ AI ที่ต้องอาศัยข้อมูลส่วนบุคคลนั้น จะต้องมีการพิจารณาอย่างถี่ถ้วนถึงกระบวนการในการปกปิดความเป็นส่วนตัวของข้อมูล ซึ่งกระบวนการ Federated Learning นับเป็นตัวเลือกที่มีความเป็นไปได้ในการจัดการปัญหานี้ ในอนาคตเราอาจจะได้เห็น AI ที่จะช่วยอำนวยความสะดวกให้เราในหลากหลายรูปแบบ โดยไม่ต้องกังวลว่าข้อมูลส่วนบุคคลของเราจะถูกเผยแพร่ออกไป
แหล่งที่มา : https://fortune.com/2020/06/16/privacy-preserving-a-i-is-the-future-of-a-i/