แผนภูมิเรดาร์ (Radar Chart) หรือแผนภูมิใยแมงมุม (Spider Chart) เป็นแผนภูมิสองมิติที่เรียบง่ายแต่เต็มเปี่ยมไปด้วยพลังแห่งการแสดงภาพข้อมูล (Data Visualization) มีลักษณะแกนพุ่งออกจากจุดศูนย์กลางคล้ายใยแมงมุม โดยแกนทั้งหมดมีการกระจายออกด้วยมุมที่เท่ากันและดึงออกจากกันอย่างสม่ำเสมอ แผนภูมิเรดาร์เหมาะสำหรับการนำเสนอข้อมูลหลากหลายตัวแปรตั้งแต่สามตัวแปรขึ้นไป โดยเฉพาะตัวแปรเชิงปริมาณ สามารถใช้เปรียบเทียบตัวชี้วัดต่าง ๆ เพื่อวิเคราะห์จุดแข็งและจุดอ่อนของสิ่งที่กำลังสนใจ ตัวอย่างเช่น การเปรียบเทียบความสามารถในการเขียนโปรแกรมด้วยภาษาต่าง ๆ ของพนักงาน
Big Data
ปัจจุบันนี้ หลายสิ่งรอบที่มีผลกระทบกับตัวเราทั้งทางตรง และ ทางอ้อม ล้วนแล้วมีการพยากรณ์ค่าในอนาคตด้วยกันทั้งนั้นไม่ว่าจะเป็น การพยากรณ์อุณหภูมิ 24 ชั่วโมงข้างหน้า ที่ช่วยให้เราพอจะคาดการณ์ได้ว่า จะหนาว หรือ จะร้อน การพยากรณ์ปริมาณฝุ่น PM2.5 ที่เป็นภัยต่อระบบทางเดินหายใจ การพยากรณ์ปริมาณน้ำฝน ที่ส่งผลต่อการวางแผนใช้ชีวิต หรือ กระทั่งการพยากรณ์จำนวนรถยนต์บนท้องถนน ซึ่งส่งผลต่อการวางแผนเดินทางของเราเป็นอย่างมาก
กลับมาอีกครั้งกับบทความเกี่ยวกับ Data Visualization ซึ่งในครั้งนี้จะเป็นการนำเสนอการประยุกต์ใช้งานแผนภูมิความร้อนกับข้อมูลอนุกรมเวลาให้ออกมาเป็นรูปแบบแผนภูมิความร้อนชนิดหนึ่งที่เรียกว่า แผนภูมิปฏิทินความร้อน (Calendar Heatmaps) ก่อนอื่น ๆ เลย เรามาทำความรู้จักเบื้องต้นเกี่ยวกับแผนภูมิความร้อน (Heatmaps) กัน กำเนิดแผนภูมิความร้อน ตัวอย่างสำคัญที่มีการใช้แผนภูมิความร้อนนี้ถูกทำขึ้นโดย Toussaint Loua ในปี 1873 เพื่อติดตามค่าสถิติทางสังคม
ในปัจจุบันการตรวจจับวัตถุด้วยรูปภาพ (Image Detection) เป็นเทคโนโลยีที่ใช้คอมพิวเตอร์ในการระบุและวิเคราะห์วัตถุที่อยู่ในรูปภาพ ซึ่งการใช้งานนั้นสามารถประยุกต์ใช้ในหลายรูปแบบ ตัวอย่างเช่น การระบุใบหน้าในภาพถ่ายที่เวลาพนักงานต้องเข้าตึกหรือที่เห็นตามหนัง การระบุสินค้าในคลังสินค้า รวมไปถึงในปัจจุบันที่รถยนต์สามารถขับแบบอัตโนมัติได้ก็จะมีการนำเทคโนโลยีนี้มาใช้งานด้วยเช่นกัน ดังนั้นในบทความนี้เราจะมาอธิบายถึงภาพรวมเพื่อให้เห็นภาพว่ามันคืออะไรครับ ประเภทของการตรวจจับวัตถุด้วยรูปภาพ ก่อนอื่นเลย คนที่เข้ามาใหม่หรือยังไม่คุ้นชินกับเรื่องรูปเท่าไหร่ อาจจะมีคำถามว่าเราทำ Image Detection ไปทำไม แล้วมีตัวอย่างให้เห็นภาพชัด ๆ ไหม
การคำนวณ Shapley Value เป็นเทคนิคที่สามารถใช้เพื่อตีความโมเดล Machine Learning ได้ทุกประเภท โดยอาศัยการคำนวณผลกระทบของฟีเจอร์ที่สนใจต่อค่าทำนายเฉลี่ยของเดล เพื่อดูระดับและทิศทางที่ปัจจัยต่าง ๆ ส่งผลต่อการทำงานของโมเดล ในบทความนี้เราจะมาดูตัวอย่างการใช้และตีความ Shapley Value พร้อมข้อดี ข้อจำกัด และข้อเสนอแนะในการใช้งานเทคนิคดังกล่าว
การวิเคราะห์ผลกระทบและความสำคัญ (Importance) ของ feature ที่ใช้ในโมเดล Machine Learning นั้นเป็นเครื่องมือสำคัญที่ทำให้นักวิเคราะห์สามารถนำโมเดลไปใช้ได้อย่างมีประสิทธิภาพ การคำนวณ Shapley value เป็นเทคนิคในการตีความโมเดลโดยพิจาณาจากผลกระทบของฟีเจอร์ที่สนใจต่อการผลการทำนายเฉลี่ย โดยสามารถใช้ตามโมเดลได้ทุกประเภทแม้จะเป็นโมเดลที่อธิบายได้ยาก