สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน)

Logo BDI For web

Data Scientists พวกเค้าคือใคร?

May 10, 2021

บทความนี้จะขอแนะนำสายอาชีพด้านข้อมูลจากประสบการณ์ตรงของ Data Scientists จำนวน 4 ท่าน ที่ได้มาพูดคุยกันใน Clubhouse event เมื่อวันที่ 7 พ.ค. ที่ผ่านมา ซึ่งบทความนี้ได้สรุปเนื้อหาบทสนทนาจาก event ดังกล่าว ตามหัวข้อที่เกิดขึ้นจริงในระหว่างการสนทนา

Clubhouse event นี้เป็นส่วนหนึ่งของความร่วมมือระหว่าง GBDi (the Government Big Data Institute) และ ASEAN CIO Association Club (ACIOA) ในการส่งเสริมการสร้างความรู้ความเข้าใจด้านข้อมูล (Data Literacy) ในภูมิภาคอาเซียน

งานในวันนี้จัดขึ้นมาได้ยังไง

ACIOA: ต้องเล่าย้อนก่อนว่า ASEAN CIO Association (ACIOA) คือสมาคมของ Chef Information Officer (CIO) ใน ASEAN ที่ก่อตั้งโดยคุณชัยเจริญ และก็มีคุณ Hongsin และคุณใหม่เข้ามาช่วย ส่วนคุณศักดิ์เป็นที่ปรึกษาของ ACIOA แล้วปีนี้เรากำลังสร้าง ASEAN Data Club ที่เป็นชุมชนของผู้ที่สนใจข้อมูล ซึ่งได้ร่วมมือกับ GBDi เพื่อดูแลในส่วนของประเทศไทย

GBDi: โดยงานในวันนี้จะเป็นการทำความรู้จักกับบุคคลที่เรียกตัวเองว่า Data Scientist ว่าพวกเค้าเป็นสิ่งมีชีวิตแบบไหน ในแต่ละวันพวกเค้าต้องเจออะไรบ้าง และทุกวันนี้ที่คนต่างสนใจงานสาย Data Science ความจริงแล้วมันสวยงามแบบนั้นจริงหรือ พร้อมกับเรื่องราวที่น่าตื่นเต้นจากผู้มีประสบการณ์ตรงในองค์กรชื่อดังทั้ง 4 ท่าน ได้แก่ คุณอ้วน พงษ์เศรษฐ์ แตงเส็ง, คุณนิว นวีน ปิติพรวิวัฒน์, คุณพินพิน พิณนรี ธีร์มกร, และคุณมิค วิชญ์พงศ์ ดรุณธรรม

แนะนำตัวเองกันหน่อย เป็นใคร มาจากไหน และกำลังทำอะไรอยู่

คุณอ้วน: จบปริญญาตรีและโททางด้าน Computer Science จาก SIIT ธรรมศาตร์ และจบปริญญาเอกทางด้าน Information Science ที่ Tohoku University ประเทศญี่ปุ่น ก่อนหน้านี้เป็น Data Scientist ที่ Tencent ประเทศไทย และตอนนี้เป็น Machine Learning Engineer ที่ Shopee สิงคโปร์

คุณมิค:  เป็น Data Scientist ที่ Predictive เรียน Communication ที่ SIIT ตอนปริญญาตรี และเรียนต่อที่ University College London เพิ่งเปลี่ยนมาเป็น Data Scientist ประมาณ 3-4 ปี เคยทำพวก E-Commerce มาก่อน ตอนนี้ทำงานให้คำปรึกษาเป็นส่วนใหญ่

คุณพินพิน: จบปริญญาตรี โท และเอก ด้านวิศวะไฟฟ้าที่ Stanford University ตอนนั้นงาน Research ทำเกี่ยวกับ Computational Psychology ซึ่งก็คล้าย ๆ กับ Data Science ในปัจจุบัน ส่วนตอนนี้เป็นอาจารย์ที่ Sasin School of Management และ Program Manager ที่ Vectors Angel

คุณนิว: เป็น Data Scientist อยู่ที่ Infinitas ที่กรุงไทย ดูแลโปรเจกต์ต่าง ๆ ของกรุงไทย เช่น โปรเจกต์ภาครัฐต่าง ๆ ไม่ว่าจะเป็น คนละครึ่ง หรือชิมช้อปใช้ ก่อนหน้านี้เคยทำงานอยู่ที่ NocNoc และ Line ก็เป็น Data Scientist, Data Analyst และ Programmer เรียน Computer ที่จุฬา และต่อปริญญาโทที่ฮ่องกง

ก่อนมาทำงานด้านนี้ รู้จักคำว่า Data Science เมื่อไหร่และรู้จักได้ยังไง

คุณพินพิน: รู้จักเมื่อ 7-8 ปีก่อนตอนที่เรียนปริญญาตรีที่ Standford แล้วก็เห็นคนทำด้านนี้ แล้วอาจารย์ที่ปรึกษาก็บอกว่าอันนี้น่าจะเป็น Science of the future ตอนนั้นก็เป็นครั้งแรกที่ได้ยินคำว่า Data Science และ Data Scientist

คุณนิว: รู้จักตอนปริญญาโท เนื่องจากหลักสูตรที่ไปเรียนต้องทำวิจัยด้วย และช่วงนั้นต้องทำ Data Analytics และ Data Visualization ก็เข้ามาพอดี ทำให้ได้เรียนรู้เทคนิคต่าง ๆ เลยทำให้ได้เข้ามาในวงการนี้โดยไม่รู้ตัว

ว่าแต่ว่า Data Science คืออะไร

คุณอ้วน: Data Science คือวิทยาศาสตร์ที่เกี่ยวกับข้อมูล เนื่องจากเรามีข้อมูลจำนวนมาก แล้วเราอยากจะทดลองอะไรกับมัน อยู่ที่ว่าเราอยากจะรู้อะไรจากข้อมูลของเราล่ะ อย่างเช่น มีลูกค้าที่ใช้ product เรา มีกี่คนที่ใช้ฟรี มีกี่คนที่เสียเงิน แล้วพฤติกรรมของผู้ใช้ทั้งสองกลุ่มนี้ แตกต่างกันยังไง ก็เป็นคำถามที่เราดึงออกมาจาก Data เป็นสมมติฐานที่เราได้จาก Data

ทำไมถึงมาเป็น Data Scientist

คุณนิว: ก่อนหน้านี้ Data Science เป็นสาขาใหม่ ตอนแรกก็ไม่ได้ตั้งใจว่าจบมาจะมาทำงานด้านนี้หรอก แต่บังเอิญเข้ามาอยู่ในวงการนั้น ตอนจบมาใหม่ ๆ ก็หางานเกี่ยวกับ Data Science แต่หาไม่ได้เลย ก็ได้งานเกี่ยวกับ Software Engineer ก่อน จนกระทั่งมีฝ่ายอื่นเข้ามาชวนว่าต้องการคนที่เขียนโค้ดได้ วิเคราะห์ข้อมูลเป็น ทำ Dashboard ได้นิดหน่อย ตอนนั้นก็ไม่รู้หรอกว่ามันคือ Data Scientist เป็นความสัมพันธ์ที่ไม่มีชื่อเรียก ทำงานไปสักพักก็รู้สึกว่าวงการนี้น่าสนใจ ก็ศึกษาเพิ่ม และในท้ายที่สุดก็เข้ามาในวงการนี้เต็มตัว

คุณพินพิน: คล้าย ๆ กัน ก็มาแบบไม่รู้ตัว แต่ก็สนใจทางด้านการคำนวณและสถิติอยู่แล้ว ตอนทำ Research ด้านจิตวิทยา ก็มีการเก็บข้อมูล และนำวิเคราะห์ข้อมูลอยู่แล้ว แต่ตอนหลัง ๆ ก็มีเทคโนโลยีใหม่ ๆ พวก AI หรือว่า Big Data เพื่อวิเคระห์ข้อมูลที่เยอะเป็นล้าน ๆ และอยากจะวิเคราะห์ว่าข้อมูลเหล่านั้นมีความหมายในเชิงจิตวิทยารึเปล่า แต่เราจะตอบคำถามนี้ได้ยังไง ด้วยความอยากที่จะตอบคำถาม แต่จะตอบได้ก็ต้องหาข้อมูล ก็เลยกลายเป็นการทำ Data Science โดยปริยาย ก็เพิ่งได้ชื่อว่าเป็น Data Scientist ก็ตอนกลับมาที่ไทยเนี่ยแหละ

คุณอ้วน: ของผมจะแตกต่างจากทั้งสองคนนะครับ ตอนผมเรียน ป.เอก ผมเรียนเน้นไปที่ Computer Vision พวก Deep Learning แล้วตอนที่หางานก็เสิร์ชด้วยคีย์เวิร์ดพวกนี้ใน Jobsdb แล้วก็มีตำแหน่งนี้เสนอมา ถึงได้เป็น Data Scientist

คุณมิค: โดยส่วนตัว ที่ชอบ Data Science เป็นเพราะว่ามันเป็นส่วนผสมของสิ่งที่ชอบไม่ว่าจะเป็นคณิตศาสตร์ สถิติ แคลคูลัส ความน่าจะเป็น และก็มีส่วนของการเขียนโปรแกรม และส่วนที่เป็นวิทยาศาสตร์ ก่อนจะมาเป็น Data Scientist ก็ได้ทำ Program สำหรับการจัดการ Document บางอย่างของบริษัท แล้วถึงจะมารู้จักเกี่ยวกับ Data Science แล้วค่อยผันตัวเองมาเป็น Data Scientist

เป็น Data Scientist นี่วัน ๆ เค้าทำอะไรกันบ้าง

คุณมิค: แล้วแต่ลักษณะงานและลักษณะของบริษัท อย่างเช่น อยู่ที่บริษัท E-Commerce โจทย์งานจะเป็นการพัฒนาโมเดล การทดสอบโมเดล และการเอาผลไป Feedback กับลูกค้า แต่ตอนนี้ย้ายมาทำงานด้าน Consult มากขึ้น ก็มี Business Case ที่หลากหลายมากขึ้น

แล้วมีความแตกต่างยังไงบ้าง

คุณมิค: ให้คำปรึกษาและการ Implement Machine Learning Pipeline ก็เป็นการส่งมอบโมเดลต่าง ๆ ให้กับลูกค้าทั้งอสังหาฯ ประกัน และอื่น ๆ ก็ต้องเตรียมตัวมากขึ้น และหา Pain Point ของลูกค้าก่อน และไปเลือกเครื่องมือใน Machine Learning ที่เหมาะสมกับลูกค้า เช่น สำหรับ Recommendation Model ก็ต้องรับข้อมูลเชิงพฤติกรรมของลูกค้า และก็มาวิเคราะห์ผ่านโมเดล เพื่อส่งผลการแนะนำสินค้า โดยจากรูปแบบการเลือกซื้อสินค้าของลูกค้า เราจะสร้างผลการแนะนำอย่างอัตโนมัติและยังตอบโจทย์ของลูกค้า

ใช้เครื่องมืออะไรในการวิเคราะห์ข้อมูล

คุณพินพิน: เครื่องมือก็มีหลายอย่างเลยนะ อาจเช่น Python และถ้าข้อมูลที่ใหญ่ขึ้นก็อาจต้องเตรียมข้อมูลจากหลาย ๆ เครื่อง ก็อาจขยับไป Spark หรือ Hive หรือถ้าไปทางสาย AI ก็เป็น Tensorflow, Keras หรือ Pytorch ประมาณนี้ แต่หลัก ๆ แล้วเครื่องมือหากินของพวก Data Scientist จะเป็นการเขียนโปรแกรม และ library (ตัวช่วยในการเขียนคำสั่งต่าง ๆ ที่คนอื่นเขียนมาไว้ให้แล้ว) ต่าง ๆ ก็คือจะใช้เครื่องมือเหมือน Programmer ทั่วไปแต่จะใช้ความสามารถบางอย่างในการทำให้ความหมายของข้อมูลมีมากขึ้น เพราะว่ามันมีข้อมูลมากเกินกว่าที่เราจะมานั่งเขียนในกระดาษ และความหมายจะเกิดขึ้นได้เมื่อเรามีข้อมูลจำนวนมากพอ

GBDi: เครื่องมือที่ Data Scientist ใช้จะเกิดขึ้นตลอดเวลาเลย ถ้าหากเมื่อย้อนไปเมื่อ 10 ปีที่แล้วอาจจะยังไม่ได้มีเครื่องมือที่ใช้กันอย่างแพร่หลายอยู่ก็ได้ แสดงว่าต้องมี Mindset อะไรบางอย่างที่ Data Scientist ต้องมี อย่างเช่น การพร้อมที่จะเรียนรู้สิ่งใหม่ ๆ ตลอดเวลา

คุณอ้วน: ใช่ครับ เราต้องอย่ากลัวที่จะต้องเรียนรู้สิ่งใหม่ ๆ ต้องพร้อมที่จะเรียนรู้สิ่งใหม่ ๆ อยู่ตลอดเวลา

คุณมิค: อยากจะเพิ่มในส่วนของ SQL ที่จัดการข้อมูลที่เป็นตาราง คิดว่า SQL ก็สำคัญในส่วนของการนำเข้าข้อมูลก่อน

คุณนิว: นอกจาก SQL แล้วก็อาจจะมีเครื่องมือที่ไม่ได้ซับซ้อนมากมาย เช่น Excel เพราะข้อมูลส่วนใหญ่ที่อยู่ในภาคธุรกิจมันน่าจะเป็น Excel อยู่แล้ว ถ้านำไปเขียน Python หรือเก็บ Database แล้วเอา SQL มาอาจจะไม่ทันการ

คุณพินพิน: มีอีกตัวนึงคือ Pandas ชีวิตก่อนรู้จัก Pandas แบบร้องไห้ พอรู้จัก Pandas แล้วแบบทำทุกอย่างได้

แบบนี้ผู้ที่เคยเป็น Business Intelligence สามารถเป็น Data Scientist ได้เปล่า

คุณพินพิน: เดี๋ยวนี้ Business เปลี่ยนมาเป็น Data-Driven แล้ว การให้ Data Scientist ต้องเรียนรู้สิ่งใหม่ ๆ และยิ่งมีความรู้จาก Business และบวกความรู้จาก Data Science จะช่วยให้การวิเคราะห์ข้อมูลดีขึ้น

คุณมิค: ผมคิดว่า Gap ระหว่าง Data Scientist และ Business Intelligence ไม่ห่างกันมากเลย เพราะไม่ว่าจะเป็นทักษะในการเขียนโปรแกรมเบื้องต้นที่คล้ายกันอยู่แล้ว เช่น การทำ Customer Segmentation โดยนำข้อมูลของลูกค้าแต่ละกลุ่มมาโชว์ ซึ่งถ้าวิเคราะห์ต่อไปอีกนิดนึงก็จะกลายเป็น Data Scientist ได้แล้ว

จำเป็นต้องใช้สถิติมากน้อยแค่ไหนในการทำงานด้าน Data Science

คุณอ้วน: ผมมาจากด้าน Deep Learning ก็ไม่ได้ใช้สถิติที่ลึกมาก ตอนที่เรียนก็ไม่ได้เจาะคอร์สที่สถิติมาก ก็ไม่ได้ใช้มากนะครับ

คุณพินพิน: ถ้าถามว่าต้องใช้มั้ย มันจะเป็นประมาณว่าไม่ต้องรู้ลึกขนาดถึงเป็น Doctor ด้านสถิติ แต่เราสามารถใช้ประโยชน์จากสถิติในการมองภาพรวมของข้อมูลในเบื้องต้น และควรวิเคราะห์ข้อมูลไปทางไหน และใช้เครื่องมืออะไรที่เหมาะสมกับข้อมูล อาจจะไม่ต้องรู้เยอะมาก ก็ทำได้

คุณนิว: จะบอกว่าสุดท้ายคือคณิตศาสตร์ พวกแคลคูลัสและเมทริกซ์ และในสถิติพื้นฐานแล้วน่าจะมีที่สำคัญ ๆ ก็คือเป็นการทดสอบสมมติฐาน และ Distribution ต่าง ๆ มันจะทำให้เราเข้าใจพื้นฐานและ Assumption ต่าง ๆ ของโมเดลได้ดียิ่งขึ้น

ที่เคยคิดไว้ในการเป็น Data Scientist กับประสบการณ์จริงที่ได้เจอมา แตกต่างกันบ้างมั้ย

คุณนิว: การเป็น Data Scientist ที่วาดภาพไว้ในจินตนาการจะเป็นการที่ได้ข้อมูลมา ก็สำรวจข้อมูลว่ากระจายตัวยังไง แล้วก็เขียนโมเดล ใช้งาน วัดผล แต่จริง ๆ แล้วมันไม่ใช่อย่างนั้นเลยครับ งานของ Data Scientitst ที่กล่าวมานั้นแค่ส่วนหนึ่งครับ แต่หลัก ๆ แล้วเราจะต้องมีการประชุมเพื่อเก็บ Requirements จาก Users เพราะว่าการทำโมเดลที่ดี ก่อนการทำโมเดลล้ำ ๆ ขึ้นมาเราต้องเข้าใจก่อนว่าเดิมทีแล้วเค้าใช้อะไร เค้าตัดสินใจยังไง จนกระทั่งเราได้ทราบโจทย์จริง และได้ข้อมูลมาแล้ว และเมื่อได้ข้อมูลแล้ว มันก็ไม่ได้ข้อมูลที่หน้าตาง่าย ๆ เหมือนที่เรียน ข้อมูลส่วนใหญ่ค่อนข้างใหญ่และซับซ้อน ก็ต้องเสียเวลามากในการ Preprocess ข้อมูล แล้วหลังจากนั้นก็สร้างโมเดล วัดผล ใช้งาน แล้วก็กลับไปถามผู้ใช้ว่ามันเวิร์คมั้ย ประสิทธิภาพเพิ่มขึ้นมั้ย มันแม่นมั้ย ถ้าไม่แม่นแล้วควรจะแก้ตรงไหน คือมันเป็น Iterative Process ซึ่งจะไม่ใช่การทำแล้ววัดผลเสร็จก็จบไปเลย

มีทักษะอะไรในการ convince ผู้บริหารได้ยังไง หรือการสื่อสารให้เค้าเชื่อว่าสิ่งที่เราทำมันเวิร์ค

คุณนิว: อาจจะลองเริ่มจาก Pilot Project ให้ลอง เป็นการทดลองเล็ก ๆ ถ้ามันสำเร็จก็ลองไป Implement ที่อื่นก่อน ถ้ามันเวิร์คแล้ว ผมเชื่อว่าผู้บริหารน่าจะเข้าใจ

คุณพินพิน: คิดว่า Visualization Skill น่าจะมีประโยชน์ เพราะว่าการมี Storytelling ที่ดีจะทำให้ผู้บริหารเห็นภาพว่างานที่เราทำมามีความสำคัญยังไง

มีวิธีสื่อสารกับ Domain Expert ยังไง เค้าอาจจะไม่รู้ทางด้านการเขียนโปรแกรม เราจะสื่อสารเพื่อให้ทำงานร่วมกันได้อย่างไร

คุณมิค: อาจจะถามเค้าเป็นความเห็นว่ามีข้อมูลตัวไหนที่คิดว่ามีความสำคัญในการสร้างโมเดลช่วยตัดสินใจ ในการช่วยทำนาย โดย Domain Expert ตรงนั้นอาจจะช่วยให้เราทำงานได้ตรงจุดมากขึ้น

GBDi: มันมีแนวคิดของ Explainable AI ที่เราพยายามสร้างโมเดลที่สามารถอธิบายความเป็นไปของมัน ทำให้ผู้บริหารหรือเหล่า Domain Expert ที่ไม่ได้มีพื้นฐานเลยเข้าใจได้ สมมติว่า Data Scientist ได้ทำโมเดลออกมาสองตัว ตัวหนึ่งผลใช้ได้ดีและอธิบายการทำงานของมันได้ง่ายมาก อีกตัวหนึ่งผลออกมาดีเยี่ยมแต่ต้องมองโมเดลเหมือนเป็น “กล่องดำ” (black box) ที่อธิบายการทำงานของมันได้ยาก Data Scientist ผู้นั้นอาจควรเลือกใช้โมเดลที่ง่ายกว่า เพราะถึงแม้ว่าผลออกมาไม่ดีที่สุด แต่มีโอกาสสื่อสารกับ Domain Expert หรือผู้บริหาร แล้วได้รับการตอบสนอง เชื่อมั่น พร้อมรับสิ่งที่ได้ทำขึ้นไปใช้จริงในธุรกิจมากกว่าโมเดลที่ผลดีเยี่ยมแต่เป็น “กล่องดำ”

มีสิ่งที่อยากให้ Domain Expert ทำความเข้าใจใน Data Scientist บ้างมั้ย

คุณพินพิน: เรื่องการสื่อสารเป็นเรื่องสำคัญ เพราะ Soft Skills เป็นสิ่งที่จำเป็นในการทำงานด้าน Data Scientist จริง ๆ ก็ทุกศาสตร์เลยนะ เพราะว่าตอนที่เราทำโปรแกรม เราอาจจะไปโฟกัสกับการทำโปรแกรมซึ่งมันใช้เวลานาน และมันอาจจะกลายเป็นว่าโดนตัดขาดจากผู้คน สิ่งหนึ่งที่อยากให้ฝั่ง Business เข้าใจ ก็คือ การจะเกิดสิ่งที่รวดเร็วก็ตาม เช่นการซื้อของออนไลน์ที่กดไม่กี่ปุ่มนั้น เบื้องหลังแล้วมันต้องใช้เวลาในการพัฒนา และอาจใช้เวลานาน บางทีอาจจะมี Bug ด้วย แต่อยากให้เข้าใจว่ามันคือ Iterative Process ว่ามันจะค่อย ๆ พัฒนาไปเรื่อย ๆ

คุณนิว: เวลา Data Scientist ไปคุยกับฝั่ง Business เค้ามักจะบอกว่าเค้าอยากได้อะไร โดยที่ไม่ได้ไปพูดคุยกันถึงปัญหาที่แท้จริง เช่น มีอยู่ครั้งหนึ่งทาง Business อยู่ ๆ ก็มาบอกว่าอยากได้ Chat Bot โดยต้องเข้าใจก่อนว่า Chat Bot มันจะเก่งกับคำถามที่เป็น Fact เท่านั้น ซึ่งไม่ใช่ว่ามันจะตอบได้ทุกคำถาม พอได้ลองไปคุยกับทางฝั่ง Business ก็พบว่าปัญหาที่แท้จริงมันคือการสื่อสารภายในองค์กรมากกว่า เป็น Process ต่าง ๆ ซึ่งวิธีแก้ปัญหาไม่ใช่เป็นการสร้าง Chat Bot แต่เป็นการปรับปรุง Process คือตอนเวลาคุยอย่าเริ่มด้วย solution มาคุยกันก่อนว่าปัญหาคืออะไร แล้วเราจะแก้ปัญหาอะไร และอยากให้เข้าใจเวลาข้อมูลไม่สามารถแก้ปัญหาทุกอย่างบนโลกได้ หรือถ้ามันแก้ได้ก็อาจจะใช้ต้นทุนที่สูง เพราะว่าบางทีมันอาจจะไม่คุ้มที่จะแก้ปัญหาด้วยก็ได้

ตอนนี้ตลาดของ Data Scientist เป็นยังไงบ้าง หากสนใจทำงานด้านนี้ ยังทันมั้ย  

คุณอ้วน: ตอนนี้ยังไม่พอนะ ตอนนี้คนที่จบคอมมาก็ไม่ได้ดีพอ เพราะว่าบางคนทีได้สัมภาษณ์ Candidate หลาย ๆ คน คือการที่ได้จากการเรียนออนไลน์เรารู้แล้วไงครับว่ามีเป้าหมายอะไร คือโจทย์ส่วนใหญ่มันจะมี Objective มาให้แล้ว คือมันก็โอเคแหล่ะที่ทำตรงนั้นได้ แต่ในชีวิตจริงบางทีเราต้องเป็นคนกำหนดเอง ตั้งแต่ Objective เป็นยังไง จะตั้งสมมติฐานเป็นยังไง จะใช้ข้อมูลไหน จะเอาข้อมูลมารวมกันยังไง กระบวนการไหน แล้วจะใช้งาน จะสรุปยังไง คือต้องทำทั้ง Project Life Cycle ได้ตั้งแต่เริ่มต้นไปจนถึงปิดโปรเจกต์ เราต้องทำตรงนี้ได้ด้วย ซึ่งตอนนี้ยังขาดคนแบบนี้เยอะมาก

คุณพินพิน: เพราะว่าสกิลของ Data Scientist จากที่พูดในตอนนั้นคือการต้องเรียนรู้สิ่งใหม่ ๆ อยู่เสมอ เพราะฉะนั้นคนที่เพิ่งเข้ามาในวงการนี้ก็ไม่ต้องกังวลว่าถ้า Data Science เลิกฮิตแล้วจะทำยังไงดี ก็ไม่เป็นไรค่ะ ก็ไปเรียนรู้สิ่งอื่นต่อก็ได้ และในตอนนี้ก็มีหลาย Platform ที่ช่วยให้เราได้สกิล Data Science ด้วย เช่นจาก Kaggle หรือตาม blog จาก Medium ด้วย

คุณนิว: อาจจะลองไปดูในเพจ Data น่าฟาด ก็ลองเข้าไปดูได้นะครับ และผมอยากเสริมอย่างนี้ครับ คือ ผมมองว่า Data Scientist คล้าย ๆ กับศิลปินนะครับ เพราะว่าการที่เรามีวาดรูปสวย เราวาดรูปเก่ง นั่นคือเราต้องมีผลงาน คือการเรียนออนไลน์เป็นการที่เค้าป้อนทุกอย่างมาให้เราแล้ว แต่ชีวิตจริงไม่มีใครมาทำให้เราเลย บางทีการขอเข้าถึงข้อมูล เช่น Database ก็อาจจะใช้เวลาเป็นวันเลย อาจไปลองเริ่มจาก Kaggle ก็ได้ ที่จะมี Open Dataset ให้ลองเล่นได้ แล้วก็จะมีคนที่เคยวิเคราะห์แล้วเค้าเจออะไร เค้าก็มาแชร์กันใน Notebook มากกว่านั้น อาจจะลองไปอ่านจากคนที่มีคนโหวตเยอะ ๆ ก็ได้ และผมมองว่าการที่เรารู้อะไรแล้วมาเล่าต่อ จะช่วยให้เราเรียบเรียงความคิดได้ดี ซึ่งเป็นสิ่งที่คอร์สออนไลน์ไม่ได้สอน ถ้าจบไม่ตรงสาย แต่อยากทำงานสาย Data ขั้นแรกก็ต้องสร้าง Skill ก่อน

แต่คือถ้าเราต้องศึกษาด้วยตัวเองแล้ว และเราจะมีโอกาสได้ทำงานในด้านนี้มากน้อยแค่ไหน

คุณมิค: อันนี้ขอตอบเพราะว่าเป็นคนที่จบมาไม่ตรงสายนะครับ เพราะผมจบวิศวะมาก่อนครับ ผมคิดว่าการเรียนคอร์สออนไลน์ก็เป็นสิ่งที่ดีนะครับ แต่การศึกษาแบบนี้ ถ้าเราทำมาสักพักมันจะอิ่มตัว อาจจะต้องพยายามดันตัวเองให้ได้ทำโปรเจกต์อะไรที่ได้ลงมือจริง ๆ หรือว่าลองแข่ง hackathon หรือไม่ก็มีอะไรมาแชร์ตามที่ท่านอื่นได้นำเสนอไป มันจะเป็นการเรียนรู้ที่ก้าวกระโดดเลยครับ

นอกจาก data scientist แล้วมีสายงานอื่นที่เกี่ยวข้องกับข้อมูลอีกเปล่า

คุณอ้วน: สำหรับผมนะ Data Scientist กับ Machine Learning Engineer คำจำกัดความของมันไม่ค่อยเคลียร์ บางที Data Scientist ต้องเขียน API ด้วยนะ หรือ Machine Learning Engineer ก็อาจจะต้องทำ Dashboard ด้วย ครับ แล้วก็มี Data Engineer นี่คือผู้เตรียมข้อมูลป้อน Data Scientist เพื่อช่วยให้ Data Scientist ทำงานได้สะดวกขึ้น แต่มันก็ขึ้นกับขนาดของบริษัทนะ ถ้าบริษัทขนาดเล็ก บางที Data Scientist ก็ต้องทำทุกอย่างเลย แต่ถ้าบริษัทใหญ่ก็อาจมีการแยกตำแหน่งออกไปได้ เช่น Machine Learning Engineer ก็เอาโมเดลที่สร้างมาแล้วมาใช้งาน เปลี่ยนจาก Python เป็น C++ และอาจมี Data Analyst หรือ Visualizer เพื่อสร้าง Dashboard อย่างเดียวเลย

คุณนิว: เนื่องจากตำแหน่งนี้มันใหม่มาก แล้วคนจะงง ๆ ว่าจะเอาเราไปทำอะไรนะ พอเห็น Data ก็ให้เราทำก่อน แต่คิดว่า Data Engineer น่าจะดูที่การไหลของข้อมูลจากที่หนึ่งไปสู่อีกที่ แล้วก็ไปรวมที่ Data Lake แล้วพอ Data Scientist ก็นำไปใช้ต่อเพื่อสร้างโมเดล หลังจากนั้นก็ส่งโมเดลไปให้ Machine Learning Engineer เพื่อ Optimize โค้ดต่าง ๆ ให้มีประสิทธิภาพสูงสุด แต่ก็อย่างที่คุณอ้วนบอกครับบางทีทั้งหมดนี้อาจจะถูกโยนให้คน ๆ เดียวทำหมดเลยก็ได้

มีอะไรฝากถึงผู้ที่สนใจด้าน Data Science บ้างมั้ย 

คุณอ้วน: ดีครับ ขอให้ประสบความสำเร็จครับ คือจริง ๆ ผมชอบนะในการทำงาน Data Science จริง ๆ ผมรู้สึกว่ามันไม่เป็นการทำงานที่ทรมานเลยนะ บางทีผมนั่งอ่าน นั่งทำมา อ่าวนี่เที่ยงคืนแล้วหรอ เป็นบ่อยมากเลยนะ คือถ้าใครที่ชอบ จัดการเลยครับ ผมแนะนำเลยครับ

คุณพินพิน: ใช่เลย ถ้าใครสนใจก็ทำเลย แล้วก็มันเป็นสาขาที่ถ้าไม่ลงคอร์สเรียนก็น่าจะทำได้ แต่ถ้าใครงบเยอะก็อ่านลงเรียนปริญญาหรือลงคอร์สออนไลน์ที่มีคนตรวจการบ้านให้ หรือจะเรียนคอร์สออนไลน์เอง หรือจะดู Youtube ต่าง ๆ คือมันเลือกได้ตามใจชอบเลย โดยส่วนใช้ชอบอ่าน Medium หรือ TowardsDataScience ก็อยากให้เตรียมใจว่าไม่ท้อ เป็นกำลังใจให้ค่ะ

บทส่งท้าย

ก็หวังว่านี่จะเป็นจุดเริ่มต้นที่ดีในการทำทำความรู้จักและทำความเข้าใจในบทบาทของ Data Scientist นะครับ และสำหรับผู้ที่สนใจที่จะทำงานด้านนี้อย่างที่ Speakers แต่ละท่านได้เน้นยำไปก็คือ อย่าหยุดเรียนรู้สิ่งใหม่ ๆ นะครับ และทางเรา GBDi ก็เป็นกำลังใจให้เช่นกันครับ

Pakhapoom Sarapat, PhD

Data Scientist Government Big Data Institute (GBDi)

© Big Data Institute | Privacy Notice