Yannawut Kimnaruk
3 min readOct 27, 2019

เมื่อคนนอกวงการ IT มางาน Tencent Openhouse#13: AI & Machine Learning III

เมื่อวันที่ 22 ตุลาคมที่ผ่านมา ผมได้มีโอกาสไปร่วมงาน Tencent Openhouse#13 ภายใต้ชื่อ “AI and Machine Learning III” เนื่องจากผมประทับใจในงานนี้มาก ผมจึงอยากถ่ายทอดประสบการณ์ในฐานะคนนอกวงการ IT ให้ทุกท่านได้ฟังกันครับ (ถ้ามีข้อผิดพลาดประการใด สามารถแนะนำ ติชม ได้เลยครับ)​ มาลองดูกันครับว่าคนนอกวงการจะเข้าใจสิ่งที่คนวงการ IT มาเล่าหรือไม่?

ผมชื่อกร๊าฟฟิคครับ ผมเป็นวิศวกรอยู่ที่บริษัทแห่งหนึ่ง ไม่เคยทำงานในวงการ IT มาก่อน แต่ด้วยความสนใจในการมาถึงของยุค AI ผมจึงหาโอกาสเข้าไปอยู่ท่ามกลางผู้คนที่ทำงานด้าน AI และนั่นคือเหตุผลที่ผมมาร่วมงาน Tencent Openhouse#13 ครับ

กลับมาสู่ประเด็นหลักของเรา งาน Tencent Openhouse จัดขึ้นที่บริษัท Tencent Thailand ที่ตึก T-ONE ย่านทองหล่อ ผมนั่ง bts ไปแล้วเดินต่ออีกนิดหน่อย
สถานที่จัดงานกว้างขวาง สวยงามดีครับ ภายในงานมีการเลี้ยงพิซซ่า น้ำอัดลม และเบียร์พร้อม เพราะงั้นไม่ต้องห่วงว่าท้องจะว่าง

เนื้อหาภายในงานจะแบ่งเป็น 3 ส่วน

- ML for everyone
- Dataless Classification
- Intro to Music Information Retrieval (Lukthung Classification) in JOOX

ML for everyone

เริ่มจากส่วนแรกกันครับ เนื้อหาส่วนนี้ตรงกับชื่อเรื่องเลย รับรองว่าเหมาะกับ “ทุกคน” อย่างแท้จริง
ผู้มาบรรยายหัวข้อนี้คือพี่ต๊อป เจ้าของเพจ Facebook Noob Learning (ผมก็ตามเพจนี้อยู่แหละ อิอิ) และตอนนี้ทำ Startup ชื่อ FoxFox ด้วยครับ

พี่เขาเริ่มจากการเล่าประสบการณ์เรียนและสอบเพื่อให้ได้ Google Cloud Certificate Data Engineer ซึ่งเขาไม่ได้มีประสบการณ์ด้าน Data Engineer มามากนัก แต่ด้วยความขยันเรียนและทำแบบฝึกหัด เขาก็สามารถสอบผ่านได้ครับ สุดยอดจริงๆ

ภาพใบ Certificate ของพี่ต๊อปครับ

หลังจากนั้นพี่ต๊อปได้พูดถึง Machine Learning ในปัจจุบันและแนวโน้มในอนาคตซึ่งผมสรุปมาได้ดังนี้

  • Statistics (สถิติ) ใช้เพื่อหา Insight (ข้อมูลเชิงลึก)
    ML (Machine Learning) ใช้เพื่อ Foresight (ทำนาย)
  • ML จะเปลี่ยนเป็น Auto ML
    ในอนาคต ML จะสามารถสร้างได้โดยง่าย แทบจะ “อัตโนมัติ”
    หน้าที่ของ “มนุษย์” คือ เตรียมข้อมูลที่จะส่งต่อให้คอมพิวเตอร์ทำ ML ครับ
    ปัจจุบันมีการจ้างให้ช่วย Label ข้อมูล เช่น ทะเบียนรถ เพื่อนำไปทำ ML
  • DeepFake (การสร้างคลิปปลอม)​ จะมาพร้อมกับ DeepFake Detector
    2 เทคโนโลยีนี้จะพัฒนาแข่งกันเหมือนแมวไล่จับหนู

สำหรับผู้ที่สนใจอยากหาความรู้เพิ่มเติมทางด้านนี้ พี่ต๊อปได้พูดถึง “แหล่งเรียนรู้ออนไลน์” มากมายครับ อาทิ

  • AWS Machine Learning Course: พี่ต๊อปไม่แนะนำ 555
  • Youtube Channel > Siraj Raval: รวมคลิปสอน ML แบบเข้าใจง่าย
  • StatQuest: อธิบายสถิติแบบเข้าใจง่าย
  • AI for Social Google Guide: สอนการนำ ML ไปใช้เพื่อแก้ปัญหาด้านมนุษย์และสิ่งแวดล้อม
  • Developer.google.com > Playground Exercise: Interactive visualization ปรับค่า ลองกด run เห็นผลของ ML ได้เลย
  • A visual introduction to machine learning: อธิบาย ML โดยมีภาพประกอบ เมื่อเลื่อนอ่านเนื้อหาไปเรื่อยๆ ภาพประกอบด้านข้างจะเปลี่ยนตาม (ภาพสวยมาก)
  • TensorSpace.js: แสดงการทำงานของ Deep learning แบบต่างๆ

เมื่อได้ฟังพี่มาพูดแล้วรู้สึกมีไฟขึ้นมาทันที ผมคิดว่าถ้าเราจะเรียนรู้ด้าน AI จริงๆ มันมีแหล่งเรียนรู้ออนไลน์พร้อมเสิร์ฟ​ให้เราอยู่แล้วครับ

หากต้องการไฟล์ Powerpoint ฉบับเต็มสามารถเข้าไปชมได้ ที่นี่ ครับ

Dataless Classification

ในส่วนที่ 2 นั้น บรรยายโดยอาจารย์โจ้จากจุฬาลงกรณ์มหาวิทยาลัยครับ

อาจารย์เล่าถึงงานวิจัยที่เกี่ยวกับการทำ Classification ด้วยข้อมูลจำนวนน้อย
งานที่อาจารย์ต้องการทำ คือ Contextual Advertising (การค้นหา website ที่เนื้อหาเกี่ยวข้องกับโฆษณาที่เราจะแปะบน website)

ตัวอย่าง Contextual Advertising ของ Google AdSense

ปัญหาที่พบ คือ ประเภท website ที่เคยมีการแบ่งไว้นั้นกว้าง (หยาบ) เกินไป และการทำ label ใหม่ช้า+แพง

ส่วนนี้มีการลงไปแตะความรู้คณิตศาสตร์​พอสมควร สำหรับคนนอกวงการอย่างผมก็มีส่วนที่ไม่เข้าใจอยู่บ้างครับ แหะๆ แต่โดยรวมแล้วมีแนวคิดที่น่าสนใจทีเดียวครับ

วิธีการที่อาจารย์ใช้มีดังนี้

  1. คิด keyword 50 คำที่เกี่ยวข้องกับโฆษณาที่เราต้องการแปะบน website
  2. หา website ที่มี keyword เหล่านั้นปรากฎบ่อยๆ แล้วหา keyword มาเพิ่มเติมอีก (ใช้อัลกอริทึมชื่อ Multinomial Naive Bayes)
  3. สร้าง Classification Model (เครื่องมือทำนาย)​ จาก keyword ที่ได้มา (ใช้อัลกอริ​ทึมชื่อ General Expectation)

น่าสนุกดีนะครับที่ได้ค้นพบว่าการทำ ML สามารถ “ป้อน” ความรู้ของ “มนุษย์” เข้าไปใน “คอมพิวเตอร์” เพื่อช่วยให้การทำนายแม่นขึ้น เหมือนการร่วมมือกันของมนุษย์และเครื่องจักรเลย

หากต้องการไฟล์ Powerpoint ฉบับเต็มสามารถเข้าไปชมได้ ที่นี่ ครับ

Intro to Music Information Retrieval (Lukthung Classification) in JOOX

ส่วนสุดท้าย บรรยายโดยทีมของคุณกาโต้และคุณนุ่น Data Scientist ของ Tencent เองเลยครับ หัวข้อการบรรยายคือ “ใช้ ML ทำนายว่าเพลงนี้เป็นเพลงลูกทุ่งหรือไม่” แค่ชื่อหัวข้อก็น่าสนใจแล้ว

โปรเจคนี้เริ่มจากความต้องการแก้ปัญหาในการแนะนำเพลงในแอปพลิเคชัน​ Joox ในตรงกับความสนใจของผู้ใช้แต่ละคนครับ

มาดูกันครับว่าทีมนี้ เขาแก้ปัญหากันอย่างไร?

ตัวแปรที่เขานำมาใช้ในการวิเคราะห์คือ

  1. Lyric (เนื้อเพลง)​ ซึ่งเพลงลูกทุ่งจะมีคำที่ค่อนข้างเป็นเอกลักษณ์ เช่น อ้าย ฮัก
  2. Audio (เสียง) โดย audio นั้นแบ่งเป็น 2 ส่วน คือ เสียงเครื่องดนตรี ซึ่งแต่ละเครื่องดนตรีจะมีความถี่หลักและความถี่รอง (Timbre) ที่มีความเฉพาะตัว ซึ่งในเพลงลูกทุ่งจะมีเครื่องดนตรีพิเศษ อาทิ แคน ขิม ซอ และในส่วนที่ 2 ของตัวแปรเสียงคือ เสียงเอื้อน (Vibrato) อันเป็นเอกลักษณ์ของเพลงลูกทุ่ง

Lyric นั้นจะใช้หลักการ bag of word เพื่อดูว่าคำที่ปรากฎบ่อยๆ ในเพลงลูกทุ่งมีคำว่าอะไรบ้าง

Audio นั้นน่าสนใจทีเดียวครับ เขาจะเปลี่ยนเสียงเป็นรูปภาพที่เรียกว่า Spectrogram โดยความเข้มของสีจะบ่งบอกถึงความดังของความถี่นั้นๆ แนวนอนของภาพจะเป็นเวลา ส่วนแนวตั้งจะเป็นความถี่ ตามตัวอย่างด้านล่างครับ

หลังจากเสียงถูกเปลี่ยนเป็นภาพแล้วจะใช้หลักการเดียวกับ “Computer Vision” เพื่อแปรผลรูปภาพ โดยทีมนี้ใช้อัลกอริทึมชื่อ CNN (Convolution Neural Network) ซึ่งเป็นอัลกอริ​ทึมหนึ่งของ Deep Learning ครับ ซึ่งการใช้ CNN มีข้อดีคือเราไม่ต้องไปคิดเองว่าจะนำตัวแปรอะไรจากเสียงเพลง (เช่น ความเข้มเสียง จังหวะ)​ มาสร้างโมเดลทำนาย เพราะ CNN จะสามารถหาได้เองว่าลักษณะเฉพาะของเพลงลูกทุ่งเป็นอย่างไรจาก Spectrogram​

หลักการทำงานของ CNN ถ้าอธิบายอย่างคร่าวๆ คือ การมองพื้นที่ย่อยๆ ผ่านตัวกรอง (Filter) เพื่อวิเคราะห์ลักษณะเฉพาะที่เราสนใจ ในที่นี้ เราสนใจความถี่ของเครื่องดนตรีกับเสียงเอื้อนครับ ในตัวอย่างด้านล่างคือการมองภาพหนูผ่าน filter สี่เหลี่ยมสีเหลือง

สำหรับใครที่ต้องการอ่านรายละเอียดเกี่ยวกับ CNN เพิ่มเติมแนะนำ ที่นี่ เลย

โปรเจคนี้จะมีการใช้ filter ทั้งแนวนอนและแนวตั้ง โดยแนวนอนใช้สำหรับเสียงเอื้อน และแนวตั้งสำหรับประเภทเครื่องดนตรีครับ

หากต้องการอ่านรายละเอียดเพิ่มเติมเกี่ยวกับโปรเจคนี้สามารถเข้าไปชมได้ ที่นี่ (ภาษาอังกฤษ)

ปิดท้ายงานด้วยการแสดง demo product ของ JOOX ที่จะให้เราถ่ายรูปหรือคลิปแล้วจะแนะนำเพลงที่เหมาะกับรูปหรือคลิปนั้นๆ เท่มากกก

สรุป Tencent Openhouse#13 เป็นงานที่น่าประทับใจ ทั้งบรรยากาศงานที่เป็นกันเอง และเนื้อหาที่บรรยายซึ่งมีทั้งส่วนที่ย่อยง่ายเหมาะกับบุคคลทั่วไปและส่วนที่เป็นเนื้อหาเจาะลึกซึ่งคนทั่วไปอาจต้องใช้ความพยายามในการเข้าใจมากหน่อย แต่เนื้อหาทั้งหมดล้วนเห็นภาพ จับต้องได้ และสัมผัสได้ถึงยุคที่ AI จะเข้ามาเป็นส่วนหนึ่งของชีวิตเรามากขึ้น

สุดท้ายนี้ ผมขอขอบคุณ Tencent Thailand พร้อมด้วยวิทยากรทุกท่านที่จัดงานดีๆ แบบนี้ และขอบคุณผู้อ่านทุกท่านที่อ่านบทความนี้จนจบครับ

หากต้องการชมวิดีโอย้อนหลังสามารถเข้าไปดูได้ ที่นี่ เลยครับ

Yannawut Kimnaruk
Yannawut Kimnaruk

No responses yet