Article

Cognitive Photo Booth ตู้ถ่ายรูปที่ไม่ใช่แค่ถ่ายรูป แต่ยังสะท้อนบุคลิกของผู้ถ่ายให้รู้อีกด้วย

โดย A Girl From Mars

18 October 2017 7:41 pm

จะดีแค่ไหน? ถ้าตู้ถ่ายภาพอัจฉริยะ Cognitive Photo Booth สามารถสื่อสารโต้ตอบกับมนุษย์ และประมวลผลออกมาเป็นภาพถ่ายทำให้คนถ่ายรู้จักกับตัวตนของตัวเองดีขึ้นอีก

เครื่องจักรสามารถรู้จักมนุษย์ได้ดีกว่าที่พวกเขารู้จักตัวเองหรือไม่ ? เพื่อตอบคำถามนี้ IBM จึงได้สร้าง Cognitive Photo Booth หรือเรียกเป็นภาษาไทยว่า ” ตู้ถ่ายรูปอัจฉริยะ ” ขึ้นมาโดยติดตั้งระบบ AI คอมพิวเตอร์อัจฉริยะของไอบีเอ็มที่โด่งดังไปทั่วโลกนามว่า Watson มาช่วยสรรสร้างภาพบุคคลที่ครีเอทขึ้นจากข้อมูลที่ได้จากการโต้ตอบกันก่อนหน้าที่จะทำการถ่่ายภาพนั่นเอง

จุดเริ่มต้นก่อนจะมาเป็นตู้ถ่ายภาพอัจฉริยะ

คงต้องท้าวความไปถึงต้นกำเนิดของเรื่องนี้กันก่อนเลยนั่นก็คือ เจ้า “ Watson ” นั่นเองค่ะ ซึ่งเจ้าวัตสันนี้ถือเป็นผลงานที่มีชื่อเสียงระดับโลกของ IBM จากหนึ่งในหลาย ๆ ชิ้น ด้วยความสามารถของมันถูกพัฒนาไปไกลกว่าการตอบคำถามที่มีอยู่ในฐานข้อมูลเท่านั้น แรกเริ่มเลย วัตสัน คือบริการของ IBM ที่พัฒนาตามแนวทางของ Cognitive Computing ถึงแม้ว่าจะยังไม่สามารถตอบโจทย์ได้ทั้งหมด แต่ก็นับได้ว่าพัฒนามาไกลเพียงพอที่จะตอบโจทย์ความต้องการของการใช้งานอันหลากหลายในปัจจุบัน โดยหลัก ๆ สามารถแบ่งการใช้งานได้เป็น 3 ประเภท ดังนี้

Natural Language Processing (NLP) – การประมวลผลภาษามนุษย์ ได้แก่ อังกฤษ สเปน จีน และภาษาอื่นๆในอนาคต ให้สามารถเข้าใจบริบทเนื้อหาได้ เช่น ประมวลผลสัญญาตามกฏหมาย แล้วสรุปสาระสำคัญให้ฟังเป็นภาษาที่เข้าใจง่ายๆได้
Vision and Speech – การมองเห็น และโต้ตอบกับมนุษย์ได้ ไม่ว่าจะเป็นการพูด หรือในรูปข้อความ ยกตัวอย่างเมื่อรวมความสามารถกับ NLP เช้ร ประมวลผลวิดีโอออนไลน์ โดยสกัดเสียงในวิดีโอออกมาเปลี่ยนเป็นข้อความ ใช้ NLP วิเคราะห์ว่าเนื้อหาบริบทเกี่ยวข้อกับอะไร จากนั้นสร้าง Keyword เพื่อให้คนสามารถค้นหาวิดีโอนี้เจอ เป็นต้น นี่เป็นตัวอย่างชัดเจนที่ช่วยลดการใช้ทรัพยากรมนุษย์หรือการนำหุ่นยนต์มาแทนที่มนุษย์นั่นเอง
High Level Reasoning and Insights – ฟีเจอร์ที่เหนือกว่า Machine Learning ที่สามารถโต้ตอบได้เฉพาะรูปแบบที่เคยพบมาก่อนเท่านั้น นี่เป็นเทคโนโลยีอัจฉริยะที่สามารถตอบคำถามมนุษย์ได้ครบทั้ง 5 อย่าง คือ อะไร ที่ไหน อย่างไร เมื่อไหร่ และทำไม โดย Watson ใช้ฐานข้อมูลขนาดใหญ่ที่เรียกว่า Corpus ในการรวบรวมข้อมูลและวิเคราะห์หาคำตอบที่ “ดีที่สุด” เช่น บริการ Question and Answer ที่สามารถตอบคำถามด้านสุขภาพ และการเดินทางได้

ด้วยคุณสมบัติ Cognitive Computing นี้จึงทำให้เจ้า “วัตสัน” สามารถรับฟังคำสั่งเสียงได้ ตอบโต้กับมนุษย์ได้ เสมือนว่าเป็นคนฉลาดรอบรู้คนนึงเลยก็ว่าได้ และยังสามารถประมวลผลข้อมูลมหาศาลภายในเวลาอันรวดเร็วได้อีกด้วย และเพื่อแสดงให้เห็นว่าการมีเจ้าวัตสันนี้ฝังอยู่ในอุปกรณ์ต่างๆ รอบตัวจะช่วยเปลี่ยนแปลงทัศนคติและประสบการณ์เดิมๆ ในการใช้งานได้อย่างไรบ้าง ทางทีมงาน IBM เค้าก็เลยสร้างเจ้าตู้ถ่ายรูปอัจฉริยะนี้ขึ้นมาเพื่อพิสูจน์ข้อสงสัยนั่นเองค่ะ

Cognitive Photo Booth ตู้ถ่ายภาพอัจฉริยะ

ความพิเศษของเจ้าตู้ตัวนี้ก็ไม่ธรรมดาเลยทีเดียว ไม่ได้เป็นแค่ตู้ถ่ายรูปธรรมดา ๆ ที่แค่ถ่ายแล้วยืนรอรับรูปก็คือจบ แต่เจ้าตู้นี้มันสามารถทำให้คนถ่ายรู้จักกับตัวตนของตัวเองดียิ่งขึ้นอีกด้วย เพราะก่อนที่จะเริ่มการถ่ายรูปเจ้าตู้นี้จะถามคำถามกับผู้ถ่ายก่อน เช่นว่า คุณชอบดูหนังเรื่องไหน เพราะอะไร โตขึ้นคุณอยากเป็นอะไร ถ้าเลือกได้อยากเป็นดาราคนไหน เพราะอะไร ตอนเช้าตื่นมาคุณชอบทำอะไร ฯลฯ เป็นต้น

โต้ตอบกันประมาณ 2-3 คำถาม แล้วจึงวิเคราะห์+สรุปผลออกมาเป็น % คำตอบว่าผู้ที่เข้ามาถ่ายแต่ละคนเป็นคนมีบุคลิกแบบไหน เช่น รอมชอม เปิดเผย ขี้กังวล ชอบความแปลกใหม่ ฯลฯ จากนั้นก็จะเอาสัญลักษณ์ของบุคลิกเหล่านี้มาพิมพ์ลงเป็นรูปเล็กๆ จนเต็มแผ่นกระดาษ และเมื่อมองให้ดีก็จะเห็นเป็นใบหน้าของเรานั่นเอง เจ๋งไปเลยใช่มั้ยล่ะ

ตัวอย่างภาพที่ได้จากตู้

Cognitive Computing คืออะไร

หลายคนอาจจะสงสัยว่าเอ๊ะ แล้วไอ้เจ้า Cognitive Computing นี้มันคืออะไร ?? ถ้านึกไม่ออกเราขอยกตัวอย่างง่าย ๆ ให้นึกออกนะคะ เช่น คนเหล็กในเรื่อง Terminator เป็นต้น ที่สามารถเข้าใจภาษามนุษย์ คิด วิเคราะห์ และพูดโต้ตอบกลับไปได้โดยไม่ต้องมีมนุษย์มาควบคุม ซึ่งเป้าหมายหลักของการสร้างค็อกนิทีฟคอมพิวติ้งนี้ก็คือ สร้างคอมพิวเตอร์หรือหุ่นยนต์ให้มีความเหมือนมนุษย์ โดยใช้ระบบ AI (Artificial Intelligence) เข้ามาช่วยโดยมีลักษณะ ดังนี้

จะต้องเข้าใจสิ่งที่มนุษย์พูด แล้วเรียนรู้ จดจำ เมื่อเจอเหตุการณ์รูปแบบเดียวกันจะต้องโต้ตอบกลับมาแบบเดิมได้ หรืออาจไม่เหมือนเดิมถ้ามีปัจจัยอื่นเข้ามาเกี่ยวข้อง
ไม่ใช่เครื่องพยากรณ์ที่สามารถทำนายอนาคตได้ แต่สามารถคาดเดาได้ว่าอะไรจะเกิดขึ้นจากสภาวะแวดล้อมต่างๆ
ไม่ใช่เครื่องมือให้คำแนะนำ แต่สามารถใช้ ค็อกนิทีฟ คอมพิวติ้ง เพื่อสร้างเครื่องมือให้คำแนะนำได้ โดยอาศัยปัจจัยต่างๆ เช่น ความชื่นชอบ หรือประสบการณ์ส่วนบุคคล
เป็นมากกว่า Machine Learning (ML) ดั่งเช่นที่ Amazon AWS หรือ Microsoft Azure ให้บริการ ML จำเป็นต้องสร้างโมเดลจากปริมาณข้อมูลอันมหาศาลก่อน เสมือนเป็นสมองในการเรียนรู้สิ่งต่างๆ จากนั้นจะคิดและโต้ตอบกลับไปโดยอาศัยสิ่งที่เรียนรู้มาเหล่านั้น ในขณะที่การสร้างโมเดลของ Watson นั้นเกิดขึ้นจากการเรียนรู้ภายใน IBM เอง Watson จึงเป็นเซอร์วิสที่พร้อมใช้งานโดยทันที และใช้งานได้ง่าย โดยแลกกับข้อจำกัดด้านความยืดหยุ่น กล่าวคือ ปัจจุบันสามารถเข้าใจและโต้ตอบความต้องการได้เพียงแค่ 28 รายการ และไม่สามารถปรับแต่งตามความต้องการได้

คุณสมบัติสำคัญหลักของวัตสัน

Adapting to the unknown – ปรับตัวให้เข้ากับสิ่งที่ไม่รู้ ไม่เคยเห็นมาก่อนได้ เช่น การแก้ปัญหาเรื่อง Ambiguity ซึ่งเป็นปัญหาใหญ่ของ AI คือ ไม่รู้ ไม่แน่ใจว่าสิ่งนั้นคืออะไร ยกตัวอย่าง เมื่อเอาสระภาษาอังกฤษออก ต้องยังสามารถอ่านและเข้าใจข้อความนั้นๆแบบที่มนุษย์ทำได้
Interacting with other humans – ต้องสามารถสื่อสาร โต้ตอบกับมนุษย์ได้ อาจผ่านทางข้อความ หรือเสียง เป็นต้น รวมทั้งต้องสามารถสรุปข้อมูลเป็นใจความสำคัญให้มนุษย์สามารถเข้าใจได้โดยง่ายหรือเป็นธรรมชาติ
Understanding the context – นอกจากรับฟังสิ่งที่มนุษย์พูดหรือ Input เข้ามาได้แล้ว ต้องสามารถเข้าใจบริบทของเนื้อหาเหล่านั้น ไม่ว่าจะเป็นในลักษณะของข้อความ หรือรูปภาพ
Reasoning the best answer – สามารถใช้คำตอบที่ดีในคำถามต่างๆได้ ซึ่งคำตอบที่ดีที่สุดอาจไม่ใช่คำตอบที่ถูกต้อง แต่ต้องมีเหตุผลมารองรับว่าทำไมถึงตอบแบบนี้

ขอบคุณแหล่งข้อมูลอ้างอิง IBM , Blognone , Behence , Designtaxi