เทคโนโลยีการทำแบบจำลอง 3 มิติ ของประธานาธิบดีโอบามา ตอนที่ 2

บทความนี้เขียนโดย อ.ดร.ธนาสัย สุคนธ์พันธุ์ และ อ.ดร.บรม ตันวัฒนะพงษ์ (รองอธิการบดีฝ่ายบริหาร มหาวิทยาลัยราชธานี) เผยแพร่ครั้งแรก ที่นี่ เมื่อ 3 พฤษภาคม 2015 โดยคอลัมน์ Intelligence and Information ของ Manager Online


เทคโนโลยีการทำแบบจำลอง 3 มิติ (3D Scanner) นั้น มีอยู่หลากหลายวิธี ยกตัวอย่างเช่น การใช้แสงเลเซอร์ให้สะท้อนบนวัตถุ (3D Laser Scanner), การใช้โปรเจคเตอร์แสงที่เป็นรูปแบบให้สะท้อนบนวัตถุ (Structured Light 3D Scanner), และ การใช้กล้องถ่ายรูปจากหลายมุมมอง (Stereoscopic Scanner) เป็นต้น แต่เทคโนโลยี ที่กำลังได้รับความนิยมในขณะนี้ คือ การใช้กล้องถ่ายรูปจากหลายมุมมอง ควบคู่กับการใช้แสงที่เป็นรูปแบบ ด้วยการควบคุมสภาวะแสงรอบวัตถุแบบทรงกลม (Spherical Illumination) [1] ตามรูปที่ 1 (รูปด้านบนสุดของหน้า) เนื่องจาก วิธีนี้สามารถแยกแยะแสงสะท้อนบนวัตถุได้แม่นยำ และภาพที่ได้จากกล้องที่วางอยู่หลากหลายมุมมอง นั้นก็ สามารถนำมาหาตำแหน่งของพื้นผิว 3 มิติ ได้อย่างละเอียด ตามความความละเอียดของภาพจากกล้องถ่ายรูป นอกจากนั้นเทคโนโลยีนี้ยังสามารถใช้ได้กับวัตถุหลากหลายชนิด ไม่ว่าจะเป็น โลหะ พลาสติก หรือ ผิวมนุษย์ โดยไม่มีข้อจำกัด เหมือนที่มีในเทคโนโลยีการทำแบบจำลองแบบอื่นๆ โดยในบทความนี้จะขอพูดถึงส่วนของการควบคุมสภาวะของแสงรอบวัตถุก่อน แล้วจึงตามด้วยการนำภาพจากหลากหลายมุมมองมาหาพื้นผิว 3 มิติ

ภาพถ่ายของวัตถุใดๆ ก็ตาม ที่ได้จากกล้องถ่ายภาพนั้น จะประกอบไปด้วย ภาพของแสงสะท้อนจากวัตถุ สองชนิดหลักออกมาพร้อมๆ กัน ได้แก่ แสงสะท้อนแบบแสงพร่า (Diffuse) และ แสงสะท้อนแบบผิวเงา (Specular) ตามรูปที่ 2 ซึ่งการนำรูปภาพที่มีแสงสะท้อนทั้งสองชนิดนี้ มาใช้โดยตรงโดยที่ไม่มีการแยกชนิดของแสงสะท้อนออกก่อนนั้น จะทำให้การแปลความหมายของพื้นผิว 3 มิติ ผิดพลาดได้ง่าย เนื่องจากแสงสะท้อนแต่ละชนิดสื่อความหมายในมุมมองของพื้นผิววัตถุที่แตกต่างกัน ฉะนั้นถ้าเราสามารถแยกแสงสะท้อนแต่ละชนิดจากภาพที่ถ่ายออกมาได้ก่อน เราก็จะสามารถคำนวนหาพื้นผิวของวัตถุได้แม่นยำขึ้น วิธีการในการแยกแยะแสงสะท้อนจากวัตถุนี้ ทำได้โดยการนำเอา เลนส์กรองแสงสะท้อนผิวเงา (Polarizer) มาวางไว้ข้างหน้าแหล่งกำเนิดแสงและข้างหน้ากล้องถ่ายภาพ เพื่อจะกรองแสงสะท้อนผิวเงาออกไป ตามรูปที่ 2

รูปที่ 2: บนซ้าย คือ รูปถ่ายปกติที่ได้ซึ่งประกอบด้วยแสงสะท้อนแบบ Diffuse และ Specular รวมกัน, รูปบนขวา คือ รูปถ่ายแบบมีแต่ Diffuse และไม่มี Specular, รูปล่าง คือ รูปถ่ายแบบมีแต่ Specular และไม่มี Diffuse (ที่มา: http://gl.ict.usc.edu/Research/DigitalEmily/)
รูปที่ 2: บนซ้าย คือ รูปถ่ายปกติที่ได้ซึ่งประกอบด้วยแสงสะท้อนแบบ Diffuse และ Specular รวมกัน, รูปบนขวา คือ รูปถ่ายแบบมีแต่ Diffuse และไม่มี Specular, รูปล่าง คือ รูปถ่ายแบบมีแต่ Specular และไม่มี Diffuse (ที่มา: http://gl.ict.usc.edu/Research/DigitalEmily/)

เมื่อเราได้รูปภาพที่แยกชนิดของแสงสะท้อนได้แล้ว เราก็ยังสามารถเพิ่มมิติของรูปภาพเข้าไปได้อีก ด้วยการจัด หลอดไฟ LED ที่วางอยู่รอบๆวัตถุ ให้เป็นสภาวะแสงแบบ Spherical Gradient [1] เพื่อช่วยเพิ่มมิติให้กับตำแหน่งของพื้นผิวบนรูปภาพ โดย Spherical Gradient นี้ คือการไล่ความสว่างของหลอด LED ตามตำแหน่งต่างๆ ที่วางตัวเป็นทรงกลม รอบๆวัตถุ โดยไล่ความสว่างจากสว่างมากไปสว่างน้อยจากข้างหน้าไปข้างหลังและจากข้างบนไปข้างล่าง โดยความสว่างของแสงที่ต่างกันเหล่านี้ สามารถทำให้เห็นมิติของพื้นผิวเพิ่มขึ้น ตามรูปที่ 3

รูปที่ 3: การไล่ลำดับแสงแบบ Spherical Gradient (ที่มา: http://gl.ict.usc.edu/Research/DigitalEmily/)
รูปที่ 3: การไล่ลำดับแสงแบบ Spherical Gradient (ที่มา: http://gl.ict.usc.edu/Research/DigitalEmily/)

ขั้นตอนทั้งหมดข้างต้นนั้น เป็นการเก็บรูปภาพ จาก หลากหลายความสว่าง หลากหลายชนิดของแสงสะท้อน และ จากหลากหลากมุมมอง ที่เหมาะสม ซึ่งหลังจากนี้ เราก็สามารถนำข้อมูลทั้งหมด จากรูปภาพต่างๆนี้ มาประมวลผล โดยใช้หลักการของ Stereoscopic Vision [2] ซึ่งเป็นหลักการเดียวกับการทำงานของสมองมนุษย์ในการประมาณการพื้นผิว 3 มิติจากตาเปล่า โดยการนำรูปภาพจากตาซ้ายและตาขวามาประกอบกัน เพื่อโยงความสัมพันธ์ของตำแหน่ง 3 มิติของแต่ละรูปภาพ และเนื่องจากรูปภาพที่ได้มาจากเทคโนโลยีนี้ มาจากกล้องหลากหลายมุมมอง และ หลากหลายความสว่างและชนิดของแสงสะท้อน ที่มีจำนวนมากมาย ซึ่งก็จะเพิ่มความแม่นยำให้กับการคำนวนพื้นผิว 3 มิติ เป็นอย่างมาก ตามผลลัพธ์ในรูปที่ 4 เป็นต้น

รูปที่ 4: ซ้าย คือ ผลลัพธ์พื้นผิว 3 มิติที่ถูกจัดเก็บไว้ได้ และ ขวา คือ ผลลัพธ์หลังจากใส่ภาพผิวหนังที่ถ่ายมาได้ลงไปด้วย (ที่มา: http://gl.ict.usc.edu/Research/DigitalEmily/)
รูปที่ 4: ซ้าย คือ ผลลัพธ์พื้นผิว 3 มิติที่ถูกจัดเก็บไว้ได้ และ ขวา คือ ผลลัพธ์หลังจากใส่ภาพผิวหนังที่ถ่ายมาได้ลงไปด้วย (ที่มา: http://gl.ict.usc.edu/Research/DigitalEmily/)

ในปัจจุบัน นับได้ว่าเทคโนโลยีการทำแบบจำลอง 3 มิติ ที่กล่าวมานี้ ให้ผลลัพธ์ที่มีความแม่นยำสูง ใช้เวลาในการจัดเก็บน้อย เพราะใช้เวลาเพียงแค่ไม่กี่วินาที ก็สามารถได้ผลลัพธ์ที่มีความละเอียดสูง ทำให้เทคโนโลยีนี้ เป็นที่นิยมในธุรกิจภาพยนตร์ใน Hollywood เป็นอย่างมาก เนื่องจากนักแสดงไม่จำเป็นต้องเสียเวลาในขั้นตอนการจัดเก็บ อีกทั้งยังสะดวกสบาย เพราะไม่ต้องสัมผัสกับเครื่องมือใดๆ ตัวอย่างภาพยนตร์ ที่ใช้เทคโนโลยีนี้ก็ได้แก่เรื่อง Avatar (2009), Avengers (2012), และ Oblivion (2013) เป็นต้น


References:
[1] http://gl.ict.usc.edu/Research/FaceScanning/
[2] http://en.wikipedia.org/wiki/Stereopsis