วันพุธที่ 7 มกราคม พ.ศ. 2552
ทฤษฎีเกมส์
จาก คอลัมน์ ระดมสมอง โดย เพสซิมิสต์ ประชาชาติธุรกิจ วันที่ 27 กุมภาพันธ์ พ.ศ. 2549 ปีที่ 29 ฉบับที่ 3770 (2970) ปัจจุบันมีข่าวร้ายๆ เกี่ยวกับการเมืองและมีความเป็นห่วงเกี่ยวกับผลกระทบต่อเศรษฐกิจมากอยู่แล้ว ผมจึงขอเขียนเรื่องที่ให้แง่คิด และมุมมองใหม่ๆ เกี่ยวกับทฤษฎีเกม ซึ่งผมได้มาจากการไปเข้าร่วมฟังปาฐกถาพิเศษของ Prof Ariel Rubinstein แห่ง TelAviv University ซึ่งจัดขึ้นโดยโครงการปริญญาเอกสาขาเศรษฐศาสตร์มหาวิทยาลัยหอการค้าไทย และศูนย์วิจัยมหาวิทยาลัย ชิคาโก เมื่อ 22 กุมภาพันธ์นี้ เราคงจะจำได้ว่า ประวัติของนาย John Nash ผู้ซึ่งได้รับรางวัลโนเบลทางเศรษฐศาสตร์เมื่อปี 1994 นั้น ถูกนำไปทำเป็นภาพยนตร์เรื่อง A Beautiful Mind นำแสดงโดย Russell Crowe และ Jennifer Connelly ซึ่ง Prof Ariel Rubinstein คุยให้ฟังว่า ภาพยนตร์ดังกล่าวนั้นคลาดเคลื่อนจากความเป็นจริงในหลายตอน เช่น ฉากวันงานฉลองการรับรางวัลของ Prof Nash นั้น อาจารย์ของคณะคณิตศาสตร์ไม่ได้ต่างเดินเข้าไปหา Prof Nash และมอบปากกาให้คนละด้ามแต่อย่างใด ตรงกันข้ามมีการกล่าวสดุดีและดื่มแชมเปญร่วมกันอย่างง่ายๆ และหลังจากนั้น ก็มีอาการเงียบ ไม่รู้ว่าจะพูดอะไรกันอีก จนกระทั่งต่างคนต่างก็แยกย้ายกลับไป อีกฉากหนึ่ง ซึ่ง Prof Nash เห็นผู้หญิงสาวสวยผมบลอนด์เดินเข้ามาในผับ (pub) ดลใจให้คิดขึ้นได้ว่า แนวคิดของ Adam Smith บิดาแห่งเศรษฐศาสตร์ ว่ามนุษย์นั้นจะต้องคำนึงถึงผลประโยชน์ของตนเป็นหลักนั้นไม่ถูกต้อง สิ่งที่ถูกต้อง คือ จะต้องคำนึงถึงผลประโยชน์ของส่วนรวมและส่วนตัวพร้อมกันไป กล่าวคือ หนุ่มๆ จะต้องไม่แย่งกันเข้าจีบสาวสวยผมบลอนด์ แต่ต่างคนต่างต้องจีบสาวที่สวยน้อยกว่า ทุกๆ คนจึงจะประสบผลสำเร็จ ซึ่งเรื่องนี้ Prof Rubinstein ยืนยันว่า ไม่ได้มีอะไรที่เกี่ยวข้องกับทฤษฎีเกมของ Prof Nash แต่อย่างใด เป็นเพียงจินตนาการของฮอลลีวูดทั้งสิ้น ทฤษฎีเกมที่จะต้องนำมาใช้ในกรณีดังกล่าว เป็นทฤษฎีที่คิดค้นขึ้นมาก่อนหน้าแล้ว ซึ่งเรียกว่า Prisoner"s Dilemma และเป็นที่รู้จักกันดีในหมู่ของนักเรียนเศรษฐศาสตร์และมักจะถูกนำไปใช้ในการแยกการสอบสวนผู้ต้องหา ซึ่งเข้าใจได้จากตารางข้างล่างนี้ สมมติว่าโจร 2 คนร่วมกันขโมยของในบ้านหลังหนึ่ง แล้วนำสินทรัพย์ที่ขโมยมาไปซ่อนเอาไว้ แต่ต่อมาถูกจับกุมได้ ตำรวจจึงจับไปแยกสอบสวนโจรทั้งสองคน ซึ่งหากโจรทั้งสองคนปากแข็ง และไม่ทรยศต่อกัน โจรทั้งสองก็จะถูกจำคุกเพียง 2 ปี ในฐานะบุกรุก (D) ซึ่งเป็นโทษเบา และเป็นแนวทางที่เป็นประโยชน์กับทั้งสองมากที่สุด อย่างไรก็ดี ต่างคนต่างจะต้องระแวงว่า อีกคนหนึ่งจะยอมสารภาพกับตำรวจและทรยศกับตนหรือไม่ เช่น กรณีที่โจร ก.ยอมสารภาพ และโจร ข.ไม่สารภาพ โจร ก.ก็จะติดคุกเพียง 1 ปี แต่โจร ข.จะโดนโทษหนักคือติดคุก 10 ปี (B) ในทำนองเดียวกัน หากโจร ข.สารภาพ แต่โจร ก.ปากแข็ง โจร ก.ก็จะได้รับโทษจำคุก 10 ปี และโจร ข. 1 ปี (C) กล่าวโดยสรุป คือ การสอบสวนแยกกัน มักจะทำให้ตำรวจสามารถกดดันให้โจรทั้งสองคนสารภาพได้ และต้องจำคุกไปคนละ 5 ปี (A) ทั้งๆ ที่หากโจรทั้งสองยึดมั่นที่จะร่วมมือกันแล้ว ก็จะต้องจำคุกกันคนละ 2 ปีเท่านั้น ซึ่ง Prof Rubinstein ชี้ให้เห็นว่า ทฤษฎี prisoner"s dilemma นี้ ใกล้เคียงกับปัญหาการจีบผู้หญิงผมบลอนด์มากกว่า แต่ไม่ได้เป็นทฤษฎีที่ John Nash คิดค้นขึ้นมาจนได้รับรางวัลโนเบลในที่สุด John Nash นั้น ถือได้ว่าเป็นอัจฉริยะจริงๆ เพราะเขาจบปริญญาเอกขณะที่อายุเพียง 22 ปี ในปี ค.ศ.1950 และวิทยานิพนธ์ของเขานั้น มีความยาวเพียง 27 หน้า และวิทยานิพนธ์ดังกล่าว คือสาเหตุที่ทำให้เขาได้รับรางวัลโนเบลเมื่อปี 1994 อาจารย์ของ Nash สมัยที่เรียนจบปริญญาตรีเขียน Letter of Recommendation สั้นๆ เพียงประโยคเดียว (แต่ทำให้เขาได้เรียนต่อและจบปริญญาเอกที่ Princeton) คือ "This man is a genius" แต่ก็เป็นอย่างที่เราได้เห็นจากภาพยนตร์ A Beautiful Mind ว่า Nash นั้น เป็นโรคจิตที่เรียกว่า paranoid schizophrenia นานกว่า 30 ปี ทำให้เขาเขียนบทความทางวิชาการครั้งสุดท้ายเมื่อปี 1958 ในช่วงที่เขามีอาการของโรคอย่างหนักนั้น มหาวิทยาลัย Princeton ยินยอมที่จะให้เขาเดินไปเดินมาอยู่ที่โรงอาหารของมหาวิทยาลัย และให้เขาสามารถใช้คอมพิวเตอร์ได้ แต่ที่น่าแปลกคือการยืนยันของภรรยาของเขาไม่ให้นำตัวเขาเข้าไปกักตัวในโรงพยาบาลนั้นในที่สุด ทำให้อาการของเขาดีขึ้น และในที่สุดคณะกรรมการโนเบลก็กล้าที่จะให้รางวัลกับเขา ซึ่งเป็นการแสดงออกว่าการเป็นโรคประสาทนั้น ไม่ควรที่จะตัดสิทธิในการได้รับรางวัลโนเบลแต่อย่างใด กลับมาคุยกันในเชิงวิชาการว่า ทฤษฎีเกมนั้น มีความสำคัญอย่างไร คำตอบแบบพื้นฐานก็คือแบบจำลองปกติ ของนักเศรษฐศาสตร์นั้น จะตั้งสมมติฐานว่าตลาดจะมีผู้ซื้อและผู้ขายจำนวนหลายหมื่น หลายแสนราย แต่ละคนจึงมีความสำคัญน้อย และการกระทำของคนคนหนึ่งจะไม่กระทบต่อการกระทำของคนอีกคนหนึ่ง นอกจากนั้น ในกรณีดังกล่าวจุดดุลยภาพ (equilibrium) ของตลาด จะมีจุดเดียว และค้นพบได้ง่าย และการพิสูจน์ว่าดุลยภาพดังกล่าวมีเสถียรภาพก็จะเป็นเรื่องที่พิสูจน์ง่ายเช่นกัน แต่ทฤษฎีเกมนั้น เป็นการวิเคราะห์กรณีซึ่งมี "ผู้เล่น" น้อยราย ดังนั้น พฤติกรรมของผู้เล่นคนหนึ่งย่อมจะส่งผลต่อผู้เล่นคนอื่นๆ ดังนั้น ผู้เล่นแต่ละคนจะต้องคาดการณ์ว่าผู้เล่นคนอื่นๆ จะทำอะไร ซึ่งมีความเป็นไปได้หลายประการ และเมื่อทราบแล้ว หรือคาดการณ์แล้ว ผู้เล่นคนอื่นๆ ก็จะมีการตอบสนองที่แตกต่างกันออกไป กล่าวคือ จุดดุลยภาพอาจมีหลายจุด หรืออาจไม่มีเลย ดังนั้น การแสวงหาในเชิงทฤษฎีว่ามีจุดดุลยภาพหรือไม่ และเป็นจุดดุลยภาพหรือไม่ ย่อมจะเป็นเรื่องที่พิสูจน์ได้ยากยิ่งในเชิงวิชาการ และจะต้องใช้คณิตศาสตร์ระดับสูงในการแสวงหาคำตอบดังกล่าว ในช่วงแรกของการคิดค้นทฤษฎีเกมนั้น จะเน้นถึงการช่วงชิงแก่งแย่งของฝ่ายต่างๆ ซึ่งสะท้อนว่า หากกลุ่มหนึ่งกลุ่มใดได้ประโยชน์มากขึ้น อีกกลุ่มหนึ่งก็ย่อมจะต้องสูญเสียประโยชน์หรือในภาษาวิชาการ คือเป็น Zero sum game นั่นเอง แต่ทฤษฎีของ Nash มีความสำคัญ เพราะ Nash สามารถพิสูจน์ได้ว่าการแก่งแย่งช่วงชิงระหว่างกันนั้น สามารถแสวงหาจุดดุลยภาพที่มีเสถียรภาพได้ ซึ่งเป็นจุดริเริ่มของการนำเอาทฤษฎีของ Nash ไปใช้ในการวิเคราะห์การเจรจาต่อรองระหว่างนายจ้างกับลูกจ้าง หรือแม้กระทั่งการคาดการณ์กลยุทธ์ของฝ่ายตรงกันข้าม ดังนั้น นักเศรษฐศาสตร์ส่วนใหญ่จึงจะเคยได้ศึกษาเกี่ยวกับทฤษฎีของ Nash โดยเฉพาะคำว่า Nash equilibrium นั้น จะเป็นคำที่คุ้นหูคุ้นตามาก แต่ก็ไม่ใช่ว่า Nash equilibrium หรือจุดดุลยภาพที่ได้มาจากทฤษฎีของ Nash นั้น จะสะท้อนความเป็นจริงเสมอไป เช่น Prof Rubinstein ตั้งโจทย์ให้คน 2 คน เลือกตัวเลขตัวหนึ่งระหว่าง 180 ถึง 300 โดยมีเงื่อนไขว่า คนที่เลือกตัวเลขต่ำกว่า จะได้เงินเท่ากับจำนวนของตัวเลขที่เลือกบวกกับอีก 5 บาท โดยชัยชนะ คือการได้เงินมากกว่าคู่แข่ง จะเห็นได้ว่า การเลือก 300 จะไม่ใช่คำตอบที่ถูกต้อง เพราะหากคู่แข่งของเรา เลือก 299 เขาก็จะได้เงินทั้งสิ้น 299 + 5 = 304 ในกรณีนี้ Nash equilibrium จะอยู่ที่ 180 กล่าวคือทั้งสองคนจะเลือกตัวเลขต่ำสุดเพราะจะไม่มีใครเสียเปรียบใคร (เพราะจะได้เงินเท่ากัน) แต่ Prof Rubinstein ได้ขอให้ผู้ที่เข้าฟังปาฐกถาของเขาใน 8 ประเทศ รวมทั้งประเทศไทยตอบโจทย์ดังกล่าวข้างต้น และพบว่าคำตอบไม่ได้อยู่ที่ 180 แต่เฉลี่ยแล้วจะอยู่ที่ 250-280 โดยในกรณีของคนไทย มีค่าเฉลี่ยของคำตอบที่ 250 และคำตอบที่พบบ่อยที่สุดคือ 300 กล่าวคือ คนส่วนใหญ่มักจะใช้สัญชาตญาณมากกว่า และมีเพียง 30% เท่านั้นที่ตอบตามการคาดการณ์ของทฤษฎี อีกเกมหนึ่งตั้งโจทย์ว่า มีโรงแรมเรียงอยู่บนชายหาด 7 โรงแรม โดยเรียงลำดับเบอร์ 1 ถึง 7 และมีการประมูลให้เปิดร้านกาแฟ 2 ร้าน โดยมีสมมุติฐานว่า คนจะมาดื่มกาแฟในร้านที่ใกล้มากที่สุด (ยี่ห้อกาแฟไม่สำคัญ) ในกรณีดังกล่าว Nash equilibrium คือร้านกาแฟทั้งสองร้านก็จะตั้งที่โรงแรมเบอร์ 4 ซึ่งอยู่กึ่งกลางพอดี และทั้งสองก็จะได้ส่วนแบ่งตลาดเท่ากัน แต่หากเพิ่มจำนวนร้านกาแฟเป็น 3 ร้าน คำตอบที่ถูกต้องตาม Nash equilibrium ไม่ใช่การที่ทั้ง 3 ร้าน ตั้งอยู่ที่โรงแรมเบอร์ 4 (เพราะแต่ละร้านกาแฟจะได้ส่วนแบ่งตลาดเท่ากันคือ 33%) จุดเปิดร้านกาแฟที่เหมาะสม หากเชื่อว่ามีคนจะเปิดร้านกาแฟที่โรงแรม 4 อย่างแน่นอน คือการไปตั้งร้านกาแฟที่โรงแรม 3 และโรงแรม 5 เพราะโรงแรม 3 จะได้ลูกค้าโรงแรม 1, 2, 3 ส่วนร้านกาแฟที่โรงแรม 5 จะได้ลูกค้าที่โรงแรม 5, 6, 7 กล่าวคือ คนควรจะเลือก 3 กับ 5 มากกว่า 4 แต่คนส่วนใหญ่ก็ยังเลือก 4 อยู่ดี เกี่ยวกับเรื่องนี้ Prof Rubinstein ให้ข้อสังเกตว่า มนุษย์มีแนวโน้มที่จะเดินสายกลางซึ่งมีคนไปใช้วิเคราะห์การเมืองว่านักการเมืองนั้น แม้ว่าจะสังกัดพรรคต่างกันแต่ก็จะพยายามเสนอนโยบายสายกลางเหมือนๆ กัน เพราะรู้ว่าการเสนอนโยบายดังกล่าวมักจะเรียกคะแนนเสียงได้มากที่สุด อีกเกมหนึ่งตั้งโจทย์ว่า มีเงินอยู่ 100 บาท และให้เราแบ่งเงินนี้ให้กับอีกคนหนึ่งในจำนวนใดก็ได้ แต่มีเงื่อนไขว่า หากคนนั้นไม่ยอมรับเงินดังกล่าว ทั้งสองคนก็จะไม่ได้เงินสักบาทเดียว Nash equilibrium คือ เราจะสามารถเสนอเงินให้คนนั้น 0-1 บาท ก็พอ เพราะเขายอมจะรับเงินจำนวนใดก็ได้ที่มากกว่าศูนย์เล็กน้อย เนื่องจากจะทำให้เราได้ประโยชน์มากกว่าไม่ได้รับเงินเลย แต่จากผลการสอบถามของ Prof Rubinstein ใน 8 ประเทศ พบว่าเงินที่แบ่งให้นั้นเฉลี่ยเท่ากับ 40-48 บาท โดยคนไทยให้เงินมากที่สุดคือ 48 บาท ส่วนหนึ่งอาจเป็นเพราะหวังว่าอีกฝ่ายหนึ่ง จะไม่ยอมรับเงินทำให้เราอดได้เงินไปด้วย แต่ทั้งนี้ไม่ใช่ว่าทฤษฎีของ Nash จะผิด เพราะเงินจำนวนน้อยจะทำให้คนที่ขี้อิจฉายอมทิ้งเงิน เพียงเพราะไม่ต้องการเสียเปรียบใคร แต่หากเปลี่ยนจำนวนเงินให้เป็น 500 ล้านบาท ก็น่าจะเชื่อได้ว่าหากเราเสนอให้อีกคนหนึ่งได้เงิน 10 ล้านบาท เขาคงจะรับเอาไว้ แม้ว่าจะเสียเปรียบเราที่ได้เงินถึง 490 ล้านบาท เกมสุดท้ายที่ผมจะนำมาพูดถึงคือ ถ้าสมมุติว่ามีสนามรบอยู่ 6 สนามเท่ากัน โจทย์คือให้วางกำลังในแต่ละสนามรบ โดยหากฝ่ายใครมีทหารมากกว่าฝ่ายนั้นก็จะชนะ และผู้ที่จะรบชนะในสนามรบมากกว่าจะเป็นฝ่ายชนะ จะเห็นได้ว่าหากต่างฝ่ายต่างวางกำลังสนามรบละ 20 นายเท่ากัน ก็จะไม่มีฝ่ายใดได้รับชัยชนะในสนามรบได้เลย ผลปรากฏว่ากลยุทธ์ที่กระจายกำลังทหารในแต่ละสนามรบตามลำดับดังนี้ 1 คนที่สนามรบ 1, 31 คน ที่สนามรบ 2, 31 คนที่สนามรบ 3, 25 คน ที่สนามรบ 4, 31 คน ที่สนามรบ 5 และ 1 คนที่สนามรบ 6 เป็นกลยุทธ์ที่ให้ชัยชนะสูงสุด ในการใช้คอมพิวเตอร์แข่งขันในลักษณะที่ให้ทุกคนได้แข่งขันกัน (Round Robin) การทดลองนี้แสดงให้เห็นว่า มนุษย์มีความต้องการที่จะเข้ามาอยู่ที่ตลาดกลาง และอาจมีประโยชน์ในการวางแผนรบทางการทหารอีกด้วย หวังว่าบทความนี้จะเป็นประโยชน์ สามารถนำไปปรับใช้กับการตัดสินใจในกรณีต่างๆ ทั้งธุรกิจและการใช้ชีวิตประจำวัน และช่วยให้พักสมองจากปัญหาการเมืองที่ตึงเครียดในปัจจุบันได้บ้างครับ