สมดุลของแนช ทฤษฎีเกมสำหรับนักเศรษฐศาสตร์ (จอห์นแนช)

ในช่วงทศวรรษที่ 1930 John von Neumann และ Oscar Morgensternกลายเป็นผู้ก่อตั้งทิศทางใหม่ที่น่าสนใจในวิชาคณิตศาสตร์ซึ่งเรียกว่า "ทฤษฎีเกม" ในปี 1950 John Nash นักคณิตศาสตร์รุ่นเยาว์เริ่มให้ความสนใจในด้านนี้ ทฤษฎีความสมดุลกลายเป็นหัวข้อของวิทยานิพนธ์ซึ่งเขาเขียนเมื่ออายุ 21 ปี กลยุทธ์เกมใหม่ที่เรียกว่า "Nash Equilibrium" จึงถือกำเนิดขึ้นซึ่งได้รับรางวัลโนเบลในอีกหลายปีต่อมา - ในปี 1994

สมดุลของแนช

ช่องว่างยาวระหว่างการเขียนวิทยานิพนธ์กับการรับรู้สากลกลายเป็นบททดสอบสำหรับนักคณิตศาสตร์ อัจฉริยะที่ไม่ได้รับการจดจำส่งผลให้เกิดความผิดปกติทางจิตอย่างร้ายแรง แต่ John Nash สามารถแก้ปัญหานี้ได้ด้วยความคิดเชิงตรรกะที่ยอดเยี่ยมของเขา ทฤษฎีของเขาเรื่อง "สมดุลของแนช" ได้รับรางวัลโนเบล และชีวิตของเขาถูกถ่ายทำในภาพยนตร์เรื่อง "จิตใจที่สวยงาม" ("เกมมายด์")

สั้นๆ เกี่ยวกับทฤษฎีเกม

เนื่องจากทฤษฎีสมดุลของแนชอธิบายพฤติกรรมของคนในแง่ของปฏิสัมพันธ์ จึงควรพิจารณาแนวคิดพื้นฐานของทฤษฎีเกม

ทฤษฎีเกมศึกษาพฤติกรรมของผู้เข้าร่วม (ตัวแทน)ในแง่ของการมีปฏิสัมพันธ์ซึ่งกันและกันเป็นเกมเมื่อผลลัพธ์ขึ้นอยู่กับการตัดสินใจและพฤติกรรมของคนหลายคน ผู้เข้าร่วมทำการตัดสินใจตามการคาดการณ์ของเขาเกี่ยวกับพฤติกรรมของผู้อื่น ซึ่งเรียกว่ากลยุทธ์ของเกม

นอกจากนี้ยังมีกลยุทธ์ที่โดดเด่นซึ่งผู้เข้าร่วมจะได้รับผลลัพธ์ที่ดีที่สุดสำหรับพฤติกรรมของผู้เข้าร่วมคนอื่นๆ นี่คือกลยุทธ์ win-win ที่ดีที่สุดสำหรับผู้เล่น

ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษและความก้าวหน้าทางวิทยาศาสตร์

ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษเป็นกรณีของเกมเมื่อผู้เข้าร่วมถูกบังคับให้ตัดสินใจอย่างมีเหตุผล บรรลุเป้าหมายร่วมกันเมื่อเผชิญกับความขัดแย้งของทางเลือก คำถามคือเขาจะเลือกทางเลือกใด โดยคำนึงถึงความสนใจส่วนตัวและประโยชน์ส่วนรวม ตลอดจนความเป็นไปไม่ได้ที่จะได้ทั้งสองอย่าง ผู้เล่นดูเหมือนถูกคุมขังในสภาพเกมที่ยากลำบาก ซึ่งบางครั้งทำให้พวกเขาคิดอย่างมีประสิทธิผลมาก

ตัวอย่างสมดุลของแนช

ภาวะที่กลืนไม่เข้าคายไม่ออกนี้ถูกสำรวจโดยนักคณิตศาสตร์ชาวอเมริกันจอห์น แนช. ความสมดุลที่เขาทำขึ้นนั้นเป็นการปฏิวัติในแบบของมันเอง โดยเฉพาะอย่างยิ่ง ความคิดใหม่นี้มีอิทธิพลต่อความคิดเห็นของนักเศรษฐศาสตร์เกี่ยวกับวิธีที่ผู้เล่นในตลาดตัดสินใจเลือก โดยคำนึงถึงผลประโยชน์ของผู้อื่น โดยมีปฏิสัมพันธ์อย่างใกล้ชิดและจุดตัดของผลประโยชน์

เป็นการดีที่สุดที่จะศึกษาทฤษฎีเกมด้วยตัวอย่างที่เป็นรูปธรรม เนื่องจากวินัยทางคณิตศาสตร์นี้เองไม่ใช่ทฤษฎีที่แห้งแล้ง

ตัวอย่างของภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

ตัวอย่าง คนสองคนก่อเหตุชิงทรัพย์ เข้าข้างมือของตำรวจและถูกสอบปากคำในห้องขังแยกกัน ในเวลาเดียวกัน เจ้าหน้าที่ตำรวจเสนอเงื่อนไขที่เอื้ออำนวยแก่ผู้เข้าร่วมแต่ละคน ซึ่งเขาจะได้รับการปล่อยตัวหากเขาให้การเป็นพยานกับคู่ของตน อาชญากรแต่ละคนมีชุดกลยุทธ์ต่อไปนี้ที่เขาจะพิจารณา:

  1. ทั้งสองเป็นพยานพร้อมกันและได้รับโทษจำคุก 2.5 ปี
  2. ทั้งคู่เงียบพร้อมกันและรับคนละ 1 ปี เนื่องจากในกรณีนี้หลักฐานความผิดของพวกเขาจะมีน้อย
  3. คนหนึ่งให้การเป็นพยานและได้รับอิสรภาพ ในขณะที่อีกคนนิ่งเงียบและถูกจำคุก 5 ปี

เห็นได้ชัดว่าผลของคดีขึ้นอยู่กับการตัดสินใจของทั้งคู่ผู้เข้าร่วม แต่พวกเขาไม่สามารถตกลงกันได้ เพราะพวกเขานั่งอยู่ในห้องขังต่างกัน ความขัดแย้งทางผลประโยชน์ส่วนตัวในการต่อสู้เพื่อผลประโยชน์ร่วมกันก็มองเห็นได้ชัดเจนเช่นกัน ผู้ต้องขังแต่ละคนมีทางเลือกสองทางสำหรับการดำเนินการและ 4 ตัวเลือกสำหรับผลลัพธ์

ห่วงโซ่ของการอนุมานเชิงตรรกะ

ดังนั้น ผู้กระทำผิด A จึงพิจารณาตัวเลือกต่อไปนี้:

  1. ฉันเงียบและคู่ของฉันเงียบ - เราทั้งคู่จะได้รับโทษจำคุก 1 ปี
  2. ฉันหันไปหาคู่ของฉันและเขาก็เปลี่ยนฉัน - เราทั้งคู่ติดคุก 2.5 ปี
  3. ฉันเงียบและคู่ของฉันทรยศฉัน - ฉันจะติดคุก 5 ปีและเขาจะเป็นอิสระ
  4. ฉันมอบคู่ครองของฉัน แต่เขาเงียบ - ฉันได้รับอิสระและเขาได้รับโทษจำคุก 5 ปี

นี่คือเมทริกซ์ของวิธีแก้ปัญหาที่เป็นไปได้และผลลัพธ์เพื่อความชัดเจน

ตารางผลลัพธ์ที่เป็นไปได้ของภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

ทฤษฎีสมดุลของแนช

คำถามคือ ผู้เข้าร่วมแต่ละคนจะเลือกอะไร?

“เงียบพูดไม่ได้” หรือ “เงียบไม่ได้ก็พูดไม่ได้”

เพื่อให้เข้าใจทางเลือกของผู้เข้าร่วม คุณต้องผ่านห่วงโซ่ความคิดของเขา ตามเหตุผลของความผิดทางอาญา ก: ถ้าฉันยังคงเงียบและคู่ของฉันยังคงเงียบ เราจะได้รับระยะเวลาขั้นต่ำ (1 ปี) แต่ฉันไม่สามารถทราบได้ว่าเขาจะประพฤติตัวอย่างไร ถ้าเขาให้การเป็นพยานปรักปรำฉัน ฉันก็ให้การเป็นพยานดีกว่า ไม่อย่างนั้นฉันนั่งลงได้ 5 ปี ฉันอยากนั่งลง 2.5 ปี มากกว่า 5 ปี ถ้าเขานิ่งเงียบ ยิ่งฉันต้องให้การเป็นพยาน เพราะด้วยวิธีนี้ ฉันจะได้รับอิสรภาพ ผู้เข้าร่วม B โต้แย้งในลักษณะเดียวกัน

จอห์น แนช บาลานซ์

เป็นเรื่องง่ายที่จะเห็นว่ากลยุทธ์ที่โดดเด่นสำหรับอาชญากรแต่ละคน - คือการให้การเป็นพยาน จุดที่ดีที่สุดของเกมนี้เกิดขึ้นเมื่ออาชญากรทั้งคู่ให้การเป็นพยานและรับ "รางวัล" - 2.5 ปีในคุก ทฤษฎีเกมแนชเรียกสิ่งนี้ว่าสมดุล

โซลูชันแนชที่ไม่เหมาะสมที่สุด

ลักษณะการปฏิวัติของมุมมองของแนชคือความสมดุลดังกล่าวไม่เหมาะสมเมื่อพิจารณาผู้เข้าร่วมเป็นรายบุคคลและผลประโยชน์ส่วนตัวของเขา ท้ายที่สุดแล้ว ตัวเลือกที่ดีที่สุดคืออยู่เงียบๆ และเป็นอิสระ

สมดุลของแนชเป็นจุดติดต่อความสนใจ โดยที่ผู้เข้าร่วมแต่ละคนเลือกตัวเลือกที่เหมาะสมที่สุดสำหรับเขาเท่านั้นโดยมีเงื่อนไขว่าผู้เข้าร่วมคนอื่นเลือกกลยุทธ์บางอย่าง

พิจารณาทางเลือกเมื่ออาชญากรทั้งสองเงียบและรับเพียง 1 ปีคุณสามารถเรียกมันว่าตัวเลือก Pareto-optimal อย่างไรก็ตาม เป็นไปได้ก็ต่อเมื่ออาชญากรสามารถตกลงล่วงหน้าได้ แต่ถึงแม้จะไม่รับประกันผลลัพธ์นี้ เนื่องจากความอยากที่จะถอยห่างจากข้อตกลงและหลีกเลี่ยงการลงโทษนั้นยิ่งใหญ่ ขาดความไว้วางใจซึ่งกันและกันอย่างสมบูรณ์และอันตรายจากการได้รับ 5 ปีบังคับให้เลือกตัวเลือกที่มีการยอมรับ การคิดว่าผู้เข้าร่วมจะยึดติดกับตัวเลือกของความเงียบ การแสดงคอนเสิร์ตนั้นไม่สมเหตุสมผล เราสามารถสรุปข้อสรุปดังกล่าวได้หากเราศึกษาสมดุลของแนช ตัวอย่างพิสูจน์ความจริงเท่านั้น

เห็นแก่ตัวหรือมีเหตุผล

ทฤษฎีสมดุลของแนชได้ข้อสรุปที่น่าตกใจหักล้างหลักการที่มีอยู่ ตัวอย่างเช่น อดัม สมิธถือว่าพฤติกรรมของผู้เข้าร่วมแต่ละคนมีความเห็นแก่ตัวโดยสิ้นเชิง ซึ่งทำให้ระบบมีความสมดุล ทฤษฎีนี้เรียกว่า "มือที่มองไม่เห็นของตลาด"

ทฤษฎีสมดุลของจอห์น แนช

จอห์น แนชเห็นว่าถ้าผู้เข้าร่วมทั้งหมดเป็นกระทำการแสวงหาผลประโยชน์ของตนเองเท่านั้นแล้วสิ่งนี้จะไม่นำไปสู่ผลลัพธ์ของกลุ่มที่ดีที่สุด เนื่องจากผู้เข้าร่วมแต่ละคนมีการคิดอย่างมีเหตุผล ทางเลือกที่เสนอโดยกลยุทธ์สมดุลของแนชจึงมีแนวโน้มมากกว่า

การทดลองเพศชายล้วนๆ

ตัวอย่างที่สำคัญคือเกมสีบลอนด์ Paradox ซึ่งถึงแม้จะดูไม่เหมาะสม แต่ก็แสดงให้เห็นชัดเจนว่าทฤษฎีเกมของแนชทำงานอย่างไร

ในเกมนี้คุณต้องจินตนาการว่าบริษัทพวกฟรีมาที่บาร์ ใกล้ๆ กันนั้นเป็นกลุ่มสาวผมบลอนด์ ผู้ชายมีพฤติกรรมอย่างไรเพื่อให้ได้แฟนที่ดีที่สุดสำหรับตัวเอง?

สถานการณ์สมดุล

ดังนั้นความคิดของผู้ชาย:หากทุกคนเริ่มคุ้นเคยกับสาวผมบลอนด์ก็เป็นไปได้มากว่าจะไม่มีใครเข้าใจเพื่อนของเธอจะไม่ต้องการทำความคุ้นเคย ไม่มีใครอยากเป็นทางเลือกที่สอง แต่ถ้าผู้ชายเลือกที่จะหลีกเลี่ยงสาวผมบลอนด์ ความน่าจะเป็นที่ผู้ชายแต่ละคนจะหาแฟนที่ดีในหมู่สาวๆ ก็ย่อมมีสูง

สถานการณ์สมดุลของแนชไม่เหมาะสมสำหรับพวกเพราะไล่ตามความสนใจที่เห็นแก่ตัวของตัวเองเท่านั้นทุกคนจะเลือกสาวผมบลอนด์ จะเห็นได้ว่าการแสวงหาผลประโยชน์ที่เห็นแก่ตัวเพียงอย่างเดียวจะเท่ากับการล่มสลายของผลประโยชน์กลุ่ม สมดุลของแนชจะหมายความว่าผู้ชายแต่ละคนทำเพื่อผลประโยชน์ของตัวเองซึ่งเกี่ยวข้องกับผลประโยชน์ของทั้งกลุ่ม นี่ไม่ใช่ตัวเลือกที่ดีที่สุดสำหรับทุกคนโดยส่วนตัว แต่ดีที่สุดสำหรับทุกคน โดยพิจารณาจากกลยุทธ์โดยรวมเพื่อความสำเร็จ

ทั้งชีวิตของเราคือเกม

การตัดสินใจในชีวิตจริงคล้ายกับเกมเมื่อคุณคาดหวังพฤติกรรมที่มีเหตุผลบางอย่างจากผู้เข้าร่วมคนอื่นๆ ในธุรกิจ ที่ทำงาน ในทีม ในบริษัท และแม้แต่ในความสัมพันธ์กับเพศตรงข้าม ตั้งแต่การทำธุรกรรมขนาดใหญ่ไปจนถึงสถานการณ์ชีวิตปกติ ทุกอย่างเป็นไปตามกฎหมายอย่างใดอย่างหนึ่ง

ทฤษฎีเกมแนช

แน่นอนสถานการณ์ของเกมที่พิจารณาด้วยอาชญากรและบาร์เป็นเพียงภาพประกอบที่ดีของความสมดุลของแนช ตัวอย่างของภาวะที่กลืนไม่เข้าคายไม่ออกดังกล่าวมักเกิดขึ้นในตลาดจริง และวิธีนี้ได้ผลโดยเฉพาะอย่างยิ่งในกรณีที่ผู้ผูกขาดสองคนควบคุมตลาด

กลยุทธ์ผสม

บ่อยครั้งเราไม่ได้มีส่วนร่วม แต่พร้อมกันในหลายเกม การเลือกตัวเลือกใดตัวเลือกหนึ่งในเกมหนึ่ง โดยใช้กลยุทธ์ที่มีเหตุผล แต่คุณจะจบลงในอีกเกมหนึ่ง หลังจากตัดสินใจด้วยเหตุผลบางอย่าง คุณอาจพบว่าผลลัพธ์ของคุณไม่เป็นที่ชื่นชอบ จะทำอย่างไร?

พิจารณากลยุทธ์สองประเภท:

  • กลยุทธ์ล้วนๆ คือพฤติกรรมของผู้เข้าร่วมที่มาจากการคิดถึงพฤติกรรมที่เป็นไปได้ของผู้เข้าร่วมคนอื่นๆ
  • กลยุทธ์แบบผสมหรือกลยุทธ์สุ่มคือการสลับของกลยุทธ์ล้วนๆ โดยการสุ่มหรือการเลือกกลยุทธ์ล้วนๆ ที่มีความน่าจะเป็นที่แน่นอน กลยุทธ์นี้เรียกอีกอย่างว่าการสุ่ม

สมดุลของแนชในกลยุทธ์แบบผสม

เมื่อพิจารณาถึงพฤติกรรมนี้ เราก็ได้ตัวใหม่ดูสมดุลของแนช หากก่อนหน้านี้มีการกล่าวว่าผู้เล่นเลือกกลยุทธ์เพียงครั้งเดียวก็สามารถจินตนาการถึงพฤติกรรมอื่นได้ สามารถสันนิษฐานได้ว่าผู้เล่นเลือกกลยุทธ์แบบสุ่มด้วยความน่าจะเป็นที่แน่นอน เกมที่สมดุลของแนชไม่สามารถพบได้ในกลยุทธ์ที่บริสุทธิ์มักมีเกมแบบผสม

สมดุลของแนชในกลยุทธ์แบบผสมเรียกว่าสมดุลแบบผสม นี่คือสมดุลที่ผู้เข้าร่วมแต่ละคนเลือกความถี่ที่เหมาะสมที่สุดในการเลือกกลยุทธ์ของตน โดยที่ผู้เข้าร่วมคนอื่นๆ จะเลือกกลยุทธ์ของตนด้วยความถี่ที่กำหนด

บทลงโทษและกลยุทธ์แบบผสม

ตัวอย่างของกลยุทธ์แบบผสมสามารถให้ได้ในเกมในฟุตบอล ภาพประกอบที่ดีที่สุดของกลยุทธ์แบบผสมอาจเป็นการยิงลูกโทษ ดังนั้น เรามีผู้รักษาประตูที่สามารถกระโดดเข้ามุมได้เพียงมุมเดียวเท่านั้น และผู้เล่นที่จะได้จุดโทษ

ดังนั้นหากผู้เล่นเลือกกลยุทธ์เป็นครั้งแรกเตะมุมซ้ายแล้วผู้รักษาประตูก็ตกมุมนี้รับบอลแล้วเหตุการณ์จะพัฒนาเป็นครั้งที่สองได้อย่างไร? หากผู้เล่นเตะมุมตรงข้าม มันอาจจะชัดเจนเกินไป แต่การชนกับมุมเดิมก็ชัดเจนเช่นเดียวกัน ดังนั้นทั้งผู้รักษาประตูและนักเตะจึงไม่มีทางเลือกอื่นนอกจากต้องอาศัยการสุ่มเลือก

ดังนั้น โดยการสลับการเลือกแบบสุ่มด้วยกลยุทธ์ที่บริสุทธิ์ ผู้เล่นและผู้รักษาประตูพยายามให้ได้ผลลัพธ์สูงสุด