Thứ Tư, 13 tháng 6, 2012

Lý thuyết Trò chơi (VI)


Lý thuyết Trò chơi (VI)

Don Ross

Người dịch: Hà Hữu Nga


6. Lý thuyết Trò chơi Tiến hóa

Gintis [2000, 2009] mới đây đã cảm thấy có lý do chính đáng trong việc tuyên bố một cách táo bạo “lý thuyết trò chơi là một ngôn ngữ phổ quát cho việc thống nhất các khoa học hành vi”. Cách nói như vậy có vẻ khác thường, nhưng lại hoàn toàn hợp lý. Binmore (1998, 2005) đã xây dựng mô hình lịch sử xã hội như là một loạt những hội tụ vào các cân bằng hiệu quả ngày càng tăng trong các trò chơi giao dịch đụng độ ngắt đoạn theo các phần trong đó một vài người cố thay đổi thành các cân bằng mới bằng cách bỏ các đường dẫn cân bằng tĩnh như là kết quả của các tai biến giai đoạn. (Chẳng hạn Stalin đã cố thay đổi xã hội của ông thành một tập hợp các cân bằng trong đó người ta quan tâm nhiều hơn đến cái cường quốc chính trị, quân sự và công nghiệp tương lai của đất nước họ hơn là quan tâm đến cuộc sống riêng của họ. Ông đã không thành công; tuy nhiên các nỗ lực của ông thực sự đã tạo ra một tình huống mà trong một vài thập kỷ nhiều người Sô viết đã gán tầm quan trọng không đáng kể cho cuộc sống của những người khác dưới mức bình thường). Hơn nữa các ứng dụng lý thuyết trò chơi vào các đề tài hành vi đã mở rộng vượt khỏi vũ đài chính trị.

Chẳng hạn vào năm 1969, nhà triết học David Lellog Lewis đã xuất bản cuốn Qui ước (Convention: A Philosophical Study, 1969, Havard University Press), trong đó khung khái niệm của lý thuyết trò chơi đã được áp dụng vào một trong những vấn đề cơ bản của tri thức luận thế kỷ XX, bản chất và mức độ của các qui ước thống trị ký hiệu học và mối quan hệ của nó với sự biện minh cho các niềm tin mang tính định đề. Cuốn sách này đã đứng được như một trong những tác phẩm kinh điển của triết học phân tích, và danh tiếng của nó hiện đang ngày càng nổi bật khi chúng ta ngày càng thức tỉnh về ý nghĩa vạch đường của nó. Việc sử dụng ví dụ đơn giản này có thể đưa lại cho chúng ta một sự hiểu biết rất cơ bản. Từ “gà” là để chỉ những con gà và từ “đà điểu” là để chỉ những con đà điểu. Chúng ta cũng sẽ không trở nên tốt hơn hay xấu hơn khi “gà” lại chỉ đà điểu, và “đà điểu” lại để chỉ gà; tuy nhiên chúng ta sẽ trở nên xấu đi nếu một nửa trong số chúng ta sử dụng một cặp từ theo cách thứ nhất, và một nửa theo cách thứ hai, hoặc nếu tất cả chúng ta tùy tiện sử dụng chúng để qui vào những con chim không biết bay nói chung.

Tất nhiên các tri thức này đã có trước Lewis; nhưng điều mà ông nhận ra là ở chỗ tình huống này mang hình thức logic của một trò chơi phối hợp. Vì vậy trong khi những qui ước đặc biệt có thể mang tính võ đoán thì các cấu trúc tương tác duy trì chúng và làm cho chúng bền vững thì lại không võ đoán. Hơn nữa các cân bằng liên quan đến việc phối hợp về các ý nghĩa-danh từ lại có vẻ là có một yếu tố võ đoán chỉ vì chúng ta không thể phân loại chúng theo cân bằng Pareto; nhưng Millikan (1984) đã ngầm chỉ ra rằng về phương diện này chúng không điển hình cho các phối hợp ngôn ngữ. Nói chung các loại cân bằng Nash khác nhau trong các trò chơi phối hợp thường thường đều có thể được phân loại. Ross & LaCasse (1995) đã đưa ra ví dụ sau. Trong một thành phố, những người lái xe phải điều phối dựa vào một trong những cân bằng Nash liên quan đến hành vi của họ ở chỗ có đèn giao thông. Tất cả phải đi gấp khi đèn vàng và dừng lại để đợi đèn xanh hoặc đi chậm lại khi đèn vàng hoặc vọt lên khi chuyển sang đèn xanh. Cả hai mô hình này đều là cân bằng Nash trong đó một khi cộng đồng đã phối hợp vào một trong số cân bằng đó thì không một cá nhân nào có một động cơ để vi phạm: những người nào đi chậm lại khi có đèn vàng trong khi những người khác lại lao vào họ thì họ sẽ bị đâm vào đuôi xe, trong khi những người khác vọt lên khi đèn vàng trong sự cân bằng khác thì sẽ có nguy cơ va chạm với vọt lên nhanh khi đèn xanh. Vì vậy, khi một mô hình giao thông thành phố đặt trên một trong những cân bằng này thì nó sẽ có khuynh hướng dừng lại ở đó. Tuy nhiên cả hai tình trạng trên đều không phải là những trung lập-Pareto, vì cân bằng Nash thứ hai cho phép nhiều xe rẽ trái trong mỗi chu kỳ (theo luật tay lái bên phải), là loại giảm mức độ cổ trai và cho phép tất cả các lái xe hy vọng đạt hiệu quả cao hơn trong giao thông.

Những qui ước về các tiêu chuẩn bằng chứng và tính duy lý có vẻ thuộc về đặc trưng này. Trong khi có nhiều sự bố trí có thể là cân bằng Nash trong các trò chơi xã hội của khoa học, vì các môn đệ của Thomas Kuhn muốn nhắc chúng ta rằng không thể có chuyện tất cả mọi cân bằng này đều dựa vào đường cong trung hòa Pareto. Những đề tài này đã được thể hiện rõ ràng trong nhận thức luận hiện đại, trong triết học khoa học, triết học ngôn ngữ mà tất cả đều là di vật của lý thuyết trò chơi theo cách của Lewis (chí ít thì cũng gián tiếp). (Người đọc có thể phát hiện ra nhiều ví dụ ứng dụng và qui chiếu hơn trong các tập văn liệu lớn hơn, trong Nozick 1998). Tuy nhiên Lewis đã giới hạn sự chú ý của mình vào lý thuyết trò chơi tĩnh trong đó các tác nhân chọn các chiến lược là những hàm tiện ích cố định ngoại sinh. Như một kết quả của sự giới hạn này, việc lý giải của ông có thể chỉ cho chúng ta thấy tại sao các qui ước này lại quan trọng và bền vững, nhưng nó lại làm nảy sinh một vấn đề khó khăn và có lẽ không hiệu quả đối với một lý thuyết tổng quát về tính duy lý. Có hiện tượng đó là vì như chúng ta đã thấy ở phần 3 ở trên, trong các trò chơi kết hợp (và các trò chơi khác) có rất nhiều cân bằng Nash, cái được coi là một giải pháp chính là cái nhạy cảm cao với các phỏng đoán được thực hiện bởi các tay chơi về các niềm tin và khả năng tính toán của một tay chơi khác. Điều này gây ra một sự chú ý đáng kể, đặc biệt là từ các nhà triết học về những mối liên hệ của nhiều loại khác biệt mơ hồ trong các chuẩn mực của tính duy lý chiến lược. Tuy nhiên nếu như lý thuyết trò chơi thực sự giải thích được các hành vi tự nhiên và lịch sử của nó theo cái cách do Gintis (2000) gợi ý thì chúng ta cần một lý giải nào đó về cái có tính hấp dẫn về những cân bằng trong các trò chơi thậm chí ngay cả khi không có bất cứ nhà phân tích hoặc nhà tính toán duy lý nào ở xung quanh để xác định chúng. Việc thực hiện cái qui chiếu đối với đề tài của Lewis khi ngôn ngữ của con người đã được phát triển thì lại không có bất cứ một trọng tài nào ở bên ngoài để phân xử và bố trí cho hiệu quả Pareto. Vì vậy để hiểu được chủ nghĩa lạc quan của Gintis về việc tiếp cận được với lý thuyết trò chơi chúng ta cần phải mở rộng sự chú ý của mình vào các trò chơi mang tính tiến hóa.

Các lý thuyết trò chơi đã được ứng dụng một cách thành công vào sinh học tiến hóa mà trong đó các loài và/hoặc các gen được đối xử như là những tay chơi từ công trình tiên phong của Maynard Smith (1982) và những người cộng tác với ông. Lý thuyết trò chơi tiến hóa (hoặc động) đã kích thích cho sự mở rộng của toán học mới một cách đáng kể để có thể ứng dụng vào nhiều môi trường trừ môi trường sinh học.  Vì vậy mà Skyrms (1996) đã sử dụng lý thuyết trò chơi tiến hóa để cố gắng trả lời các câu hỏi mà ngay cả Lewis cũng chưa đặt được câu hỏi, về các điều kiện mà ngôn ngữ, các khái niệm về công lý, khái niệm về tài sản tư nhân, và những hiện tượng chung không được thiết kế khác đã thu hút mối quan tâm của các nhà triết học. Điều mới đối với lý thuyết trò chơi tiến hóa chính là các vận động không được lựa chọn bởi các tác nhân duy lý. Thay vào đó, các tác nhân này lại được cứng hóa (hard-wired - kiểm soát bằng các mạch điện tử) một cách điển hình bằng những chiến lược đặc biệt và sự thành công đối với một chiến lược được xác định trong khuôn khổ số bản copies mà một chiến lược tự để lại để chơi trong các trò chơi của những thế hệ tiếp theo. Vì vậy bản thân các chiến lược cũng là những tay chơi và các trò chơi mà họ chơi thì năng động chứ không tĩnh tại.

Việc thảo luận về vấn đề này gắn liền với các luận điểm của Skyrms. Chúng ta hãy bắt đầu bằng việc giới thiệu động học sao chép. Trước hết hãy xem xét lựa chọn tự nhiên đã họat động như thế nào để thay đổi các giống loài động vật, bằng cách biến đổi, tạo ra và hủy diệt các loài. Cơ chế cơ bản là sinh sản khác biệt. Bất cứ động vật nào có các đặc điểm có thể di truyền làm tăng số lượng con cái mong muốn của chúng trong một môi trường nhất định thì đều có khuynh hướng để lại nhiều con cái hơn những loài khác chừng nào môi trường vẫn còn tương đối bền vững. Thế hệ con cái ấy sẽ kế thừa những đặc điểm đã được nêu ra. Vì vậy tỷ lệ của những đặc điểm này trong cư dân của chúng sẽ tăng dần khi các thế hệ lần lượt qua đời. Một số đặc điểm này có thể đi đến cố định, có nghĩa là cuối cùng chúng kế tục toàn bộ cư dân (cho đến khi nào môi trường thay đổi).

Lý thuyết trò chơi có thể tiếp cận với vấn đề này như thế nào? Thông thường một trong những khía cạnh quan trọng nhất của một môi trường sinh vật sẽ là những khuynh hướng hành vi của những sinh vật khác. Chúng ta có thể nghĩ về mỗi loài như là đang “cố gắng” tối đa hóa tính thích ứng (= số cháu chắt mong muốn) thông qua việc xác định các chiến lược tối ưu của những loài khác. Vì vậy lý thuyết tiến hóa là một lĩnh vực khác của việc ứng dụng cho phân tích phi tham số. Trong lý thuyết trò chơi động, chúng ta không còn nghĩ về các cá thể như là sự lựa chọn những chiến lược khi chúng vận động từ một trò chơi này đến một trò chơi khác. Có điều đó là vì các lợi ích của chúng ta là khác nhau. Giờ đây chúng ta ít quan tâm đến việc phát hiện ra các cân bằng của những trò chơi đơn hơn là phát hiện ra những cân bằng bền vững, và việc chúng thay đổi ra sao theo thời gian. Vì vậy giờ đây chúng ta xây dựng mô hình các chiến lược tự thân khi chơi với nhau. Một chiến lược được coi là “tốt hơn” chiến lược khác khi nó để lại nhiều bản sao của nó cho những thế hệ tiếp theo, khi trò chơi sẽ được chơi lại. Chúng ta nghiên cứu những thay đổi trong việc phân phối các chiến lược trong cư dân như là trật tự của việc mở rộng các trò chơi. Đối với lý thuyết trò chơi động, chúng tôi giới thiệu một khái niệm cân bằng (theo Maynard Smith 1982). Một tập chiến lược theo một tỷ lệ đặc biệt (chẳng hạn 1/3:2/3, a, 1/9:8/9, 1/3:1/3:1/6:1/6 – luôn luôn có tổng là 1) ở một ESS (Evolutionary Stable Strategy) cân bằng ngay trong trường hợp (1) không cá nhân nào chơi một chiến lược lại có thể cải thiện được tính thích ứng tái sinh sản của nó bằng cách chuyển sang một trong những chiến lược khác theo tỷ lệ, và (2) không một biến dị nào chơi một chiến lược khác lại hoàn toàn có thể tự mình hình thành (“xâm lược”) trong cư dân.

Các nguyên tắc của lý thuyết trò chơi tiến hóa được lý giải tốt nhất thông qua các ví dụ. Skyrms bắt đầu bằng việc khảo sát các điều kiện trong đó một ý nghĩa công lý được hiểu như là một khuynh hướng để coi những phân chia bình đẳng các nguồn là công bằng trừ khi những xem xét về mặt hiệu quả gợi ý khác đi trong những trường hợp đặc biệt – có thể xuất hiện. Ông đề nghị chúng ta xem xét một cư dân trong đó các cá thể gặp nhau đều đặn và phải thương lượng về các nguồn.

Bắt đầu với ba loại cá thể:

a. Những người ưa công bằng luôn luôn yêu cầu một nửa các nguồn
b. Những người tham lam luôn luôn yêu cầu nhiều hơn một nửa. Khi một người tham lam đối mặt với một người tham lam khác thì họ lãng phí các nguồn vào việc tranh giành nó.
c. Những người khiêm tốn luôn luôn yêu cầu ít hơn một nửa các nguồn. Khi một người khiêm tốn đối mặt với một người khiêm tốn khác thì họ lấy ít hơn toàn bộ các nguồn có sẵn và lãng phí một số lượng nào đó.

Mỗi cuộc đọ sức đơn lẻ nơi mà tổng số cá thể yêu cầu tổng cộng lên đến 100% thì là một cân bằng Nash của cái trò chơi cá nhân đó. Tương tự như vậy, có thể có nhiều cân bằng động. Giả sử rằng những người tham lam yêu cầu 2/3 tổng số các nguồn và những người khiêm tốn yêu cầu 1/3. Vậy thì có 2 phần là các chiến lược tiến hóa bền vững ESSs:

- Một nửa cư dân tham lam và một nửa khiêm tốn. Chúng ta có thể tính khoản được trả trung bình ở đây. Những người khiêm tốn lấy 1/3 các nguồn trong mỗi cuộc đối đầu. Người tham lam lấy 2/3 khi cô ta gặp người Khiêm tốn, nhưng lại không được gì khi cô ta gặp người tham lam khác. Vì vậy khoản nhận được trung bình của cô ta cũng là 1/3. Đây là một ESS bởi vì Người công bằng không thể xâm phạm đến kẻ khác. Khi người Công bằng gặp người Khiêm tốn anh ta nhận 1/2. Nhưng khi Người công bằng gặp Người tham lam anh ta không nhận được gì. Vì vậy cái khoản nhận được trung bình của anh ta chỉ là 1/4. Không có Người khiêm tốn nào có một  động cơ để thay đổi các chiến lược, và cũng không có bất cứ Người tham lam nào làm như vậy. Một người Công bằng đột biến xuất hiện trong dân cư sẽ chơi kém nhất, và sự lựa chọn như vậy sẽ không cổ vũ cho sự truyền bá của bất cứ đột biến nào như vậy.

- Toàn bộ những người chơi đều là Người công bằng. Mỗi người luôn luôn nhận một nửa các nguồn, và không người nào có thể chơi tốt hơn bằng cách thay đổi thành một chiến lược khác. Những người tham lam tham gia vào cư dân này phải đối diện với những người công bằng và nhận một khoản được trả trung bình bằng 0. Những người khiêm tốn nhận 1/3 như trước, nhưng phần này lại ít hơn phần của người Công bằng là 1/2. Cần lưu ý rằng cân bằng (i) là không hiệu quả, vì khoản trung bình nhận được đối với toàn bộ cư dân thì nhỏ hơn. Tuy nhiên hệt như vậy các kết quả không hiệu quả có thể là các cân bằng Nash NE của các trò chơi tĩnh tại này, vì vậy chúng có thể là những cân bằng NE động của ESS.

Chúng tôi qui vào các cân bằng trong đó xuất hiện nhiều hơn một chiến lược với tư cách là những đa hình. Nhìn chung trong trò chơi Skyrms, bất cứ đa hình nào trong đó những Người tham lam yêu cầu x và Người khiêm tốn yêu cầu 1 – x thì đó là một ESS. Vấn đề là ở chỗ những lợi ích mà người nghiên cứu công bằng quan tâm lại chính là khả năng có thể xảy ra tương đối với những gì mà các cân bằng khác xuất hiện.

Điều này phụ thuộc hoàn toàn vào các cân xứng chiến lược trong tình trạng cư dân gốc. Nếu cư dân đó bắt đầu với nhiều hơn một Người công bằng thì có một xác suất nào đó mà Người công bằng sẽ đối diện với nhau, và lấy phần được chia trung bình có thể là cao nhất. Những Người khiêm tốn tự thân họ không ngăn cản sự mở rộng của những Người công bằng; chỉ có những người tham lam mới làm như vậy. Nhưng những người tham lam, tự thân họ lại phụ thuộc vào việc có những người khiêm tốn ở xung quanh để có thể tồn tại và trụ vững. Vậy là trong cư dân xuất hiện nhiều người công bằng hơn liên quan đến các cặp Tham lam và Khiêm tốn, thì những người công bằng ưu tú hơn sẽ chơi ở mức trung bình. Điều đó ám chỉ một hiệu quả ngưỡng. Nếu tỷ lệ những người công bằng rớt thấp dưới 33% thì khuynh hướng đối với họ sẽ là rơi vào tuyệt chủng vì họ thường không thể thỏa mãn nhau được. Nếu cư dân của những người công bằng tăng lên trên 33% thì khuynh hướng đối với họ sẽ là tăng đến mức ổn định vì những mối lợi gia tăng của họ khi họ có thể đáp ứng được cho nhau  thì nó sẽ bù đắp cho những mất mát của họ khi họ gặp những người tham lam. Bạn có thể thấy điều này bằng cách lưu ý rằng khi mỗi chiến lược được sử dụng khoảng 33% cư dân thì tất cả đều nhận một khoản được trả là 1/3. Vì vậy bất cứ chiến lược nào vượt lên trên ngưỡng này về phía những người Công bằng sẽ có khuynh hướng đẩy họ đến cố định hóa. Kết quả này chỉ ra rằng bằng cách nào mà các điều kiện tương đối tổng thể nhất định đã cho, công lý như chúng ta đã định nghĩa có thể xuất hiện một cách năng động. Tin tức cho những người hâm mộ công lý sẽ trở nên đáng phấn khởi hơn nếu chúng ta giới thiệu lối chơi tương liên.

Cái mô hình mà chúng ta vừa mới xem xét giả định rằng các chiến lược không liên hệ gì với nhau, có nghĩa là xác suất mà mỗi chiến lược thỏa mãn một chiến lược khác là một hàm đơn của những tần số xuất hiện có liên quan trong cư dân. Giờ đây chúng ta hãy xem xét cái gì xảy ra trong trò chơi phân chia nguồn lực động của chúng ta khi chúng ta giới thiệu thế tương liên. Giả định rằng những người công bằng có đôi chút khả năng để phân biệt và tìm ra những người công bằng khác như là các bên đối tác tương liên. Trong trường hợp đó những người công bằng trung bình chơi tốt hơn và điều này phải có hiệu quả của việc làm thấp đi cái ngưỡng của họ để chuẩn bị đi đến cố định hóa. Một người xây dựng mô hình trò chơi động nghiên cứu các hiệu quả của mối tương liên và các giới hạn tham số khác bằng phương pháp vận hành các mô phỏng computer lớn trong đó các chiến lược cạnh tranh với nhau hết vòng nọ đến vòng kia trong môi trường ảo. Những cân xứng ban đầu của các chiến lược và bất kỳ cấp độ tương quan lựa chọn nào đều đơn giản có thể được thiết lập trong chương trình. Vậy thì người ta có thể nhìn vào động thái của nó trải ra theo thời gian, và đo lường tỷ lệ thời gian mà nó dừng lại trong bất cứ một cân bằng nào. Những tỷ lệ này được thể hiện bằng các kích cỡ tương đương của các vùng hấp lực đối với các cân bằng khả thể khác nhau. Các cân bằng là những điểm hấp dẫn trong một không gian động; một vùng hấp lực cho mỗi điểm như vậy là một tập hợp các điểm trong không gian mà từ đó cư dân kia sẽ hội tụ thành sự cân bằng đã được đặt ra.

Khi đưa mối tương quan vào mô hình của mình, trước hết Skyrms đã thiết lập mức độ tương liên ở một điểm rất nhỏ 1) điều đó làm cho vùng hấp lực cân bằng (i) để co rút lại bằng một nửa. Khi mức độ tương liên được thiết lập thành 2) vùng đa hình sẽ qui giản thành điểm mà ở đó cư dân kia bắt đầu trở thành đa hình. Vì vậy những số lượng tương liên rất nhỏ tăng lên đã tạo ra những số lượng tăng tỷ lệ lớn trong tính bền vững của sự cân bằng mà ở đó mỗi tay chơi đều chơi như một người công bằng. Một số lượng nhỏ mối tương liên tăng lên là một định đề hữu lý trong hầu hết các cư dân mà ở đó những người hàng xóm có khuynh hướng tương tác với một người khác và bắt chước một người khác (cả về phương diện di truyền hoặc vì những thiên hướng trở thành bản sao của nhau một cách cố ý), và vì về phương diện di truyền những động vật tương tự dường như thích sống trong các môi trường chung hơn. Vì vậy nếu sự công bằng có thể xuất hiện toàn bộ thì nó sẽ có khuynh hướng trở thành thống trị và bền vững. Hầu hết triết học chính trị đều bao gồm những cố gắng để sản xuất ra các lý lẽ định chuẩn diễn dịch nhằm thuyết phục một tác nhân không ưa công bằng rằng cô ta có những lý do để hành động một cách công bằng. Phân tích của Skyrms đã đưa ra một cách tiếp cận hoàn toàn khác. Người công bằng sẽ chơi tốt trong một trò chơi động nếu anh ta thực hiện những bước tích cực để bảo toàn sự tương liên. Vì vậy có một sức ép tiến hóa đối với cả những thể chế tiếp cận đạo đức của công lý và các thể chế công lý làm cho chúng xuất hiện. Hầu hết mọi người có thể nghĩ rằng những cách chia 50-50 là công bằng và duy trì một cách xứng đáng bằng sự thừa nhận cũng như bằng phần thưởng đạo đức và thể chế vì chúng ta là những sản phẩm của một trò chơi năng động thúc đẩy chúng ta suy nghĩ theo khuynh hướng này. 

Đề tài được nhiều người quan tâm nhất từ các nhà lý thuyết trò chơi tiến hóa là lòng vị tha, được xác định là bất cứ hành vi nào của một sinh vật nhằm làm giảm đi khả năng truyền gen mong muốn cho các thế hệ sau trong một tương tác đơn, nhưng lại làm tăng khả năng đó cho kẻ tương tác khác. Điều đó rất thông dụng trong tự nhiên. Tuy nhiên đấu tranh sinh tồn Darwin đã xuất hiện thế nào? Skyrms nghiên cứu vấn đề này bằng cách sử dụng Nan đề Người tù động làm ví dụ của mình. Đây chỉ đơn giản là một loạt trò chơi PD trong một cư dân, trong đó một vài thành viên là những kẻ bội ước và một số là những người hợp tác. Các khoản được trả, khi luôn luôn ở trong những trò chơi động, được đo lường bằng khuôn khổ của những số lượng bản sao của mỗi chiến lược trong các thế hệ tương lai. Chúng ta hãy coi U(A) là khả năng truyền gen trung bình của chiến lược A trong cư dân. Hãy coi U là khả năng truyền gen trung bình của toàn bộ cư dân. Vậy là sự cân xứng chiến lược A trong thế hệ tiếp theo thực sự là tỷ lệ U(A)/U. Vậy thì nếu A có khả năng truyền gen lớn hơn thì mức độ trung bình A của cư dân tăng lên. Nếu A có khả năng truyền gen thấp hơn mức độ trung bình của cư dân thì A giảm.

Trong trò chơi PD động mà ở đó mối tương tác là hiếm hoi (tức là không có tương liên), thì những tay chơi bội ước sẽ chơi tốt hơn mức độ trung bình của cư dân chừng nào có những tay chơi hợp tác xung quanh. Điều này kéo theo một thực tiễn là như chúng ta đã thấy ở phần 2.4, sự bội ước luôn luôn là một chiến lược thống trị trong một trò chơi đơn. Vì vậy 100% bội ước là ESS trong trò chơi động không có tương liên, phù hợp với cân bằng Nash trong trò chơi PD tĩnh một lần duy nhất. Tuy nhiên việc giới thiệu khả năng tương liên đã làm thay đổi tận gốc dễ vấn đề. Giờ đây chúng ta cần tính toán khả năng truyền gen trung bình của một chiến lược có xác suất nhất định của chiến lược có thể thỏa mãn nhau. Trong trò chơi PD động, những người hợp tác có xác suất thỏa mãn những người hợp tác khác cao thì chơi tốt hơn những người bội ước mà xác suất thỏa mãn những người bội ước khác cao. Vì vậy tương liên hỗ trợ cho sự hợp tác.  Để có thể nói một điều gì đó chính xác hơn về mối quan hệ giữa tương liên và hợp tác ấy (và để có thể liên hệ lý thuyết trò chơi tiến hóa với các vấn đề trong lý thuyết quyết định, một vấn đề nằm ngoài phạm vi bài báo này), Skyrms đã giới thiệu một khái niệm kỹ thuật mới. Ông gọi một chiến lược là có thể chấp nhận về phương diện thích nghi nếu có một vùng xung quanh điểm cố định của nó trong không gian động từ bất cứ nơi nào trong vùng đó thì nó sẽ đi tới cố định. Trong trò chơi PD động, cả bội ước và hợp tác đều có thể được chấp nhận về phương diện thích nghi. Kích cỡ có liên quan của các vùng hấp lực nhạy cảm rất cao đối với các cơ chế mà sự tương liên đạt được. Để minh họa cho vấn đề này, Skyrms đã đưa ra một số ví dụ.

Một trong những mô hình của Skyrms đã giới thiệu mối tương quan bởi phương tiện là một bộ lọc theo cặp do sự tương tác. Giả sử rằng trong vòng 1 của trò chơi PD động các cá nhân kiểm soát nhau và tương tác, hoặc không, đều tùy thuộc vào cái mà họ phát hiện ra. Trong vòng chơi thứ hai và các vòng tiếp theo tất cả các cá nhân không chơi thành cặp trong vòng 1 thì hiếm khi cặp với nhau. Trong trò chơi này, vùng hấp lực cho sự bội ước là rộng lớn trừ khi có một tỷ lệ cao những người hợp tác trong vòng 1. Trong trường hợp này những người bội ước không thể chơi cặp trong vòng 1 được, sau đó họ hầu hết chơi cặp với nhau trong vòng 2 và dẫn nhau đến tuyệt diệt. Một mô hình thú vị hơn vì cơ chế của nó ít giả tạo, không cho phép các cá nhân lựa chọn các đối tác của họ, nhưng lại đòi hỏi họ tương tác với những đối tác gần gũi với họ nhất. Bởi vì những mối quan hệ di truyền (hoặc học văn hóa bằng cách sao chép) nên dường như các cá nhân tương đồng với các hàng xóm của họ hơn là không. Nếu nhóm cư dân hữu hạn này được dàn trận theo một phương (tức là dọc theo một tuyến) và tất cả những người hợp tác và những người bội ước hiếm khi đều được đưa vào các vị trí cùng với nó thì chúng ta sẽ có được động thái dưới đây. Những người hợp tác biệt lập có khả năng truyền gen mong muốn thấp hơn những người bội ước xung quanh và bị dẫn một cách cục bộ tới tuyệt diêt.

Các thành viên của các nhóm thuộc hai người hợp tác có một xác suất 50% tương tác với nhau, và 50% tương tác với những người bội ước. Kết quả là khả năng truyền gen mong đợi trung bình của họ vẫn nhỏ hơn khả năng của những người hàng xóm bội ước và họ cũng phải đối mặt với khả năng tuyệt diệt. Các nhóm ba người hợp tác tạo thành một điểm không bền vững mà từ đó cả sự tuyệt diệt lẫn sự phát triển đều ngang bằng nhau. Tuy nhiên trong các nhóm 4 người hoặc số người hợp tác nhiều hơn thì ít nhất là một sự đối đầu của một người hợp tác với một người hợp tác khác chí ít cũng đủ để đảm bảo thay thế nhóm nguyên gốc. Trong hoàn cảnh đó, những người hợp tác tạo thành một nhóm thì chơi tốt hơn những người bội ước xung quanh và chi phí của họ tăng lên. Cuối cùng những người hợp tác hầu như đi đến cố định – nhưng không hoàn toàn. Những người bội ước đơn độc ở ngoại vi của cư dân làm hại những người hợp tác ở những vòng cuối cùng và sống sót như những cộng đồng “tội phạm” nhỏ. Vì vậy chúng ta thấy rằng lòng vị tha có thể không chỉ được duy trì bởi động thái của các trò chơi tiến hóa, mà với mối tương liên, nó thậm chí có thể phát triển và định cư ở những cư dân về nguồn gốc là không có lòng vị tha.

Vì vậy động thái Darwin đưa ra những tin tức có chất lượng tốt cho sự hợp tác. Tuy nhiên cần phải nhớ rằng điều này chỉ đứng vững chừng nào các cá nhân còn bị mắc kẹt với các chương trình văn hóa hoặc tự nhiên của họ và không thể tái định giá các tiện ích cho chính bản thân họ. Nếu các tác nhân của chúng ta quá thông minh và linh họat thì họ có thể nhận ra rằng họ đang chơi các trò chơi PD và có lẽ tất cả đều bị thất bại. Cuối cùng trong trường hợp này, họ thực sự đưa bản thân mình đến tuyệt diệt – trừ khi họ phát triển những chuẩn mực đạo đức hiệu quả và bền vững nhằm củng cố sự hợp tác. Nhưng tất nhiên đây chỉ là những cái mà chúng ta mong muốn làm tiến triển trong các cư dân động vật mà các cấp độ khả năng truyền gen trung bình được liên kết chặt chẽ với các khả năng hợp tác xã hội thành công của chúng. Ngay cho dù như vậy thì các cư dân này cũng sẽ tuyệt diệt ngoại trừ chúng quan tâm đến các thế hệ tương lai vì một lý do nào đó. Nhưng không hề có những lý do chính đáng để chúng ta suy nghĩ về việc tại sao các tác nhân nên quan tâm đến các thế hệ tương lai nếu như mỗi thế hệ mới lại thay thế toàn bộ những thế hệ đi trước ở mỗi thay đổi của các nhóm người. Vì lý do này các nhà kinh tế sử dụng mô hình “trồng xếp thế hệ” khi xây dựng mô hình các trò chơi phân phối. Các cá nhân trong thế hệ 1 -  những người kéo dài đến thế hệ 5 – sẽ tiết kiệm các nguồn cho thế hệ 3 là những người mà họ muốn hợp tác cùng; và đến thế hệ 3 thì các cá nhân mới sẽ quan tâm đến thế hệ 6; và v.v….

7. Lý thuyết Trò chơi và Bằng chứng Hành vi

Trong các phần trước chúng ta đã xem xét một số vấn đề xuất hiện từ việc xử lý lý thuyết trò chơi cổ điển (không tiến hóa) như một lý thuyết định chuẩn là thứ thể hiện cho người ta về cái mà người ta phải làm nếu họ muốn trở thành duy lý trong các tình huống chiến lược. Vấn đề khó khăn như chúng ta thấy là hình như không có một khái niệm giải pháp để chúng ta có thể dứt khoát phó thác cho mọi tình huống. (Trong các trò chơi loại hình mở rộng thuộc lĩnh vực thông tin hoàn hảo, cũng tồn tại vấn đề nghịch lý của sự qui nạp ngược). Tuy nhiên chúng ta lưu ý rằng sự khước từ này không áp dụng cho lý thuyết trò chơi được coi là một dạng toán học là thứ có thể dùng để mô tả hành vi thực. Vậy thì rất tự nhiên xuất hiện một câu hỏi: Có phải lý thuyết trò chơi đã thực sự giúp đỡ cho các nhà nghiên cứu kinh nghiệm chủ nghĩa thực hiện các phát hiện mới về hành vi (con người hoặc cái gì khác nữa)? Nếu vậy thì, về đại thể, cái gì là nội dung của những phát hiện này?

Khi ấn định câu hỏi này, chúng ta phải đứng trước một vấn đề tri thức luận trực tiếp. Không có cách nào áp dụng lý thuyết trò chơi như là một thứ mà “tất cả đều do chính bản thân nó” một cách độc lập khỏi việc xây dựng mô hình các công nghệ. Khi sử dụng tiêu chuẩn thuật ngữ trong triết học khoa học, người ta có thể kiểm tra một mô hình lý thuyết trò chơi của một hiện tượng chỉ trong trường hợp người nọ sau người kia với “các định đề phụ” về hiện tượng được đặt ra. Tối thiểu thì điều này cũng xảy ra nếu ai đó tuyệt đối xử lý lý thuyết trò chơi thuần túy như một phép toán mà không có nội dung kinh nghiệm chủ nghĩa của riêng bản thân nó. Theo một nghĩa nào đó, một lý thuyết không có nội dung kinh nghiệm chủ nghĩa thì sẽ không bao giờ để ngỏ cho sự kiểm nghiệm; người ta có thể chỉ băn khoăn về việc là liệu các tiên đề của một lý thuyết có luôn nhất quán không. Dù sao thì một lý thuyết toán cũng có thể được đánh giá liên quan đến tính chất hữu dụng mang tính kinh nghiệm chủ nghĩa. Một loại phê phán triết học đôi khi cũng được thực hiện bằng lý thuyết trò chơi, được lý giải như là một công cụ toán học để xây dựng mô hình các hiện tượng hành vi, có nghĩa là việc ứng dụng nó luôn luôn hoặc thường xuyên yêu cầu viện đến các định đề sai, giả hoặc thô giản về những hiện tượng này. Chúng ta hy vọng sự phê phán này có những mức độ sức mạnh khác nhau trong những khung cảnh ứng dụng khác nhau khi những định đề phụ là khác biệt nhau.

Hóa ra vấn đề là như vậy. Không có lĩnh vực nào thú vị trong đó những ứng dụng lý thuyết trò chơi lại hoàn toàn không gây tranh cãi. Tuy nhiên đã có những đồng thuận dễ dàng hơn về việc tại sao lại sử dụng lý thuyết trò chơi (cả cổ điển lẫn tiến hóa) để hiểu hành vi động vật không phải con người hơn là việc làm thế nào để triển khai nó nhằm lý giải và tiên đoán của mọi người. Trước hết chúng ta hãy xem xét một cách vắn tắt các vấn đề triết học và phương pháp luận đã xuất hiện xung quanh việc ứng dụng lý thuyết trò chơi trong sinh học không phải người, trước khi chúng ta chú ý đầy đủ hơn đến lý thuyết trò chơi về phương diện khoa học xã hội.

Việc xây dựng mô hình lý thuyết trò chơi ít gây tranh cãi nhất chính là việc ứng dụng loại hình cổ điển của lý thuyết vào việc xem xét các chiến lược bằng cách các động vật không phải là người nào tìm cách để đạt được các nguồn cơ bản thích hợp với trận đấu tiến hóa của chúng: các cơ hội để sinh sản các thế hệ tiếp theo tự thân chúng đều có vẻ là tái sinh sản. Vì vậy để tối đa hóa khả năng di truyền đáng mong muốn của chúng, các loài động vật phải tìm được các cân bằng tối ưu trong số các hàng hóa trung gian khác nhau, chẳng hạn như dinh dưỡng, tránh bị ăn thịt và có khả năng cạnh tranh với các đối thủ trong việc chọn bạn tình. Các điểm cân bằng tối ưu có hiệu quả trong số các loại hàng hóa này có thể thường được ước tính cho các loài đặc biệt trong các điều kiện môi trường đặc biệt, và dựa trên cơ sở của các ước lượng này, cả cân bằng tham số và cân bằng phi tham số đều có thể được phát sinh. Các mô hình thuộc loại này có một kỷ lục để lại dấu vết đầy ấn tượng trong việc dự đoán và lý giải các dữ liệu kinh nghiệm độc lập về những hiện tượng chiến lược như khai thác cạnh tranh, chọn bạn tình, bè phái, kình địch chị em anh em ruột, tập hợp thành bầy đàn, đề phòng động vật ăn thịt, ra dấu hiệu, chải chuốt cho nhau, phụ thuộc lẫn nhau (cộng sinh).

Còn nữa…


Tác giả: Don Ross là Giáo sư Triết học tại Đại học Alabama Birmingham, Giáo sư Kinh tế học tại Đại học Cape Town, Nam Phi. Công trình chủ yếu: Economic Theory and Cognitive Science: Microexplanation (MIT Press, 2005).

Nguồn: Game Theory, The Stanford Encyclopedia of Philosophy (Fall 2010 Edition), Edward N. Zalta (ed.), First published Sat Jan 25, 1997; substantive revision Wed May 5, 2010


References

Baird, D., Gertner, R., and Picker, R. (1994). Game Theory and the Law. Cambridge, MA: Harvard University Press.

Binmore, K., Kirman, A., and Tani, P. (eds.) (1993). Frontiers of Game Theory. Cambridge, MA: MIT Press

Binmore, K. (1998). Game Theory and the Social Contract (v. 2): Just Playing. Cambridge, MA: MIT Press. 

Camerer C. 2003. Behavioral Game Theory: Experiments in Strategic Interaction. Princeton: Princeton University Press.

Danielson, P. (ed.) (1998). Modelling Rationality, Morality and Evolution. Oxford: Oxford University Press.

Fudenberg D., and Levine D. 1998. The Theory of Learning in Games. Cambridge, MA: MIT Press.

Fudenberg, D., and Tirole, J. (1991). Game Theory. Cambridge, MA: MIT Press.

Gintis, H. (2004). Towards the Unity of the Human Behavioral Sciences. In Philosophy, Politics and Economics 31:37-57.

Guala, F. (2005). The Methodology of Experimental Economics. Cambridge: Cambridge University Press. 

Hofbauer J., Sigmund K. 1998. Evolutionary Games and Population Dynamics. Cambridge: Cambridge University Press. 

Krebs, J., and Davies, N.(1984). Behavioral Ecology: An Evolutionary Approach. Second edition. Sunderland: Sinauer.

Kreps, D. (1990). A Course in Microeconomic Theory. Princeton: Princeton University Press.

Maynard Smith J. 1982. Evolution and the Theory of Games. Cambridge: Cambridge University Press.

McMillan, J. (1991). Games, Strategies and Managers. Oxford: Oxford University Press.

Nash J. 1950a. Equilibrium Points in n-Person Games. In PNAS 36:48-49.

Nash, J. (1950b). The Bargaining Problem. In Econometrica 18:155-162.

Nash, J. (1951). Non-cooperative Games. In Annals of Mathematics Journal 54:286-295.

Ormerod, P. (1994). The Death of Economics. New York: Wiley.

Rawls, J. (1971). A Theory of Justice. Cambridge, MA: Harvard University Press.

Robbins, L. (1931). An Essay on the Nature and Significance of Economic Science. London: Macmillan.

Ross D. 2005. Evolutionary Game Theory and the Normative Theory of Institutional Design: Binmore and Behavioral Economics. In Politics, Philosophy and Economics, forthcoming.

Ross D. and LaCasse C. 1995. Towards a New Philosophy of Positive Economics. In Dialogue 34: 467-493.

Samuelson, L. 1997. Evolutionary Games and Equilibrium Selection. Cambridge, MA: MIT Press.

Samuelson, L. (2005). Economic Theory and Experimental Economics. In Journal of Economic Literature 43:65-107.

Samuelson P. 1938. A Note on the Pure Theory of Consumers' Behaviour. In Econimica 5:61-71.

Selten, R. (1975). Re-examination of the Perfectness Concept for Equilibrium Points in Extensive Games. In International Journal of Game Theory 4:22-55.

Sigmund, K. (1993). Games of Life. Oxford: Oxford University Press.

Smith V. 1982. Microeconomic Systems as an Experimental Science. In American Economic Review 72:923-955.

Sober, E., and Wilson, D.S. (1998). Unto Others. Cambridge, MA: Harvard University Press.

Tomasello M, M. Carpenter, J. Call, T. Behne and H. Moll (2004). Understanding and Sharing Intentions: The Origins of Cultural Cognition. In Behavioral and Brain Sciences, forthcoming.

Vallentyne, P. (ed.). (1991). Contractarianism and Rational Choice. Cambridge: Cambridge University Press.

von Neumann, J., and Morgenstern, O., (1947). The Theory of Games and Economic Behavior. Princeton: Princeton University Press, 2nd edition.

Weibull, J. (1995). Evolutionary Game Theory. Cambridge, MA: MIT Press.

Yaari, M. (1987). The Dual Theory of Choice Under Risk. In Econometrica 55:95-115.

Young, H.P. (1998). Individual Strategy and Social Structure. Princeton: Princeton University Press.

Không có nhận xét nào:

Đăng nhận xét