Lý thuyết Trò chơi (VI)
Don Ross
Người dịch: Hà Hữu Nga
6. Lý thuyết Trò chơi Tiến hóa
Gintis
[2000, 2009] mới đây đã cảm thấy có lý do chính đáng trong việc tuyên bố một
cách táo bạo “lý thuyết trò chơi là một ngôn ngữ phổ quát cho việc thống nhất
các khoa học hành vi”. Cách nói như vậy có vẻ khác thường, nhưng lại hoàn toàn
hợp lý. Binmore (1998, 2005) đã xây dựng mô hình lịch sử xã hội như là một loạt
những hội tụ vào các cân bằng hiệu quả ngày càng tăng trong các trò chơi giao
dịch đụng độ ngắt đoạn theo các phần trong đó một vài người cố thay đổi thành
các cân bằng mới bằng cách bỏ các đường dẫn cân bằng tĩnh như là kết quả của
các tai biến giai đoạn. (Chẳng hạn Stalin đã cố thay đổi xã hội của ông thành
một tập hợp các cân bằng trong đó người ta quan tâm nhiều hơn đến cái cường
quốc chính trị, quân sự và công nghiệp tương lai của đất nước họ hơn là quan
tâm đến cuộc sống riêng của họ. Ông đã không thành công; tuy nhiên các nỗ lực
của ông thực sự đã tạo ra một tình huống mà trong một vài thập kỷ nhiều người
Sô viết đã gán tầm quan trọng không đáng kể cho cuộc sống của những người khác
dưới mức bình thường). Hơn nữa các ứng dụng lý thuyết trò chơi vào các đề tài
hành vi đã mở rộng vượt khỏi vũ đài chính trị.
Chẳng
hạn vào năm 1969, nhà triết học David Lellog Lewis đã xuất bản cuốn Qui ước
(Convention: A Philosophical Study, 1969, Havard University Press), trong đó
khung khái niệm của lý thuyết trò chơi đã được áp dụng vào một trong những vấn
đề cơ bản của tri thức luận thế kỷ XX, bản chất và mức độ của các qui ước thống
trị ký hiệu học và mối quan hệ của nó với sự biện minh cho các niềm tin mang
tính định đề. Cuốn sách này đã đứng được như một trong những tác phẩm kinh điển
của triết học phân tích, và danh tiếng của nó hiện đang ngày càng nổi bật khi
chúng ta ngày càng thức tỉnh về ý nghĩa vạch đường của nó. Việc sử dụng ví dụ
đơn giản này có thể đưa lại cho chúng ta một sự hiểu biết rất cơ bản. Từ “gà”
là để chỉ những con gà và từ “đà điểu” là để chỉ những con đà điểu. Chúng ta
cũng sẽ không trở nên tốt hơn hay xấu hơn khi “gà” lại chỉ đà điểu, và “đà
điểu” lại để chỉ gà; tuy nhiên chúng ta sẽ trở nên xấu đi nếu một nửa trong số
chúng ta sử dụng một cặp từ theo cách thứ nhất, và một nửa theo cách thứ hai,
hoặc nếu tất cả chúng ta tùy tiện sử dụng chúng để qui vào những con chim không
biết bay nói chung.
Tất
nhiên các tri thức này đã có trước Lewis; nhưng điều mà ông nhận ra là ở chỗ
tình huống này mang hình thức logic của một trò chơi phối hợp. Vì vậy trong khi
những qui ước đặc biệt có thể mang tính võ đoán thì các cấu trúc tương tác duy
trì chúng và làm cho chúng bền vững thì lại không võ đoán. Hơn nữa các cân bằng
liên quan đến việc phối hợp về các ý nghĩa-danh từ lại có vẻ là có một yếu tố
võ đoán chỉ vì chúng ta không thể phân loại chúng theo cân bằng Pareto; nhưng
Millikan (1984) đã ngầm chỉ ra rằng về phương diện này chúng không điển hình
cho các phối hợp ngôn ngữ. Nói chung các loại cân bằng Nash khác nhau trong các
trò chơi phối hợp thường thường đều có thể được phân loại. Ross & LaCasse
(1995) đã đưa ra ví dụ sau. Trong một thành phố, những người lái xe phải điều
phối dựa vào một trong những cân bằng Nash liên quan đến hành vi của họ ở chỗ
có đèn giao thông. Tất cả phải đi gấp khi đèn vàng và dừng lại để đợi đèn xanh
hoặc đi chậm lại khi đèn vàng hoặc vọt lên khi chuyển sang đèn xanh. Cả hai mô
hình này đều là cân bằng Nash trong đó một khi cộng đồng đã phối hợp vào một
trong số cân bằng đó thì không một cá nhân nào có một động cơ để vi phạm: những
người nào đi chậm lại khi có đèn vàng trong khi những người khác lại lao vào họ
thì họ sẽ bị đâm vào đuôi xe, trong khi những người khác vọt lên khi đèn vàng
trong sự cân bằng khác thì sẽ có nguy cơ va chạm với vọt lên nhanh khi đèn
xanh. Vì vậy, khi một mô hình giao thông thành phố đặt trên một trong những cân
bằng này thì nó sẽ có khuynh hướng dừng lại ở đó. Tuy nhiên cả hai tình trạng
trên đều không phải là những trung lập-Pareto, vì cân bằng Nash thứ hai cho
phép nhiều xe rẽ trái trong mỗi chu kỳ (theo luật tay lái bên phải), là loại giảm
mức độ cổ trai và cho phép tất cả các lái xe hy vọng đạt hiệu quả cao hơn trong
giao thông.
Những
qui ước về các tiêu chuẩn bằng chứng và tính duy lý có vẻ thuộc về đặc trưng
này. Trong khi có nhiều sự bố trí có thể là cân bằng Nash trong các trò chơi xã
hội của khoa học, vì các môn đệ của Thomas Kuhn muốn nhắc chúng ta rằng không
thể có chuyện tất cả mọi cân bằng này đều dựa vào đường cong trung hòa Pareto.
Những đề tài này đã được thể hiện rõ ràng trong nhận thức luận hiện đại, trong
triết học khoa học, triết học ngôn ngữ mà tất cả đều là di vật của lý thuyết
trò chơi theo cách của Lewis (chí ít thì cũng gián tiếp). (Người đọc có thể
phát hiện ra nhiều ví dụ ứng dụng và qui chiếu hơn trong các tập văn liệu lớn
hơn, trong Nozick 1998). Tuy nhiên Lewis đã giới hạn sự chú ý của mình vào lý
thuyết trò chơi tĩnh trong đó các tác nhân chọn các chiến lược là những hàm
tiện ích cố định ngoại sinh. Như một kết quả của sự giới hạn này, việc lý giải
của ông có thể chỉ cho chúng ta thấy tại sao các qui ước này lại quan trọng và
bền vững, nhưng nó lại làm nảy sinh một vấn đề khó khăn và có lẽ không hiệu quả
đối với một lý thuyết tổng quát về tính duy lý. Có hiện tượng đó là vì như
chúng ta đã thấy ở phần 3 ở trên, trong các trò chơi kết hợp (và các trò chơi
khác) có rất nhiều cân bằng Nash, cái được coi là một giải pháp chính là cái
nhạy cảm cao với các phỏng đoán được thực hiện bởi các tay chơi về các niềm tin
và khả năng tính toán của một tay chơi khác. Điều này gây ra một sự chú ý đáng
kể, đặc biệt là từ các nhà triết học về những mối liên hệ của nhiều loại khác
biệt mơ hồ trong các chuẩn mực của tính duy lý chiến lược. Tuy nhiên nếu như lý
thuyết trò chơi thực sự giải thích được các hành vi tự nhiên và lịch sử của nó
theo cái cách do Gintis (2000) gợi ý thì chúng ta cần một lý giải nào đó về cái
có tính hấp dẫn về những cân bằng trong các trò chơi thậm chí ngay cả khi không
có bất cứ nhà phân tích hoặc nhà tính toán duy lý nào ở xung quanh để xác định
chúng. Việc thực hiện cái qui chiếu đối với đề tài của Lewis khi ngôn ngữ của
con người đã được phát triển thì lại không có bất cứ một trọng tài nào ở bên
ngoài để phân xử và bố trí cho hiệu quả Pareto. Vì vậy để hiểu được chủ nghĩa
lạc quan của Gintis về việc tiếp cận được với lý thuyết trò chơi chúng ta cần
phải mở rộng sự chú ý của mình vào các trò chơi mang tính tiến hóa.
Các
lý thuyết trò chơi đã được ứng dụng một cách thành công vào sinh học tiến hóa
mà trong đó các loài và/hoặc các gen được đối xử như là những tay chơi từ công
trình tiên phong của Maynard Smith (1982) và những người cộng tác với ông. Lý
thuyết trò chơi tiến hóa (hoặc động) đã kích thích cho sự mở rộng của toán học
mới một cách đáng kể để có thể ứng dụng vào nhiều môi trường trừ môi trường
sinh học. Vì vậy mà Skyrms (1996) đã sử
dụng lý thuyết trò chơi tiến hóa để cố gắng trả lời các câu hỏi mà ngay cả
Lewis cũng chưa đặt được câu hỏi, về các điều kiện mà ngôn ngữ, các khái niệm
về công lý, khái niệm về tài sản tư nhân, và những hiện tượng chung không được
thiết kế khác đã thu hút mối quan tâm của các nhà triết học. Điều mới đối với
lý thuyết trò chơi tiến hóa chính là các vận động không được lựa chọn bởi các
tác nhân duy lý. Thay vào đó, các tác nhân này lại được cứng hóa (hard-wired -
kiểm soát bằng các mạch điện tử) một cách điển hình bằng những chiến lược đặc
biệt và sự thành công đối với một chiến lược được xác định trong khuôn khổ số
bản copies mà một chiến lược tự để lại để chơi trong các trò chơi của những thế
hệ tiếp theo. Vì vậy bản thân các chiến lược cũng là những tay chơi và các trò
chơi mà họ chơi thì năng động chứ không tĩnh tại.
Việc
thảo luận về vấn đề này gắn liền với các luận điểm của Skyrms. Chúng ta hãy bắt
đầu bằng việc giới thiệu động học sao
chép. Trước hết hãy xem xét lựa chọn tự nhiên đã họat động như thế nào để
thay đổi các giống loài động vật, bằng cách biến đổi, tạo ra và hủy diệt các
loài. Cơ chế cơ bản là sinh sản khác biệt. Bất cứ động vật nào có các đặc điểm có thể di truyền làm tăng số lượng con cái mong muốn của chúng
trong một môi trường nhất định thì đều có khuynh hướng để lại nhiều con cái hơn
những loài khác chừng nào môi trường vẫn còn tương đối bền vững. Thế hệ con cái
ấy sẽ kế thừa những đặc điểm đã được nêu ra. Vì vậy tỷ lệ của những đặc điểm
này trong cư dân của chúng sẽ tăng dần khi các thế hệ lần lượt qua đời. Một số
đặc điểm này có thể đi đến cố định,
có nghĩa là cuối cùng chúng kế tục toàn bộ cư dân (cho đến khi nào môi trường
thay đổi).
Lý
thuyết trò chơi có thể tiếp cận với vấn đề này như thế nào? Thông thường một
trong những khía cạnh quan trọng nhất của một môi trường sinh vật sẽ là những
khuynh hướng hành vi của những sinh vật khác. Chúng ta có thể nghĩ về mỗi loài
như là đang “cố gắng” tối đa hóa tính thích ứng (= số cháu chắt mong muốn)
thông qua việc xác định các chiến lược tối ưu của những loài khác. Vì vậy lý
thuyết tiến hóa là một lĩnh vực khác của việc ứng dụng cho phân tích phi tham
số. Trong
lý thuyết trò chơi động, chúng ta không còn nghĩ về các cá thể như là sự lựa
chọn những chiến lược khi chúng vận động từ một trò chơi này đến một trò chơi
khác. Có điều đó là vì các lợi ích của chúng ta là khác nhau. Giờ đây chúng ta
ít quan tâm đến việc phát hiện ra các cân bằng của những trò chơi đơn hơn là
phát hiện ra những cân bằng bền vững, và việc chúng thay đổi ra sao theo thời
gian. Vì vậy giờ đây chúng ta xây dựng mô hình các chiến lược tự thân khi chơi
với nhau. Một chiến lược được coi là “tốt hơn” chiến lược khác khi nó để lại
nhiều bản sao của nó cho những thế hệ tiếp theo, khi trò chơi sẽ được chơi lại.
Chúng ta nghiên cứu những thay đổi trong việc phân phối các chiến lược trong cư
dân như là trật tự của việc mở rộng các trò chơi. Đối với lý thuyết trò chơi
động, chúng tôi giới thiệu một khái niệm cân bằng (theo Maynard Smith 1982).
Một tập chiến lược theo một tỷ lệ đặc biệt (chẳng hạn 1/3:2/3, a, 1/9:8/9,
1/3:1/3:1/6:1/6 – luôn luôn có tổng là 1) ở một ESS (Evolutionary Stable
Strategy) cân bằng ngay trong trường hợp (1) không cá nhân nào chơi một chiến
lược lại có thể cải thiện được tính thích ứng tái sinh sản của nó bằng cách
chuyển sang một trong những chiến lược khác theo tỷ lệ, và (2) không một biến
dị nào chơi một chiến lược khác lại hoàn toàn có thể tự mình hình thành (“xâm
lược”) trong cư dân.
Các
nguyên tắc của lý thuyết trò chơi tiến hóa được lý giải tốt nhất thông qua các
ví dụ. Skyrms bắt đầu bằng việc khảo sát các điều kiện trong đó một ý nghĩa
công lý được hiểu như là một khuynh hướng để coi những phân chia bình đẳng các
nguồn là công bằng trừ khi những xem xét về mặt hiệu quả gợi ý khác đi trong
những trường hợp đặc biệt – có thể xuất hiện. Ông đề nghị chúng ta xem xét một
cư dân trong đó các cá thể gặp nhau đều đặn và phải thương lượng về các nguồn.
Bắt
đầu với ba loại cá thể:
a. Những người ưa công bằng luôn luôn yêu
cầu một nửa các nguồn
b. Những người tham lam luôn luôn yêu cầu nhiều
hơn một nửa. Khi một người tham lam đối mặt với một người tham lam khác thì họ
lãng phí các nguồn vào việc tranh giành nó.
c. Những người khiêm tốn luôn luôn yêu cầu
ít hơn một nửa các nguồn. Khi một người khiêm tốn đối mặt với một người khiêm
tốn khác thì họ lấy ít hơn toàn bộ các nguồn có sẵn và lãng phí một số lượng
nào đó.
Mỗi
cuộc đọ sức đơn lẻ nơi mà tổng số cá thể yêu cầu tổng cộng lên đến 100% thì là
một cân bằng Nash của cái trò chơi cá nhân đó. Tương tự như vậy, có thể có
nhiều cân bằng động. Giả sử rằng những người tham lam yêu cầu 2/3 tổng số các
nguồn và những người khiêm tốn yêu cầu 1/3. Vậy thì có 2 phần là các chiến lược
tiến hóa bền vững ESSs:
- Một
nửa cư dân tham lam và một nửa khiêm tốn. Chúng ta có thể tính khoản được trả
trung bình ở đây. Những người khiêm tốn lấy 1/3 các nguồn trong mỗi cuộc đối
đầu. Người tham lam lấy 2/3 khi cô ta gặp người Khiêm tốn, nhưng lại không được
gì khi cô ta gặp người tham lam khác. Vì vậy khoản nhận được trung bình của cô
ta cũng là 1/3. Đây là một ESS bởi vì Người công bằng không thể xâm phạm đến kẻ
khác. Khi người Công bằng gặp người Khiêm tốn anh ta nhận 1/2. Nhưng khi Người
công bằng gặp Người tham lam anh ta không nhận được gì. Vì vậy cái khoản nhận
được trung bình của anh ta chỉ là 1/4. Không có Người khiêm tốn nào có một động cơ để thay đổi các chiến lược, và cũng
không có bất cứ Người tham lam nào làm như vậy. Một người Công bằng đột biến
xuất hiện trong dân cư sẽ chơi kém nhất, và sự lựa chọn như vậy sẽ không cổ vũ
cho sự truyền bá của bất cứ đột biến nào như vậy.
- Toàn
bộ những người chơi đều là Người công bằng. Mỗi người luôn luôn nhận một nửa
các nguồn, và không người nào có thể chơi tốt hơn bằng cách thay đổi thành một
chiến lược khác. Những người tham lam tham gia vào cư dân này phải đối diện với
những người công bằng và nhận một khoản được trả trung bình bằng 0. Những người
khiêm tốn nhận 1/3 như trước, nhưng phần này lại ít hơn phần của người Công
bằng là 1/2. Cần lưu ý rằng cân bằng (i) là không hiệu quả, vì khoản trung bình
nhận được đối với toàn bộ cư dân thì nhỏ hơn. Tuy nhiên hệt như vậy các kết quả
không hiệu quả có thể là các cân bằng Nash NE của các trò chơi tĩnh tại này, vì
vậy chúng có thể là những cân bằng NE động của ESS.
Chúng
tôi qui vào các cân bằng trong đó xuất hiện nhiều hơn một chiến lược với tư
cách là những đa hình. Nhìn chung
trong trò chơi Skyrms, bất cứ đa hình nào trong đó những Người tham lam yêu cầu
x và Người khiêm tốn yêu cầu 1 – x
thì đó là một ESS. Vấn đề là ở chỗ những lợi ích mà người nghiên cứu công bằng
quan tâm lại chính là khả năng có thể xảy ra tương đối với những gì mà các cân
bằng khác xuất hiện.
Điều
này phụ thuộc hoàn toàn vào các cân xứng chiến lược trong tình trạng cư dân
gốc. Nếu cư dân đó bắt đầu với nhiều hơn một Người công bằng thì có một xác
suất nào đó mà Người công bằng sẽ đối diện với nhau, và lấy phần được chia
trung bình có thể là cao nhất. Những Người khiêm tốn tự thân họ không ngăn cản
sự mở rộng của những Người công bằng; chỉ có những người tham lam mới làm như
vậy. Nhưng những người tham lam, tự thân họ lại phụ thuộc vào việc có những
người khiêm tốn ở xung quanh để có thể tồn tại và trụ vững. Vậy là trong cư dân
xuất hiện nhiều người công bằng hơn liên quan đến các cặp Tham lam và Khiêm
tốn, thì những người công bằng ưu tú hơn sẽ chơi ở mức trung bình. Điều đó ám
chỉ một hiệu quả ngưỡng. Nếu tỷ lệ những người công bằng rớt thấp dưới 33% thì
khuynh hướng đối với họ sẽ là rơi vào tuyệt chủng vì họ thường không thể thỏa
mãn nhau được. Nếu cư dân của những người công bằng tăng lên trên 33% thì
khuynh hướng đối với họ sẽ là tăng đến mức ổn định vì những mối lợi gia tăng
của họ khi họ có thể đáp ứng được cho nhau
thì nó sẽ bù đắp cho những mất mát của họ khi họ gặp những người tham
lam. Bạn có thể thấy điều này bằng cách lưu ý rằng khi mỗi chiến lược được sử
dụng khoảng 33% cư dân thì tất cả đều nhận một khoản được trả là 1/3. Vì vậy
bất cứ chiến lược nào vượt lên trên ngưỡng này về phía những người Công bằng sẽ
có khuynh hướng đẩy họ đến cố định hóa. Kết quả này chỉ ra rằng bằng cách nào
mà các điều kiện tương đối tổng thể nhất định đã cho, công lý như chúng ta đã
định nghĩa có thể xuất hiện một cách
năng động. Tin tức cho những người hâm mộ công lý sẽ trở nên đáng phấn khởi hơn
nếu chúng ta giới thiệu lối chơi tương
liên.
Cái
mô hình mà chúng ta vừa mới xem xét giả định rằng các chiến lược không liên hệ gì với nhau, có nghĩa là xác
suất mà mỗi chiến lược thỏa mãn một chiến lược khác là một hàm đơn của những
tần số xuất hiện có liên quan trong cư dân. Giờ đây chúng ta hãy xem xét cái gì
xảy ra trong trò chơi phân chia nguồn lực động của chúng ta khi chúng ta giới
thiệu thế tương liên. Giả định rằng những người công bằng có đôi chút khả năng
để phân biệt và tìm ra những người công bằng khác như là các bên đối tác tương
liên. Trong trường hợp đó những người công bằng trung bình chơi tốt hơn và điều
này phải có hiệu quả của việc làm thấp đi cái ngưỡng của họ để chuẩn bị đi đến
cố định hóa. Một người xây dựng mô hình trò chơi động nghiên cứu các hiệu quả
của mối tương liên và các giới hạn tham số khác bằng phương pháp vận hành các
mô phỏng computer lớn trong đó các chiến lược cạnh tranh với nhau hết vòng nọ
đến vòng kia trong môi trường ảo. Những cân xứng ban đầu của các chiến lược và
bất kỳ cấp độ tương quan lựa chọn nào đều đơn giản có thể được thiết lập trong
chương trình. Vậy thì người ta có thể nhìn vào động thái của nó trải ra theo
thời gian, và đo lường tỷ lệ thời gian mà nó dừng lại trong bất cứ một cân bằng
nào. Những tỷ lệ này được thể hiện bằng các kích cỡ tương đương của các vùng hấp lực đối với các cân bằng khả
thể khác nhau. Các cân bằng là những điểm hấp dẫn trong một không gian động;
một vùng hấp lực cho mỗi điểm như vậy là một tập hợp các điểm trong không gian
mà từ đó cư dân kia sẽ hội tụ thành sự cân bằng đã được đặt ra.
Khi đưa
mối tương quan vào mô hình của mình, trước hết Skyrms đã thiết lập mức độ tương
liên ở một điểm rất nhỏ 1) điều đó làm cho vùng hấp lực cân bằng (i) để co rút
lại bằng một nửa. Khi mức độ tương liên được thiết lập thành 2) vùng đa hình sẽ
qui giản thành điểm mà ở đó cư dân kia bắt đầu trở thành đa hình. Vì vậy những
số lượng tương liên rất nhỏ tăng lên đã tạo ra những số lượng tăng tỷ lệ lớn
trong tính bền vững của sự cân bằng mà ở đó mỗi tay chơi đều chơi như một người
công bằng. Một số lượng nhỏ mối tương liên tăng lên là một định đề hữu lý trong
hầu hết các cư dân mà ở đó những người hàng xóm có khuynh hướng tương tác với
một người khác và bắt chước một người khác (cả về phương diện di truyền hoặc vì
những thiên hướng trở thành bản sao của nhau một cách cố ý), và vì về phương
diện di truyền những động vật tương tự dường như thích sống trong các môi
trường chung hơn. Vì vậy nếu sự công bằng có thể xuất hiện toàn bộ thì nó sẽ có
khuynh hướng trở thành thống trị và bền vững. Hầu hết triết học chính trị đều
bao gồm những cố gắng để sản xuất ra các lý lẽ định chuẩn diễn dịch nhằm thuyết
phục một tác nhân không ưa công bằng rằng cô ta có những lý do để hành động một
cách công bằng. Phân tích của Skyrms đã đưa ra một cách tiếp cận hoàn toàn
khác. Người công bằng sẽ chơi tốt trong một trò chơi động nếu anh ta thực hiện
những bước tích cực để bảo toàn sự tương liên. Vì vậy có một sức ép tiến hóa
đối với cả những thể chế tiếp cận đạo đức
của công lý và các thể chế công lý
làm cho chúng xuất hiện. Hầu hết mọi người có thể nghĩ rằng những cách chia
50-50 là công bằng và duy trì một cách xứng đáng bằng sự thừa nhận cũng như
bằng phần thưởng đạo đức và thể chế vì chúng ta là những sản phẩm của một trò
chơi năng động thúc đẩy chúng ta suy nghĩ theo khuynh hướng này.
Đề
tài được nhiều người quan tâm nhất từ các nhà lý thuyết trò chơi tiến hóa là lòng vị tha, được xác định là bất cứ
hành vi nào của một sinh vật nhằm làm giảm đi khả năng truyền gen mong muốn cho
các thế hệ sau trong một tương tác đơn, nhưng lại làm tăng khả năng đó cho kẻ
tương tác khác. Điều đó rất thông dụng trong tự nhiên. Tuy nhiên đấu tranh sinh
tồn Darwin đã xuất hiện thế nào? Skyrms nghiên cứu vấn đề này bằng cách sử dụng
Nan đề Người tù động làm ví dụ của mình. Đây chỉ đơn giản là một loạt trò chơi
PD trong một cư dân, trong đó một vài thành viên là những kẻ bội ước và một số
là những người hợp tác. Các khoản được trả, khi luôn luôn ở trong những trò
chơi động, được đo lường bằng khuôn khổ của những số lượng bản sao của mỗi
chiến lược trong các thế hệ tương lai. Chúng
ta hãy coi U(A) là khả năng truyền gen trung bình của chiến lược A trong cư dân. Hãy coi U là khả năng truyền gen trung bình của
toàn bộ cư dân. Vậy là sự cân xứng chiến lược A trong thế hệ tiếp theo thực sự
là tỷ lệ U(A)/U. Vậy thì nếu A có khả năng truyền gen lớn hơn thì mức
độ trung bình A của cư dân tăng lên.
Nếu A có khả năng truyền gen thấp hơn
mức độ trung bình của cư dân thì A
giảm.
Trong
trò chơi PD động mà ở đó mối tương tác là hiếm hoi (tức là không có tương
liên), thì những tay chơi bội ước sẽ chơi tốt hơn mức độ trung bình của cư dân
chừng nào có những tay chơi hợp tác xung quanh. Điều này kéo theo một thực tiễn
là như chúng ta đã thấy ở phần 2.4, sự bội ước luôn luôn là một chiến lược
thống trị trong một trò chơi đơn. Vì vậy 100% bội ước là ESS trong trò chơi
động không có tương liên, phù hợp với cân bằng Nash trong trò chơi PD tĩnh một
lần duy nhất. Tuy nhiên việc giới thiệu khả năng tương liên đã làm thay đổi tận
gốc dễ vấn đề. Giờ đây chúng ta cần tính toán khả năng truyền gen trung bình
của một chiến lược có xác suất nhất định của chiến lược có thể thỏa mãn nhau.
Trong trò chơi PD động, những người hợp tác có xác suất thỏa mãn những người
hợp tác khác cao thì chơi tốt hơn những người bội ước mà xác suất thỏa mãn
những người bội ước khác cao. Vì vậy tương liên hỗ trợ cho sự hợp tác. Để có thể nói một điều gì đó chính xác hơn về
mối quan hệ giữa tương liên và hợp tác ấy (và để có thể liên hệ lý thuyết trò
chơi tiến hóa với các vấn đề trong lý thuyết quyết định, một vấn đề nằm ngoài
phạm vi bài báo này), Skyrms đã giới thiệu một khái niệm kỹ thuật mới. Ông gọi
một chiến lược là có thể chấp nhận về phương diện thích nghi nếu có một vùng
xung quanh điểm cố định của nó trong không gian động từ bất cứ nơi nào trong
vùng đó thì nó sẽ đi tới cố định. Trong trò chơi PD động, cả bội ước và hợp tác
đều có thể được chấp nhận về phương diện thích nghi. Kích cỡ có liên quan của
các vùng hấp lực nhạy cảm rất cao đối với các cơ chế mà sự tương liên đạt được.
Để minh họa cho vấn đề này, Skyrms đã đưa ra một số ví dụ.
Một
trong những mô hình của Skyrms đã giới thiệu mối tương quan bởi phương tiện là
một bộ lọc theo cặp do sự tương tác. Giả sử rằng trong vòng 1 của trò chơi PD
động các cá nhân kiểm soát nhau và tương tác, hoặc không, đều tùy thuộc vào cái
mà họ phát hiện ra. Trong vòng chơi thứ hai và các vòng tiếp theo tất cả các cá
nhân không chơi thành cặp trong vòng 1 thì hiếm khi cặp với nhau. Trong trò
chơi này, vùng hấp lực cho sự bội ước là rộng lớn trừ khi có một tỷ lệ cao
những người hợp tác trong vòng 1. Trong trường hợp này những người bội ước không
thể chơi cặp trong vòng 1 được, sau đó họ hầu hết chơi cặp với nhau trong vòng
2 và dẫn nhau đến tuyệt diệt. Một mô hình thú vị hơn vì cơ chế của nó ít giả
tạo, không cho phép các cá nhân lựa chọn các đối tác của họ, nhưng lại đòi hỏi
họ tương tác với những đối tác gần gũi với họ nhất. Bởi vì những mối quan hệ di
truyền (hoặc học văn hóa bằng cách sao chép) nên dường như các cá nhân tương
đồng với các hàng xóm của họ hơn là không. Nếu nhóm cư dân hữu hạn này được dàn
trận theo một phương (tức là dọc theo một tuyến) và tất cả những người hợp tác
và những người bội ước hiếm khi đều được đưa vào các vị trí cùng với nó thì
chúng ta sẽ có được động thái dưới đây. Những người hợp tác biệt lập có khả
năng truyền gen mong muốn thấp hơn những người bội ước xung quanh và bị dẫn một
cách cục bộ tới tuyệt diêt.
Các
thành viên của các nhóm thuộc hai người hợp tác có một xác suất 50% tương tác
với nhau, và 50% tương tác với những người bội ước. Kết quả là khả năng truyền
gen mong đợi trung bình của họ vẫn nhỏ hơn khả năng của những người hàng xóm
bội ước và họ cũng phải đối mặt với khả năng tuyệt diệt. Các nhóm ba người hợp
tác tạo thành một điểm không bền vững mà từ đó cả sự tuyệt diệt lẫn sự phát
triển đều ngang bằng nhau. Tuy nhiên trong các nhóm 4 người hoặc số người hợp
tác nhiều hơn thì ít nhất là một sự đối đầu của một người hợp tác với một người
hợp tác khác chí ít cũng đủ để đảm bảo thay thế nhóm nguyên gốc. Trong hoàn cảnh
đó, những người hợp tác tạo thành một nhóm thì chơi tốt hơn những người bội ước
xung quanh và chi phí của họ tăng lên. Cuối cùng những người hợp tác hầu như đi đến cố định – nhưng không
hoàn toàn. Những người bội ước đơn độc ở ngoại vi của cư dân làm hại những
người hợp tác ở những vòng cuối cùng và sống sót như những cộng đồng “tội phạm”
nhỏ. Vì vậy chúng ta thấy rằng lòng vị tha có thể không chỉ được duy trì bởi
động thái của các trò chơi tiến hóa, mà với mối tương liên, nó thậm chí có thể
phát triển và định cư ở những cư dân về nguồn gốc là không có lòng vị tha.
Vì
vậy động thái Darwin đưa ra những tin tức có chất lượng tốt cho sự hợp tác. Tuy
nhiên cần phải nhớ rằng điều này chỉ đứng vững chừng nào các cá nhân còn bị mắc
kẹt với các chương trình văn hóa hoặc tự nhiên của họ và không thể tái định giá
các tiện ích cho chính bản thân họ. Nếu các tác nhân của chúng ta quá thông
minh và linh họat thì họ có thể nhận ra rằng họ đang chơi các trò chơi PD và có
lẽ tất cả đều bị thất bại. Cuối cùng trong trường hợp này, họ thực sự đưa bản
thân mình đến tuyệt diệt – trừ khi họ phát triển những chuẩn mực đạo đức hiệu
quả và bền vững nhằm củng cố sự hợp tác. Nhưng tất nhiên đây chỉ là những cái
mà chúng ta mong muốn làm tiến triển trong các cư dân động vật mà các cấp độ
khả năng truyền gen trung bình được liên kết chặt chẽ với các khả
năng hợp tác xã hội thành công của chúng. Ngay cho dù như vậy thì các cư dân
này cũng sẽ tuyệt diệt ngoại trừ chúng quan tâm đến các thế hệ tương lai vì một
lý do nào đó. Nhưng không hề có những lý do chính đáng để chúng ta suy nghĩ về
việc tại sao các tác nhân nên quan tâm đến các thế hệ tương lai nếu như mỗi thế
hệ mới lại thay thế toàn bộ những thế hệ đi trước ở mỗi thay đổi của các nhóm
người. Vì lý do này các nhà kinh tế sử dụng mô hình “trồng xếp thế hệ” khi xây
dựng mô hình các trò chơi phân phối. Các cá nhân trong thế hệ 1 - những người kéo dài đến thế hệ 5 – sẽ tiết
kiệm các nguồn cho thế hệ 3 là những người mà họ muốn hợp tác cùng; và đến thế
hệ 3 thì các cá nhân mới sẽ quan tâm đến thế hệ 6; và v.v….
7. Lý thuyết Trò chơi và Bằng chứng Hành
vi
Trong các phần trước chúng ta đã xem xét một số vấn
đề xuất hiện từ việc xử lý lý thuyết trò chơi cổ điển (không tiến hóa) như một
lý thuyết định chuẩn là thứ thể hiện cho người ta về cái mà người ta phải làm
nếu họ muốn trở thành duy lý trong các tình huống chiến lược. Vấn đề khó khăn
như chúng ta thấy là hình như không có một khái niệm giải pháp để chúng ta có
thể dứt khoát phó thác cho mọi tình huống. (Trong các trò chơi loại hình mở
rộng thuộc lĩnh vực thông tin hoàn hảo, cũng tồn tại vấn đề nghịch lý của sự qui
nạp ngược). Tuy nhiên chúng ta lưu ý rằng sự khước từ này không áp dụng cho lý
thuyết trò chơi được coi là một dạng toán học là thứ có thể dùng để mô tả hành
vi thực. Vậy thì rất tự nhiên xuất hiện một câu hỏi: Có phải lý thuyết trò chơi
đã thực sự giúp đỡ cho các nhà nghiên cứu kinh nghiệm chủ nghĩa thực hiện các
phát hiện mới về hành vi (con người hoặc cái gì khác nữa)? Nếu vậy thì, về đại thể, cái gì là nội dung của những phát hiện này?
Khi
ấn định câu hỏi này, chúng ta phải đứng trước một vấn đề tri thức luận trực
tiếp. Không có cách nào áp dụng lý thuyết trò chơi như là một thứ mà “tất cả
đều do chính bản thân nó” một cách độc lập khỏi việc xây dựng mô hình các công
nghệ. Khi sử dụng tiêu chuẩn thuật ngữ trong triết học khoa học, người ta có
thể kiểm tra một mô hình lý thuyết trò chơi của một hiện tượng chỉ trong trường
hợp người nọ sau người kia với “các định đề phụ” về hiện tượng được đặt ra. Tối
thiểu thì điều này cũng xảy ra nếu ai đó tuyệt đối xử lý lý thuyết trò chơi
thuần túy như một phép toán mà không có nội dung kinh nghiệm chủ nghĩa của
riêng bản thân nó. Theo một nghĩa nào đó, một lý thuyết không có nội dung kinh
nghiệm chủ nghĩa thì sẽ không bao giờ để ngỏ cho sự kiểm nghiệm; người ta có
thể chỉ băn khoăn về việc là liệu các tiên đề của một lý thuyết có luôn nhất
quán không. Dù sao thì một lý thuyết toán cũng có thể được đánh giá liên quan đến tính chất hữu dụng mang tính kinh nghiệm
chủ nghĩa. Một loại phê phán triết học đôi khi cũng được thực hiện bằng lý
thuyết trò chơi, được lý giải như là một công cụ toán học để xây dựng mô hình
các hiện tượng hành vi, có nghĩa là việc ứng dụng nó luôn luôn hoặc thường
xuyên yêu cầu viện đến các định đề sai, giả hoặc thô giản về những hiện tượng
này. Chúng ta hy vọng sự phê phán này có những mức độ sức mạnh khác nhau trong
những khung cảnh ứng dụng khác nhau khi những định đề phụ là khác biệt nhau.
Hóa
ra vấn đề là như vậy. Không có lĩnh vực nào thú vị trong đó những ứng dụng lý
thuyết trò chơi lại hoàn toàn không gây tranh cãi. Tuy nhiên đã có những đồng
thuận dễ dàng hơn về việc tại sao lại sử dụng lý thuyết trò chơi (cả cổ điển
lẫn tiến hóa) để hiểu hành vi động vật không phải con người hơn là việc làm thế
nào để triển khai nó nhằm lý giải và tiên đoán của mọi người. Trước hết chúng ta hãy xem xét một cách vắn tắt các vấn
đề triết học và phương pháp luận đã xuất hiện xung quanh việc ứng dụng lý
thuyết trò chơi trong sinh học không phải người, trước khi chúng ta chú ý đầy
đủ hơn đến lý thuyết trò chơi về phương diện khoa học xã hội.
Việc
xây dựng mô hình lý thuyết trò chơi ít gây tranh cãi nhất chính là việc ứng
dụng loại hình cổ điển của lý thuyết vào việc xem xét các chiến lược bằng cách
các động vật không phải là người nào tìm cách để đạt được các nguồn cơ bản
thích hợp với trận đấu tiến hóa của chúng: các cơ hội để sinh sản các thế hệ
tiếp theo tự thân chúng đều có vẻ là tái sinh sản. Vì vậy để tối đa hóa khả
năng di truyền đáng mong muốn của chúng, các loài động vật phải tìm được các
cân bằng tối ưu trong số các hàng hóa trung gian khác nhau, chẳng hạn như dinh
dưỡng, tránh bị ăn thịt và có khả năng cạnh tranh với các đối thủ trong việc
chọn bạn tình. Các điểm cân bằng tối ưu có hiệu quả trong số các loại hàng hóa
này có thể thường được ước tính cho các loài đặc biệt trong các điều kiện môi
trường đặc biệt, và dựa trên cơ sở của các ước lượng này, cả cân bằng tham số
và cân bằng phi tham số đều có thể được phát sinh. Các mô hình thuộc loại này
có một kỷ lục để lại dấu vết đầy ấn tượng trong việc dự đoán và lý giải các dữ
liệu kinh nghiệm độc lập về những hiện tượng chiến lược như khai thác cạnh
tranh, chọn bạn tình, bè phái, kình địch chị em anh em ruột, tập hợp thành bầy
đàn, đề phòng động vật ăn thịt, ra dấu hiệu, chải chuốt cho nhau, phụ thuộc lẫn
nhau (cộng sinh).
Còn
nữa…
Tác
giả: Don Ross là Giáo sư Triết học tại Đại học
Alabama ở Birmingham,
Giáo sư Kinh tế học tại Đại học Cape Town, Nam Phi. Công trình chủ yếu: Economic
Theory and Cognitive Science: Microexplanation (MIT Press, 2005).
Nguồn: Game Theory, The
Stanford Encyclopedia of Philosophy (Fall 2010 Edition), Edward N.
Zalta (ed.), First published Sat Jan
25, 1997; substantive revision Wed May 5, 2010
References
Baird, D., Gertner, R., and Picker, R. (1994). Game
Theory and the Law. Cambridge, MA: Harvard University Press.
Binmore, K., Kirman, A., and Tani, P. (eds.) (1993). Frontiers of Game Theory. Cambridge, MA: MIT Press
Binmore, K. (1998). Game Theory and the Social Contract (v. 2): Just Playing. Cambridge, MA: MIT Press.
Camerer C. 2003. Behavioral Game Theory: Experiments in Strategic Interaction. Princeton:
Princeton University Press.
Danielson, P. (ed.) (1998). Modelling Rationality, Morality and Evolution. Oxford: Oxford University Press.
Fudenberg, D., and Tirole, J. (1991). Game Theory. Cambridge, MA: MIT Press.
Gintis, H. (2004). Towards the Unity of the Human Behavioral Sciences. In Philosophy, Politics and Economics 31:37-57.
Guala, F. (2005). The Methodology of Experimental Economics. Cambridge: Cambridge University Press.
Hofbauer J., Sigmund K. 1998. Evolutionary Games and Population Dynamics. Cambridge: Cambridge University Press.
Krebs, J., and Davies, N.(1984). Behavioral
Ecology: An Evolutionary Approach. Second edition. Sunderland: Sinauer.
Kreps, D. (1990). A Course in Microeconomic Theory. Princeton: Princeton University Press.
McMillan, J. (1991). Games, Strategies and Managers. Oxford: Oxford University Press.
Nash, J. (1950b). The Bargaining Problem. In Econometrica 18:155-162.
Nash, J. (1951). Non-cooperative Games. In Annals of Mathematics Journal 54:286-295.
Ormerod, P. (1994). The Death of Economics. New York: Wiley.
Rawls, J. (1971). A Theory of Justice. Cambridge, MA: Harvard University Press.
Robbins, L. (1931). An Essay on the Nature and Significance of Economic Science. London: Macmillan.
Ross D. 2005.
Evolutionary Game Theory and the
Normative Theory of Institutional Design: Binmore and Behavioral Economics. In
Politics, Philosophy and Economics,
forthcoming.
Ross D. and LaCasse C. 1995. Towards
a New Philosophy of Positive Economics. In Dialogue 34: 467-493.
Samuelson, L. (2005). Economic Theory and Experimental Economics. In Journal of Economic Literature 43:65-107.
Samuelson P. 1938. A Note on the Pure Theory of Consumers' Behaviour. In Econimica 5:61-71.
Selten, R. (1975). Re-examination of the Perfectness Concept for Equilibrium Points in Extensive Games. In International Journal of Game Theory 4:22-55.
Sigmund, K. (1993). Games of Life. Oxford: Oxford University Press.
Smith V. 1982. Microeconomic Systems as an Experimental Science. In American Economic Review 72:923-955.
Sober, E., and Wilson, D.S. (1998). Unto Others. Cambridge, MA: Harvard University Press.
Tomasello M, M. Carpenter, J. Call, T. Behne and H. Moll (2004). Understanding and Sharing Intentions: The Origins of Cultural Cognition.
In Behavioral and Brain Sciences, forthcoming.
Vallentyne, P. (ed.). (1991). Contractarianism and Rational Choice. Cambridge: Cambridge University Press.
von Neumann, J., and Morgenstern, O., (1947). The Theory of Games and Economic Behavior. Princeton: Princeton University Press, 2nd edition.
Weibull, J. (1995). Evolutionary Game Theory. Cambridge, MA: MIT Press.
Yaari, M. (1987). The Dual Theory of Choice Under Risk. In Econometrica 55:95-115.
Young, H.P. (1998). Individual Strategy and Social Structure. Princeton: Princeton University Press.
Không có nhận xét nào:
Đăng nhận xét