Tiếng vọng KATTIGARA: Lý thuyết Trò chơi (II)

Lý thuyết Trò chơi (II)

Don Ross

Người dịch: Hà Hữu Nga

2.3. Hình cây và Ma trận

Sự khác biệt giữa các trò chơi có thông tin hoàn hảo và không hoàn hảo gắn liền với (mặc dù chắn chắn không giống hệt) sự khác biệt giữa những cách thể hiện các trò chơi dựa trên trật tự của trò chơi. Chúng ta hãy bắt đầu bằng cách phân biệt giữa những trò chơi vận động đồng thời và vận động theo trật tự trong khuôn khổ thông tin. Cũng rất tự nhiên khi chúng ta nghĩ về những trò chơi vận động theo trật tự là những trò chơi mà trong đó các tay chơi lựa chọn các chiến lược của họ theo thứ tự, và nghĩ về những trò chơi vận động đồng thời mà trong đó các tay chơi lựa chọn các chiến lược cùng một lúc. Tuy nhiên điều này không hoàn toàn đúng vì cái có tầm quan trọng chiến lược thì về bản chất lại không phải là trật tự thời gian của các sự kiện, nhưng liệu có phải, và khi nào thì các tay chơi biết về các hành động của những tay chơi khác liên quan đến việc lựa chọn của riêng họ. Chẳng hạn nếu hai doanh nghiệp cạnh tranh đều đang xây dựng kế hoạch các chiến dịch marketing thì một doanh nghiệp có thể cam kết với chiến lược của nó nhiều tháng trước khi doanh nghiệp kia thực hiện; nhưng nếu doanh nghiệp này không biết doanh nghiệp kia cam kết hoặc sẽ cam kết cái gì khi họ ra các quyết định thì đó là một trò chơi vận động đồng thời. Ngược lại cờ tướng thường được chơi một cách chính thường như một trò chơi vận động theo trình tự: bạn thấy hết nhưng gì mà đối thủ của bạn đã thực hiện trước khi bạn lựa chọn hành động tiếp theo của mình. (Đánh cờ có thể trở thành một trò chơi vận động đồng thời nếu như mỗi tay chơi đưa ra một vận động trên một bàn cờ chung; nhưng đây là một trò rất khó đối với cách chơi cờ truyền thống).

Như đã nói ở trên, sự khác biệt giữa những trò chơi vận động đồng thời và những trò chơi vận động theo thứ tự không hoàn toàn giống với sự khác biệt giữa các trò chơi có thông tin hoàn hảo hay không hoàn hảo. Việc lý giải tại sao điều này lại là như vậy là một việc rất thú vị trong cách tạo lập được một sự hiểu biết đầy đủ về tất cả các tập khái niệm đó. Vì các trò chơi vận động đồng thời được xác định đặc trưng ở đọan trước nên sự thật là toàn bộ những trò chơi vận động đồng thời là những trò chơi thuộc loại thông tin không hoàn hảo. Tuy nhiên một số trò chơi lại có thể bao gồm cả vận động đồng thời lẫn vận động theo thứ tự. Chẳng hạn hai công ty có thể cam kết thực hiện các chiến lược marketing của họ một cách độc lập và bí mật đối với nhau, nhưng sau đó họ lại cam kết cạnh tranh giá cả một cách công khai với nhau. Nếu các chiến lược marketing tối ưu phụ thuộc một cách bộ phận hoặc toàn thể vào cái hy vọng sẽ xảy ra trong trò chơi giá cả tiếp theo thì cần phải phân tích hai giai đoạn như là một trò chơi độc lập trong đó một giai đoạn chơi theo thứ tự tiếp theo bằng một giai đoạn chơi đồng thời. Toàn bộ các trò chơi liên quan đến các giai đoạn hỗn hợp như vậy là những trò chơi thuộc loại thông tin không hoàn hảo, tuy nhiên chúng cũng có thể được phân đọan một cách tạm thời. Các trò chơi thuộc loại thông tin không hoàn hảo (như tên gọi đã ẩn ý) thể hiện những trường hợp trong đó không có vận động nào là đồng thời (và ở đó không có tay chơi nào đã từng quên cái diễn ra trước đó).

Như đã nói ở trên, các trò chơi thuộc loại thông tin hoàn hảo về mặt logic là loại trò chơi đơn giản nhất. Nó là đơn giản nhất bởi vì trong các trò chơi đó (chừng nào các trò chơi kết thúc, tức là hoàn thành sau một số hành động đã biết) những tay chơi và các nhà phân tích có thể sử dụng một thủ tục minh bạch để dự đoán kết quả. Trong một trò chơi như vậy, một tay chơi duy lý chọn hành động đầu tiên của bà ta bằng cách suy tính mỗi loạt phản ứng và những loạt phản ứng lại xuất hiện từ mỗi hành động mở đối với bà ta. Sau đó bà ta tự hỏi mình xem những kết quả cuối cùng nào sẽ đem lại cho bà ta tiện ích cao nhất, và lựa chọn hành động bắt đầu chuỗi dẫn đến kết quả. Quá trình này được gọi là qui nạp ngược (vì sự suy lý diễn ra ngược lại từ các kết quả cuối cùng đến những vấn đề quyết định hiện tại).

Chúng ta cần phải dừng lại lâu hơn với vấn đề qui nạp ngược và những thuộc tính của nó trong phần sau (khi chúng ta bắt đầu thảo luận về sự cân bằng và những chọn lựa cân bằng). Đến đây chúng tôi đã mô tả nó theo trật tự để sử dụng nó nhằm giới thiệu một trong hai loại đối tượng toán học được sử dụng để thể hiện các trò chơi: cây trò chơi. Một cây trò chơi là một ví dụ về cái mà các nhà toán học gọi là một đồ hình có hướng. Đó là một tập các nút liên thông từ đỉnh trang đến đáy hoặc từ bên trái sang bên phải. Trong trường hợp thứ nhất các điểm nút ở đỉnh trang được lý giải là xuất hiện sớm hơn trong chuỗi hành động. Trong trường hợp của một cây được vẽ từ trái qua phải thì các nút phía trái xuất hiện trước trong chuỗi rồi đến các nút phía phải. Một cây không dán nhãn có cấu trúc kiểu loại sau:

Hình 1

Vấn đề thể hiện trò chơi bằng cách sử dụng hình cây có thể được hiểu một cách dễ dàng nhất bằng việc hiển thị cách sử dụng chúng trong việc trợ giúp sự suy lý qui nạp ngược. Hãy tưởng tượng một tay chơi (hay một nhà phân tích) bắt đầu ở cuối của cái cây, nơi đó các kết quả được hiển thị và sau đó hành động ngược trở lại từ đó bằng cách tìm kiếm các tập chiến lược mô tả tuyến đường dẫn đến các kết quả đó. Vì một hàm tiện ích của người chơi chỉ rõ những kết quả nào bà ta ưa thích hơn, chúng ta có thể biết con đường nào bà ta sẽ thích hơn. Tất nhiên không phải tất cả các đường dẫn sẽ đều khả thể vì một tay chơi khác cũng có vai trò chọn lựa những đường dẫn và sẽ không thực hiện các hành động dẫn đến những kết quả ít được ưa thích hơn đối với ông ta. Chúng ta sẽ đưa ra một số ví dụ về việc lựa chọn đường dẫn tương tác này, và các kỹ thuật chi tiết cho việc suy lý cho chúng, sau khi chúng ta đã mô tả một tình huống có thể sử dụng một cái cây để mô tả.

Những hình cây được sử dụng để thể hiện các trò chơi theo trật tự, vì chúng chỉ ra cái trật tự trong đó các hành động được những người chơi thực hiện. Tuy nhiên các trò chơi đôi khi cũng được thể hiện bằng các Ma trận chứ không phải là những hình cây. Đây là loại đối tượng toán thứ hai được sử dụng để thể hiện các trò chơi. Các ma trận không giống với những hình cây đơn giản chỉ ra các kết quả, được thể hiện trong các thuật ngữ của những hàm tiện ích của người chơi mà đối với mỗi kết hợp chiến lược khả thể tay chơi có thể phải sử dụng. Chẳng hạn có thể tạo thành ý nghĩa để hiển thị trò chơi qua sông trong phần I trên một ma trận, vì trong trò chơi này cả người chạy trốn lẫn kẻ truy đuổi đều chỉ có một vận động và mỗi người lựa chọn vận động của họ mà không hề biết người kia lựa chọn vận động nào. Vậy thì ở đây là phần của ma trận:

Hình 2

Chú thích hình 2:

- Cobra Bridge = cầu có rắn hổ mang

- Rocky Bridge = cầu có đá rơi

- Safe Bridge = cầu an toàn

- Fugitive = kẻ chạy trốn

- Hunter = người săn

Ba chiến lược khả thể của người chạy – qua chiếc cầu an toàn, những tảng đá có nguy cơ bị rơi và nguy cơ gặp rắn hổ mang – tạo thành các hàng của ma trận. Tương tự như vậy ba chiến lược khả thể của người săn đuổi - đợi ở chiếc cầu an toàn, đợi ở chiếc cầu có đá rơi, và đợi ở chiếc cầu có rắn hổ mang – tạo thành cột của ma trận. Mỗi ô của ma trận chỉ rõ hoặc sẽ chỉ rõ nếu ma trận của chúng ta hoàn thiện – một kết quả được xác định trong khuôn khổ những khoản được trả của người chơi. Một khoản được trả của người chơi đơn giản là một con số được ấn định bởi hàm tiện ích thứ tự của bà săn đuổi cho hiện trạng của các sự kiện phù hợp với kết quả. Đối với mỗi kết quả, khoản được trả của Hàng luôn luôn được kê trước hết, sau đó đến khoản được trả của Cột. Vì vậy chẳng hạn như góc trái ở trên cùng cho thấy rằng khi người chạy trốn đi qua chiếc cầu an toàn còn người săn đuổi cũng đang chờ ở đó thì người chạy trốn nhận được một khoản được trả bằng 0, và người săn đuổi nhận được khoản được trả bằng 1. Chúng ta lý giải điều này bằng cách qui chiếu vào hàm tiện ích của họ mà trong cuộc chơi này là rất đơn giản. Nếu người chạy trốn qua sông được an toàn thì anh ta nhận được một khoản được trả là 1; nếu không an toàn thì anh ta được 0. Nếu người chạy trốn không thực hiện được vì anh ta bị bắn hoặc bị đá rơi vào hoặc bị rắn hổ mang tấn công thì người săn đuổi nhận được khoản được trả là 1 và người chạy trốn là 0.

Chúng tôi sẽ giải thích vắn tắt các phần của ma trận đã được ghi số, và sau đó nói rõ tại sao chúng ta vẫn không thể hoàn thiện được các ô còn lại. Bất cứ khi nào người săn đuổi đợi ở chiếc cầu mà người chạy trốn lựa chọn thì người chạy trốn sẽ bị bắn. Tất cả những kết quả này tạo ra vector của khoản được trả là (0, 1). Bạn có thể tìm ra chúng bằng cách vạch chéo xuống qua ma trận từ góc phía trên bên trái xuống. Bất cứ khi nào mà người bỏ trốn chọn chiếc cầu an toàn nhưng người săn đuổi lại đợi ở chỗ khác thì người chạy trốn qua sông được an toàn, bằng cách nhận được khoản được trả theo vector (1, 0). Hai kết quả này được chỉ rõ trong hai ô thứ hai của hàng đầu. Đến lúc này toàn bộ những ô còn lại được đánh dấu bằng dấu hỏi. Tại sao? Vấn đề ở đây là nếu người bỏ trốn qua sông ở chỗ cây cầu đá rơi hoặc chỗ cây cầu có rắn hổ mang thì anh ta đã đưa các yếu tố tham số vào trò chơi. Trong những trường hợp này anh ta đã hứng lấy rủi ro bị giết, và vì vậy mà tạo ra vector khoản được trả là (0, 1), có nghĩa là độc lập với bất cứ cái gì người săn đuổi làm. Chúng ta vẫn chưa giới thiệu đủ khái niệm để có thể chỉ rõ phương thức thể hiện các kết quả này như thế nào trong khuôn khổ của các hàm tiện ích – nhưng đã đến lúc chúng ta phải kết thúc cái điều mình cần kết thúc và điều đó sẽ cung cấp cho ta chiếc chìa khóa để giải vấn đề rắc rối ở phần I.

Các trò chơi ma trận được qui vào những trò chơi “dạng - chiến lược” hay “dạng – thông thường”, và các trò chơi như những hình cây được qui vào “dạng- mở rộng”. Hai loại trò chơi ấy không tương đương với nhau, vì những trò chơi dạng mở rộng bao gồm thông tin - về những trật tự chơi và các cấp độ thông tin về cấu trúc trò chơi của tay chơi – các trò chơi dạng chiến lược lại không có. Nhìn chung một trò chơi dạng chiến lược có thể thể hiện bất cứ một vài dạng trò chơi mở rộng nào, vì vậy một trò chơi dạng chiến lược được coi là một tập trò chơi mở rộng tốt nhất. Khi trật tự của trò chơi không liên quan đến một kết quả của trò chơi thì bạn nên nghiên cứu dạng chiến lược của nó, vì đó là toàn bộ cả tập mà bạn muốn biết về nó. Chỗ nào mà trật tự của trò chơi có liên quan thì dạng mở rộng của nó phải được xác định hoặc các kết luận của bạn sẽ không đáng tin cậy.

2.4. Nan đề người tù như là một ví dụ về dạng chiến lược

Những khác biệt được mô tả ở trên sẽ khó nắm bắt được đầy đủ nếu tất cả những gì mà người ta phải làm là những mô tả trừu tượng. Chúng được minh họa tốt nhất bằng một ví dụ. Với mục đích này chúng ta sẽ sử dụng trò chơi nổi tiếng nhất: trò chơi PD [Nan đề của người tù]. Nó thực sự cho chúng ta một logic về vấn đề mà những người lính của Cortez và của Henry V phải đối mặt, và kể cả các tác nhân của Hobbes cũng vậy trước khi họ tăng cường tính chuyên chế. (Phần I ở trên). Tuy nhiên đối với những lý do sẽ được làm rõ ngay dưới đây, bạn sẽ không coi PD như là một trò chơi điển hình; nó không hề điển hình. Chúng tôi sử dụng nó như một ví dụ mở rộng chỉ vì nó đặc biệt hữu ích cho việc minh họa mối quan hệ giữa các trò chơi loại hình chiến lược và những trò chơi loại hình mở rộng (và sau đó để minh họa cho các mối quan hệ giữa các trò chơi duy nhất một lần và được lặp lại; xem Phần 4 dưới đây).

Tên của trò chơi nan đề người tù được bắt nguồn từ tình huống sau điển hình được sử dụng để làm thí dụ cho nó. Giả sử viên cảnh sát đã bắt hai người mà họ biết là có tham gia vào một vụ cướp có vũ khí. Nhưng không may họ lại thiếu bằng chứng có thể chấp nhận một cách đầy đủ để thành lập một ban hội thẩm để xử án. Tuy nhiên họ lại có đủ bằng chứng để bắt những người tù này trong hai năm vì tội ăn trộm xe ô tô để chạy trốn. Giờ đây chánh thanh tra thực hiện một đề nghị như sau đối với mỗi người tù: nếu anh nhận tôi ăn cướp khi dính líu đến cả người cùng hành động với anh , mà cô ta lại không nhận thì anh sẽ được tự do, còn cô ta sẽ phải chịu 10 năm tù. Nếu cả hai cùng nhận tội thì anh sẽ phải chịu 5 năm tù. Nếu cả hai không nhận tội thì mỗi người sẽ phải chịu 2 năm vì tội ăn trộm xe. Bước đầu tiên chúng ta cần lên mô hình tình huống của bạn với tư cách một trò chơi là thể hiện nó dưới dạng các hàm tiện ích. Cả bạn và các hàm tiện ích của đối tác của bạn là giống hệt như nhau:

Được thả >>4

2 năm tù >>3

5 năm tù >>2

10 năm tù >> 0

Các con số trong hàm trên giờ đây được sử dụng để thể hiện cái khoản phải trả của đối tác của bạn bằng những kết quả khác nhau có thể xảy ra đối với tình huống của bạn. Chúng ta sẽ coi bạn là “Người chơi I” và đối tác của bạn là “người chơi II”. Giờ đây chúng ta có thể thể hiện toàn bộ tình huống trên một ma trận; đây là loại hình chiến lược trong trò chơi của bạn.

Hình 3

Chú thích hình 3:

- Confess = thú tội

- Refuse = từ chối

- Player = người chơi

Mỗi ô của ma trận để ghi những khoản phải trả cho cả hai người chơi đối với mỗi kết hợp các hành động. Khoản phải trả của người chơi I thể hiện bằng số đầu tiên của mỗi cặp; người chơi II là số thứ hai. Vì vậy nếu cả hai đều nhận tội thì mỗi người nhận được một khoản phải trả là 2 (năm 5 tù cho mỗi người). Điều này thể hiện trong ô phía trên, bên trái. Nếu cả hai người đều nhận tội thì mỗi người nhận được khoản phải trả là 3 (mỗi người 2 năm tù). Điều này được thể hiện ở ô thấp bên phải. Nếu bạn nhận tội và đối tác của bạn không nhận thì bạn sẽ nhận được khoản phải trả là 4 (được trả tự do) và cô ta sẽ nhận được một khoản phải trả là 0 (10 năm tù). Điều này được thể hiện ở ô phía trên, bên phải. Tình huống đảo ngược khi cô ta nhận tội còn bạn thì từ chối, thể hiện ở ô thấp bên trái.

Bạn đánh giá hai hành động khả thể của mình bằng cách so sánh những khoản phải trả của bạn trong mỗi cột, vì điều này sẽ chỉ cho bạn thấy những hành động nào của bạn được ưa thích đối với mỗi hành động có thể mà đối tác của bạn sẽ thực hiện. Vì vậy hãy quan sát: nếu đối tác của bạn nhận tội thì bạn sẽ nhận một khoản phai trả là 2 bằng cách nhận tội và một khoản phải trả là 0 bằng cách từ chối. Nếu đối tác của bạn từ chối bạn sẽ nhận một khoản phải trả là 4 bằng cách nhận tội và một khoản phải trả là 3 bằng cách từ chối.

Vì vậy tốt hơn hết là bạn nhận tội bất kể cô ta hành động như thế nào. Trong khi đó đối tác của bạn đánh giá các hành động của cô ta bằng cách so sánh các khoản phải trả của cô ta dưới mỗi hàng, và cô ta bắt đầu đi tới cùng một kết luận hệt như bạn. Bất cứ ở đâu một hành động cho một người chơi đều được xếp cao hơn so với những hành động khác của cô ta cho mỗi hành động có thể bởi đối phương thì chúng ta nói rằng hành động đầu tiên thống trị một cách nghiêm nhặt hành động thứ hai. Vậy thì trong trò chơi PD, hành động nhận tội thống trị một cách nghiêm nhặt hành động chối tội đối với cả hai người chơi. Cả hai người chơi đều biết tình huống này đối với người kia, vì vậy việc hoàn toàn bỏ đi bất cứ sự cám dỗ nào đi trệch khỏi con đường thống trị một cách nghiêm nhặt. Vì vậy cả hai người chơi sẽ đều nhận tội, và cả hai sẽ đều ngồi tù 5 năm.

Những người chơi và các nhà phân tích có thể dự đoán được kết quả này bằng cách sử dụng một thủ tục cơ giới, gọi là sự loại bỏ lặp lại các chiến lược thống trị nghiêm nhặt. Bạn với tư cách là người chơi I có thể thấy bằng cách xem xét cái ma trận mà những khoản phải trả của bạn trong mỗi ô của hàng trên cùng là cao hơn những khoản phải trả của bạn trong mỗi ô tương ứng của hàng dưới cùng. Vì vậy có thể là không bao giờ duy lý đối với bạn để thực hiện cái chiến lược hàng dưới cùng của bạn, tức là từ chối nhận tội, bất kể đối tác của bạn làm gì. Vì chiến lược hàng đáy của bạn sẽ không bao giờ được chơi nên cách đơn giản nhất đối với chúng ta là bỏ hàng đáy khỏi ma trận. Giờ đây rõ ràng là người chơi thứ hai sẽ không từ chối nhận tội vì cái khoản phải trả từ sự từ chối của ông ta trong hai ô vẫn cao hơn khoản phải trả vì chối tội. Vì vậy một lần nữa chúng ta lại có thể xóa bỏ cột một ô ở bên phải khỏi ma trận trò chơi. Giờ đây chúng ta chỉ còn một ô tương ứng với kết quả nảy sinh bởi cả hai cùng nhận tội. Khi sự suy lý dẫn chúng ta tới xóa bỏ toàn bộ những kết quả có thể khác, ở mỗi bước chỉ tùy thuộc vào cái tiên đề là cả hai người chơi đều duy lý về phương diện kinh tế – nghĩa là cả hai đều thích những khoản trả cao hơn cho những kết quả thấp hơn – có những cơ sở rất chắc chắn cho việc coi hành động cùng nhận tội là giải pháp đối với trò chơi, mà kết quả trò chơi phải hội tụ vào nó. Bạn nên lưu ý rằng cái trật tự mà trong đó các hàng và các cột thống trị một cách nghiêm nhặt bị xóa đi là không có vấn đề gì. Chúng ta đã bắt đầu bằng việc xóa cột tay phải và sau đó xóa hàng đáy thì chúng ta sẽ đạt tới được cùng một giải pháp.

Điều đó nói lên rằng một cặp số lần mà trò chơi PD không phải là một trò chơi điển hình theo nhiều phương diện. Một trong những phương diện này là ở chỗ tất cả các hàng và các cột đều được thống trị một cách nghiêm nhặt, và là những hàng và cột thống trị một cách nghiêm nhặt. Trong bất cứ trò chơi loại hình chiến lược nào mà ở đó điều này là thật thì sự xóa bỏ lặp lại của các chiến lược thống trị được đảm bảo để đạt được một giải pháp duy nhất. Tuy nhiên sau đó chúng ta sẽ thấy rằng đối với nhiều trò chơi thì điều kiện này không áp dụng được, vậy thì nhiệm vụ phân tích của chúng ta là ít tính minh bạch.

Có lẽ bạn đã nhận thấy một điều gì đó bối rối về kết quả của trò chơi PD. Cả hai người bạn đã từ chối nhận tội thì bạn sẽ đạt tới một kết quả ô bên phải phía dưới trong đó mỗi người chỉ đi tù hai năm, do đó cả hai khi đạt được tiện ích cao hơn bạn nhận được khi nhận tội. Đây là sự kiện quan trọng nhất về trò chơi PD, và ý nghĩa của nó đối với lý thuyết trò chơi là hoàn toàn tổng quát. Vì vậy chúng ta sẽ còn tiếp tục đề cập đến nó dưới đây khi chúng ta thảo luận về những khái niệm cân bằng trong lý thuyết trò chơi. Còn bây giờ chúng ta vẫn cần phải tiếp tục dừng lại ở việc sử dụng trò chơi đặc biệt này để minh họa cho sự khác biệt giữa các loại hình chiến lược và mở rộng.

Khi người ta đưa trò chơi PD vào các thảo luận đặc biệt thì đôi khi bạn sẽ nghe thấy người ta nói rằng thanh tra cảnh sát cần nhốt những người tù vào những phòng khác nhau để cho họ không thể giao tiếp với nhau. Việc suy lý đàng sau ý tưởng này dường như đã rõ ràng, nếu bạn có thể giao tiếp thì chắn chắn bạn sẽ thấy rằng tốt hơn hết là cả hai đều chối tội, và họ có thể thỏa thuận với nhau để làm điều đó được không? Điều này, người ta có thể đoán chừng là, sẽ gỡ bỏ việc thú tội của bạn là thứ mà bạn phải nhận vì đàng nào thì bạn cũng được đối tác của mình nhường sạch toàn bộ con sông. Tuy nhiên thực tế thì cái cảm nhận này là sai lầm và kết luận của nó là giả.

Còn nữa....

Tác giả: Don Ross là Giáo sư Triết học tại Đại học Alabama ở Birmingham, Giáo sư Kinh tế học tại Đại học Cape Town, Nam Phi. Công trình chủ yếu: Economic Theory and Cognitive Science: Microexplanation (MIT Press, 2005).

Nguyên văn: Game Theory, The Stanford Encyclopedia of Philosophy (Fall 2010 Edition), Edward N. Zalta (ed.), First published Sat Jan 25, 1997; substantive revision Wed May 5, 2010

References

Baird, D., Gertner, R., and Picker, R. (1994). Game Theory and the Law. Cambridge, MA: Harvard University Press.

Binmore, K., Kirman, A., and Tani, P. (eds.) (1993). Frontiers of Game Theory. Cambridge, MA: MIT Press

Binmore, K. (1998). Game Theory and the Social Contract (v. 2): Just Playing. Cambridge, MA: MIT Press.

Camerer, C. (2003). Behavioral Game Theory: Experiments in Strategic Interaction. Princeton: Princeton University Press.

Danielson, P. (ed.) (1998). Modelling Rationality, Morality and Evolution. Oxford: Oxford University Press.

Fudenberg, D., and Levine, D. (1998). The Theory of Learning in Games. Cambridge, MA: MIT Press.

Fudenberg, D., and Tirole, J. (1991). Game Theory. Cambridge, MA: MIT Press.

Gintis, H. (2004). Towards the Unity of the Human Behavioral Sciences. In Philosophy, Politics and Economics 31:37-57.

Guala, F. (2005). The Methodology of Experimental Economics. Cambridge: Cambridge University Press.

Hofbauer, J., and Sigmund, K. (1998). Evolutionary Games and Population Dynamics. Cambridge: Cambridge University Press.

Krebs, J., and Davies, N.(1984). Behavioral Ecology: An Evolutionary Approach. Second edition. Sunderland: Sinauer.

Kreps, D. (1990). A Course in Microeconomic Theory. Princeton: Princeton University Press.

Maynard Smith, J. (1982). Evolution and the Theory of Games. Cambridge: Cambridge University Press.

McMillan, J. (1991). Games, Strategies and Managers. Oxford: Oxford University Press.

Nash, J. (1950a). Equilibrium Points in n-Person Games. In PNAS 36:48-49.

Nash, J. (1950b). The Bargaining Problem. In Econometrica 18:155-162.

Nash, J. (1951). Non-cooperative Games. In Annals of Mathematics Journal 54:286-295.

Ormerod, P. (1994). The Death of Economics. New York: Wiley.

Rawls, J. (1971). A Theory of Justice. Cambridge, MA: Harvard University Press.

Robbins, L. (1931). An Essay on the Nature and Significance of Economic Science. London: Macmillan.

Ross, D. 2005. Evolutionary Game Theory and the Normative Theory of Institutional Design: Binmore and Behavioral Economics. In Politics, Philosophy and Economics, forthcoming.

Ross, D., and LaCasse, C. (1995). Towards a New Philosophy of Positive Economics. In Dialogue 34: 467-493.

Samuelson, L. (1997). Evolutionary Games and Equilibrium Selection. Cambridge, MA: MIT Press.

Samuelson, L. (2005). Economic Theory and Experimental Economics. In Journal of Economic Literature 43:65-107.

Samuelson, P. (1938). A Note on the Pure Theory of Consumers' Behaviour. In Econimica 5:61-71.

Selten, R. (1975). Re-examination of the Perfectness Concept for Equilibrium Points in Extensive Games. In International Journal of Game Theory 4:22-55.

Sigmund, K. (1993). Games of Life. Oxford: Oxford University Press.

Smith, V. (1982). Microeconomic Systems as an Experimental Science. In American Economic Review 72:923-955.

Sober, E., and Wilson, D.S. (1998). Unto Others. Cambridge, MA: Harvard University Press.

Tomasello, M., M. Carpenter, J. Call, T. Behne and H. Moll (2004). Understanding and Sharing Intentions: The Origins of Cultural Cognition. In Behavioral and Brain Sciences, forthcoming.

Vallentyne, P. (ed.). (1991). Contractarianism and Rational Choice. Cambridge: Cambridge University Press.

von Neumann, J., and Morgenstern, O., (1947). The Theory of Games and Economic Behavior. Princeton: Princeton University Press, 2nd edition.

Weibull, J. (1995). Evolutionary Game Theory. Cambridge, MA: MIT Press.

Yaari, M. (1987). The Dual Theory of Choice Under Risk. In Econometrica 55:95-115.

Young, H.P. (1998). Individual Strategy and Social Structure. Princeton: Princeton University Press.

Tiếng vọng KATTIGARA

Thứ Hai, 23 tháng 4, 2012

Lý thuyết Trò chơi (II)

Không có nhận xét nào:

Đăng nhận xét