Thứ Ba, 10 tháng 9, 2013

Nhập môn Phương pháp luận và Thiết kế nghiên cứu Khoa học xã hội (I)



Nhập môn Phương pháp luận và Thiết kế nghiên cứu Khoa học xã hội (I)

James K. Doyle

Người dịch: Hà Hữu Nga

Giới thiệu

 

Các dự án nghiên cứu như IQP [Interactive Qualifying Project] xem xét giao điểm giữa khoa học, công nghệ và xã hội thường đòi hỏi việc tập hợp và phân tích các dữ liệu xã hội. Phản xạ thông thường nhất của những người mới bắt đầu nghiên cứu đối với nhu cầu tập họp và phân tích dữ liệu là tiến hành một cuộc khảo sát. Cuối cùng mọi người đều có kinh nghiệm về việc trả lời các phiếu khảo sát, và đó thường là một thao tác trực tiếp và đơn giản. Xuất phát từ kinh nghiệm này nhiều người cho rằng việc viết phiếu và tiến hành khảo sát sẽ là một vấn đề không khó khăn gì nhiều.

Tuy nhiên trong thực tế thì các cảm giác như vậy về công việc nghiên cứu lại thường không chính xác. Để kiểm tra các trực giác của bạn, bạn có thể xem mình trả lời các câu hỏi thật/giả dưới đây (những câu trả lời ở cuối chương) 

T/F 1. (True/False – Thật/Giả) 1. Việc xác định dư luận của người dân một thành phố 10.000.000 người đòi hỏi một mẫu lớn hơn nhiều so với một cuộc khảo sát một thành phố 100.000 người.

T/F 2. Việc lựa chọn ngẫu nhiên những tên người từ một danh bạ điện thoại là cách tốt nhất để chọn một mẫu khảo sát về bằng điện thoại.

T/F 3. Các câu hỏi khảo sát cần được thể hiện bằng một trật tự ngẫu nhiên.

T/F 4. Đưa phiếu khảo sát lên một trang Web là một cách làm tốt để có được một tập hợp mẫu tham khảo lớn và tăng kích cỡ mẫu.

T/F 5. Nếu một mẫu khảo sát quá ít người dẫn đến không đạt được kết quả thì cần phải chọn mẫu thứ hai để tăng số lượng người trả lời.

Việc tìm hiểu những lời đáp cho các câu hỏi này và nhiều câu hỏi khác là rất cần thiết cho việc tiến hành các khảo sát khoa học nhằm đạt được các kết quả chính xác, không thiên vị và có tính khái quát. Nhưng hiếm có người nào giải thích những nguyên do ẩn sau các câu hỏi như vậy một cách chính xác mà lại không cố gắng nghiên cứu phương pháp luận và việc thiết kế khảo sát. Trong thực tế thì có rất ít lý do để hy vọng thành công trong cách thức nghiên cứu khảo sát như vậy mà lại không tiến hành nghiên cứu đề tài một cách chính thức. Các phương pháp nghiên cứu cơ bản của khoa học xã hội thường phức tạp, khó học và phản trực giác so với các phương pháp nghiên cứu cơ bản của các khoa học khác, vì các đề tài nghiên cứu, và các lĩnh vực thuộc về con người thường phức tạp hơn nhiều. Các nguyên tử và các hoá chất chẳng hạn không bao giờ có thể suy luận được về các mục đích nghiên cứu của chúng ta, chúng không hề có ngày xấu, không hề thay đổi tư duy từ khoảng khắc này sang khoảng khắc khác.

Các nhà khoa học xã hội bằng cách tiến hành vô số nghiên cứu và thực nghiệm qua nhiều thập kỷ, giờ đây đều hiểu rất rõ về việc tiến hành một cuộc khảo sát như thế nào. Từ những câu hỏi quan trọng chẳng hạn như làm thế nào để lựa chọn được một tập hợp mẫu ngẫu nhiên với những chi tiết tưởng chừng vặt vãnh chẳng hạn như liệu việc khảo sát qua đường bưu điện bằng bảng hỏi in sẵn với phong bì đã dán sẵn tem để người trả lời tiện gửi câu trả lợi lại cho người khảo sát có tốt không, thì các câu trả lời đã có sẵn trong các tư liệu nghiên cứu đã được công bố và trong các sách giáo khoa rồi. Những loại tài liệu này có trong các công trình của các nhà nghiên cứu Rosnow và Rosenthal (1996), Salant và Dillman (1994)]. Vậy thì đối với các sinh viên là những người chưa bao giờ thực hiện một cuộc khảo sát nào rất cần phải học và thực hiện các nguyên tắc cơ bản về phương pháp luận và cách thức thiết kế một khảo sát khoa học. Mục đích của công trình này là giới thiệu cho các bạn về các nguyên tắc cơ bản và mô tả xem bạn có thể học hỏi nhiều hơn ở đâu.

 

Các phương pháp luận khoa học xã hội khác nhau


Các phiếu khảo sát có thể là một công cụ mạnh và hữu dụng cho việc tập hợp các dữ liệu về tính cách, thái độ, ý nghĩ và hành vi của con người. Và đôi khi việc tiến hành một cuộc khảo sát lại là một lựa chọn duy nhất để thu được các dữ liệu cần thiết cho việc trả lời một câu hỏi nghiên cứu quan trọng. Tuy nhiên việc thực hiện một cuộc khảo sát không phải là cách tiếp cận tốt nhất cho mỗi dự án. Trước khi quyết tâm thực hiện một cuộc khảo sát trước hết bạn nên suy xét kỹ xem liệu nhóm nghiên cứu của mình có phải là những người có chuyên môn thích hợp hay không. Việc tìm được những người cộng tác có chuyên môn thích hợp về tâm lý học, xã hội học hoặc các lĩnh vực khoa học xã hội khác thông qua Yêu cầu Khoa học Xã hội WPI là rất quan trọng trong việc tìm hiểu xem các nhà nghiên cứu đã biết gì về các cá nhân con người, các nhóm, và các xã hội và làm thế nào để có được những tri thức này. Hơn nữa cần quen thuộc với các phương pháp và các nguyên tắc cơ bản của môn phân tích thống kê để phân tích các dữ liệu khảo sát.   

Việc tiến hành đánh giá tư liệu nghiên cứu về đề tài của bạn cũng là một yêu cầu quan trọng cho việc thực hiện cuộc khảo sát. Những tư liệu này là kết quả lao động của hàng nghìn nhà chuyên môn, các nhà khoa học xã hội tiến hành và công bố các kết quả khảo sát và nghiên cứu về mỗi đề tài có khả năng nhận thức được. Có thể các câu hỏi nghiên cứu của bạn đã được các nhà nghiên cứu khác đặt ra và đã trả lời. Mặc dù sinh viên thường thất vọng khi chứng kiến thực tế đó, nhưng nó vẫn mở ra các cơ hội mới: bằng cách học hỏi từ kinh nghiệm của các nhà nghiên cứu khác thì dự án của bạn cũng vẫn sẽ được cải thiện về chất lượng; sau khi đọc và phân tích công trình nghiên cứu đã được tiến hành thuộc lĩnh vực chuyên môn mà bạn quan tâm thì bạn mới có thể chọn được một đề tài duy nhất, quan trọng và cụ thể hơn. 

Các nghiên cứu khảo sát cũng có một số hạn chế cố hữu, bao gồm những giới hạn sau:

1. Một cuộc khảo sát duy nhất có thể hoặc không thể xác lập được một mối quan hệ giữa hai biến số mà lại không đủ để xác định khuynh hướng của quy luật nhân quả. Ví dụ cuộc khảo sát về đề tài tính gây gổ có thể phát hiện ra một mối tương quan có ý nghĩa giữa số lần trẻ em gây gổ hoặc đánh nhau với việc chúng chơi video games mất bao nhiêu thời gian. Tuy nhiên điều đó cũng không tạo ra đầy đủ bằng chứng để chứng tỏ rằng chơi games là nguyên nhân của tính gây gổ, vì việc lý giải sau đây cũng tương thích với các dữ liệu đó: trẻ em có tính gây gổ thường tiêu phí thời gian vào chơi games.  

2. Các nghiên cứu khảo sát dựa vào các dữ liệu “tự báo cáo”, có nghĩa là chúng tuỳ thuộc vào những người tham dự thông báo một cách trung thực và chính xác về các thái độ và tính cách của họ. Không phải lúc nào điều đó cũng xảy ra. Chẳng hạn một số người được hỏi có thể cố ý trả lời các câu hỏi một cách thiếu chính xác hoặc không nghiêm túc. Tuy nhiên nếu cuộc khảo sát được tiến hành bằng một thái độ chuyên nghiệp thì điều đó sẽ ít xảy ra hơn so với bạn tưởng. Một điều còn đáng bận tâm hơn rất nhiều là các chủ đề có thể làm cho người ta mắc lỗi bỏ quên, lẫn lộn, hoặc ký ức giả.

3. Các nghiên cứu khảo sát thường có tính khuynh hướng rất rõ. Chẳng hạn vì những người trả lời biết rất rõ là họ đang là đối tượng nghiên cứu thì tối thiểu họ cũng có một suy nghĩ là tại sao họ lại là đối tượng khảo sát, và họ có thể thay đổi cách thức trả lời một cách có ý thức hoặc không có ý thức nhằm tự thể hiện bản thân hoặc tìm cách thích ứng với người đang nghiên cứu mình. Ngoài ra chính những người nghiên cứu cũng soạn thảo những câu hỏi theo hướng mà họ muốn người được hỏi trả lời theo cách thức mà họ mong đợi.  

4. Nếu được thực hiện một cách chính xác thì các cuộc khảo sát có thể đại diện một cách khách quan cho các quan điểm và suy luận của một tập hợp cư dân nào đó. Tuy nhiên như vậy không có nghĩa là các quan điểm này là chính xác. Mặc dù các dữ liệu khảo sát có thể được sử dụng để thông tin về việc ra quyết định và xây dựng chính sách công, nhưng chúng vẫn không thể thay thế được cho sự phân tích và đánh giá chuyên môn.

5. Cuối cùng việc tiến hành một cuộc khảo sát khoa học không phải là một hoạt động tầm thường, đơn giản. Khảo sát khoa học đòi hỏi nghiên cứu và xây dựng kế hoạch cẩn thận và cần nỗ lực nhiều, có thể mất hàng tuần để thực hiện và phân tích. Nếu nhóm nghiên cứu của bạn có dưới 7 tuần để thực hiện khảo sát thì bạn cần phải nỗ lực trả lời các câu hỏi nghiên cứu của bạn bằng cách sử dụng phương pháp khác. Sự tồn tại của các hạn chế nghiên cứu khảo sát như vậy không có nghĩa là bạn không nên tiến hành cuộc khảo sát: tất cả các phương pháp luận khoa học xã hội đều có hàng loạt hạn chế. Tuy nhiên trước khi quyết định tiến hành một cuộc khảo sát điều quan trọng là phải tìm kiếm những phương pháp khác nhau đã có và đo lường các phản đối và đồng thuận liên quan đến các mục tiêu dự án của bạn. Dưới đây là một số phương pháp chủ yếu tiến hành nghiên cứu khảo sát: 

1. Việc quan sát theo chủ nghĩa tự nhiên liên quan đến việc quan sát và ghi chép một cách hệ thống hành vi tự nhiên đang diễn ra. Vì các đối tượng khảo sát thậm chỉ còn không biết mình đang được nghiên cứu thì nhà nghiên cứu lại có thể tin chắc rằng các hành vi ấy là tự nhiên nhưng không được kiểm soát tốt đối với những gì đang xảy ra. Xem Martin và Bateson [1986]. 

2. Việc phân tích nội dung là một kỹ thuật để vạch ra những suy luận từ những hồ sơ hiện có hoặc các tư liệu (kể cả Hồ sơ Quốc hội đến việc trợ giúp cá nhân trong các tờ báo) bằng cách hệ thống và không thiên vị. Những thế mạnh này bao gồm khả năng nghiên cứu các tập hợp lớn và tư liệu xuất hiện tự nhiên theo thời gian; tuy nhiên nó liên quan đến các khuynh hướng lý giải và nhà nghiên cứu không thể kiểm soát được sưu tập dữ liệu [Weber 1985].

3. Các thực nghiệm chính thức về các đối tượng nghiên cứu là con người theo phương pháp khoa học, bằng cách xác định một cách ngẫu nhiên các đối tượng nghiên cứu để thay thế cho các điều kiện thực nghiệm tương tự ngoại trừ một biến số nhân quả. Chúng cho phép xác định các mối quan hệ nhân quả, nhưng thường đạt được điều này bằng cách hy sinh “giá trị bên ngoài”, có nghĩa là khả năng có thể áp dụng vào các tình huống đời sống thực. Xem chương [Chapter 4 of Judd et al. (1991) and Chapters 7 and 8 of Rosnow and Rosenthal (1996)].

4. Nghiên cứu trường hợp là phân tích sâu về một tổ chức đặc biệt, như một đại học, một doanh nghiệp, và một cộng đồng. Mặc dù một nghiên cứu trường hợp cho phép xem xét triệt để một tình huống đặc biệt, những kết quả nghiên cứu như vậy có thể được khái quát hoá vượt khỏi một trường hợp duy nhất, xem Yin [1989]. 

5. Phân tích dữ liệu thứ cấp là việc tái phân tích về các dữ liệu khảo sát hiện có được ai đó thu thập vì một mục đích khác. Lợi thế chủ yếu của phương pháp này là tiết kiệm lớn về thời gian và sức lực nhờ không phải thu thập các dữ liệu mới; bất tiện đầu tiên của nó là sự thiếu kiểm soát đối với thông tin được thu thập và không biết thông tin được thu thập như thế nào [Chapter 13 of Frankfort-Nachmias and Nachmias (1996)]. 

6. Khi quan sát tham dự các nhà nghiên cứu bắt đầu tham gia vào cuộc sống hàng ngày của các đối tượng nghiên cứu và các ghi chép thực địa cụ thể về các kinh nghiệm và các quan sát của họ. Điều đó cho phép các nhà nghiên cứu cam kết với việc khai thác kết mở tạo ra tính linh hoạt, tuy nhiên các quan sát đó khó khái quát hoá thành các tình huống khác và sự hiện diện của các nhà nghiên cứu có thể làm thay đổi hành vi của mọi người [Emerson 1983]. 

7. Các phỏng vấn cá nhân hoặc các cuộc thảo luận nhóm tập trung liên quan đến việc phỏng vấn trực tiếp những người được lựa chọn vì các mối quan tâm và hiểu biết của họ chứ không phải là là lựa chọn một cách ngẫu nhiên. Mặc dù chúng tạo điều kiện cho việc tiếp cận giải thích nhiều hơn, nhưng các kết quả đó không thể được khái quát hoá vượt khỏi các cá nhân hoặc các nhóm [Survey Research Center (1983) and Morgan (1988)]. Xem thêm các phương pháp luận khoa học xã hội khác, [xem Frankfort-Nachmias and Nachmias (1996) and McKenna (1995)].

 

Lấy mẫu

 

Mục đích của tất cả các cuộc khảo sát thực sự là tạo điều kiện cho nhà nghiên cứu dự báo một cách chính xác các tính cách đặc trưng hoặc tư duy của một nhóm người đã được xác định trước. Hướng đến kết quả này, đôi khi nó mang ý nghĩa cố gắng khảo sát toàn bộ tập hợp được quan tâm (chẳng hạn khi tập hợp này nhỏ, như một công ty dưới 100 người lao động, hoặc khi nó có ý nghĩa quan trọng vì lý do công bằng đem lại cho mỗi cá nhân cơ hội trả lời với trường hợp đánh giá khoá học của sinh viên). Tuy nhiên đối với đa số các trường hợp việc khảo sát toàn bộ một tập hợp là không thực tế và không cần thiết. Nếu được lựa chọn một cách khôn ngoan thì một mẫu tương đối nhỏ hoặc một tập con của một tập hợp vẫn có thể đạt được các dự báo chính xác, vì vậy việc sử dụng các nguồn lực hạn chế không phải được đem ra tiêu sài một cách hiệu quả nhất bằng cách cố gắng khảo sát mọi người mà bằng cách theo đuổi các mục tiêu khác khi có được một tỷ lệ trả lời cao [Section IV].


Hiện nay các tổ chức bàu cử chuyên nghiệp có thể dự báo hơn 100 triệu người sẽ bỏ phiếu như thế nào trong các cuộc bàu cử toàn quốc với biên độ sai số về điểm chỉ vài phần trăm bằng cách khảo sát dưới 2000 người. Họ có thể làm được điều đó bằng cách sử dụng các kỹ thuật lấy mẫu phức tạp để đảm bảo rằng những người tham gia cuộc khảo sát là những người đại diện cao cho các cử tri Mỹ với tư cách là một tổng thể. Tuy nhiên đối với hầu hết các dự án khảo sát kỹ thuật lấy mẫu cơ bản là lấy mẫu ngầu nhiên. Mục đích của việc chọn mẫu ngẫu nhiên là để đảm bảo rằng mỗi thành viên của một nhóm cư dân được lựa chọn đều có cơ hội ngang nhau trong việc được chọn vào mẫu khảo sát. Để chọn được một mẫu, cần phải có một danh sách những người có thể được chọn đưa vào mẫu (được gọi là khung mẫu). Tất cả các danh sách như vậy phải được đánh giá cẩn thận để đảm bảo rằng chúng chính xác và đầy đủ. Một số nguồn danh sách lại rất có vấn đề: các danh bạ điện thoại chẳng hạn không thể bao gồm được những người không có điện thoại hoặc những người có điện thoại nhưng lại không được kê vào bản danh sách, hoặc có những danh sách lại kê nhiều lần cùng một tên người và những người mới chuyển đến sau khi danh bạ điện thoại đã được công bố. Và ngay cả những danh mục hoàn hảo nhất cũng vẫn mắc lỗi hoặc bỏ sót. Chẳng hạn một tập danh mục phân loại từ Văn phòng Hộ tịch viên có thể là một nguồn dữ liệu tốt về danh sách tên người dùng cho một cuộc khảo sát của các sinh viên WPI, nhưng chúng lại không hoàn hảo: các danh sách như vậy, bao gồm các sinh viên chưa tốt nghiệp từ những trường khác nhau và các học sinh trường trung học.

Khi có được một danh sách thoả đáng thì việc lấy mẫu mới có thể được lựa chọn một các ngẫu nhiên thực sự. Điều này có thể đi kèm với hàng loạt cách thức, chẳng hạn bằng cách tham vấn một bảng số ngẫu nhiên trong một cuốn sách giáo khoa thống kê, bằng cách lựa chọn từng người trong trong danh sách sau khi đã lựa chọn một cách ngẫu nhiên một điểm xuất phát, hoặc ngay cả bằng việc rút ra những cái tên hoàn toàn ngẫu nhiên khi viết một loạt các danh sách đó vào những mẩu giấy và được sóc kỹ để xáo trộn bằng một cái mũ. Việc lấy được danh sách ngẫu nhiên bằng cách nào không thành vấn đề, tất cả các mẫu có thể xuyên tạc tập hợp ở một mức độ nào đó. Mặc dù lỗi lấy mẫu như vậy là không thể tránh khỏi nhưng vẫn có thể giảm bớt lỗi bằng cách lấy mẫu với kích cỡ đủ lớn. Các nhà nghiên cứu trẻ thường tìm kiếm một nguyên tắc giản đơn theo kinh nghiệm để quyết định kích cỡ mẫu. Tuy nhiên không có nguyên tắc kinh nghiệm như vậy: cần phải thừa nhận rằng một tập mẫu lớn đến độ nào là tuỳ thuộc vào việc nhà nghiên cứu trả lời hai câu hỏi sau như thế nào:

1. Lỗi lấy mẫu nhiều đến mức độ nào thì vẫn có thể chấp nhận được?

2. Các câu trả lời của người tham gia cho những câu hỏi khảo sát quan trọng nhất khác nhau đến mức độ nào?

Việc trả lời cho câu hỏi 1) một phần tuỳ thuộc vào các nguồn có sẵn: mỗi khi kích cỡ mẫu tăng lên thì độ chính xác cũng tăng lên, nhưng kéo theo là nó cũng sẽ làm tăng chi phí thời gian và tiền bạc cho việc thực hiện dự án. Việc đánh đổi như vậy giữa độ chính xác và chi phí là không thể tránh khỏi. Câu trả lời cũng tuỳ thuộc vào các hệ quả đi liền với việc mắc lỗi.

Đối với một vài dự án có thể đủ để ước lượng đặc trưng của một tập hợp ở mức 10 hoặc 15%; trong một số trường hợp khác khi các chi phí do mắc lỗi cao thì ước tính trong khoảng 5% hoặc có thể ít hơn. Câu trả lời cho câu hỏi 2) chỉ có thể được ước tính (nếu sai số tập hợp được biết một cách chính xác thì đã không cần phải làm khảo sát). Ước tính này có thể có được bằng việc đánh giá tư liệu của một nghiên cứu tương tự hoặc từ những kết quả của việc thử trước [xem Section VIII]. Khi các câu hỏi trên đã được giải quyết thì kích cỡ mẫu cần thiết n có thể được tính bằng công thức sau: n = (SD)2/(SE) 2, trong đó SD là độ lệch chuẩn (standard deviation) (căn bậc hai của sai số bình phương trung bình) của biến số tập hợp và SE là kích cỡ lệch chuẩn có thể chấp nhận (độ lệch chuẩn của tập hợp toàn bộ các số trung bình mẫu). Vì vậy chẳng hạn khi ta giả định rằng biến số quan trọng nhất đối với một cuộc khảo sát là điểm SAT và việc đánh giá tư liệu không phát hiện được rằng độ lệch chuẩn của các điểm SAT (SAT scores) ở cấp quốc gia là 150. Gỉa sử tiếp là các nhà nghiên cứu muốn là 95% đáng tin cậy thì họ sẽ có thể ước tính điểm SAT trung bình của nhóm tập hợp mục tiêu trong khoảng cộng trừ 30 điểm. Cụm từ “95% độ tin cậy” có nghĩa là trung bình mẫu sẽ rơi vào dãy hai sai số chuẩn 95% lần đưa đến sai chuẩn là 15. Vậy thì kích cỡ mẫu cần thiết n = (150) 2/(15) 2 = 22,500/225 = 100. Vì vậy cần lưu ý rằng các kết quả của phương trình này cho ta con số về các cuộc khảo sát hữu ích và hoàn thiện. Con số này sẽ chỉ điển hình là một phân số của các cuộc khảo sát được tiến hành.

Để tính số cuộc khảo sát phải được tiến hành, hãy chia n theo tỷ lệ trả lời mong muốn của cuộc khảo sát [xem Phần IV]. Cũng cần phải lưu ý rằng trong hầu hết các dự án khảo sát, người ta mong muốn đạt được các số lượng ước tính đáng tin cậy cho các phụ nhóm của tập hợp mục tiêu. Trong những trường hợp như vậy, các công thức trên có thể được sử dụng để tính kích cỡ cần thiết của các phụ nhóm có thể được bổ sung cùng để đạt được một kích cỡ mẫu tổng thể cần thiết. Chẳng hạn trong ví dụ mẫu SAT, nếu cấp độ đáng tin cậy tương tự là cần thiết cho những phụ nhóm sinh viên năm thứ nhất, sinh viên năm thứ hai, các sinh viên năm thứ ba, sinh viên năm cuối thì kích cỡ mẫu tổng thể cần thiết sẽ là 400 chứ không chỉ có 100. Trong bất kỳ trường hợp nào thì một mẫu ngẫu nhiên đơn giản vẫn là chưa đủ. Chẳng hạn hãy tưởng tượng một dự án được thiết kế để so sánh các điểm SAT của những người nam và những người nữ ở WPI. Một mẫu ngẫu nhiên đơn gồm 200 sinh viên sẽ gồm có 160 nam và 40 nữ - quá ít nữ để có thể rút ra kết luận với một mức độ đáng tin cậy cao. Trong những trường hợp chẳng hạn như khi một phụ nhóm quan trọng của một tập hợp tương đối hiếm, thì đó phải là mẫu quá lớn, có nghĩa là được lựa chọn ở tỷ lệ cao hơn nhiều so với nó xuất hiện trong tập hợp. Vì vậy nếu việc so sánh giữa nam và nữ là một mục tiêu quan trọng thì sẽ có ý nghĩa hơn nhiều khi rút ra một mẫu bao gồm 100 nữ và 100 nam. Có thể vẫn có được các con số ước tính tập hợp tổng thể bằng cách tạo thêm sức nặng cho các kết quả đạt được từ mỗi phụ nhóm theo mức độ thịnh hành thực sự của nó trong tập hợp; trong mẫu hiện tại, điểm SAT trung bình cho nam được nhân lên 8 và cho nữ được nhân lên 2 trước khi cộng chúng lại với nhau. Thông tin thêm xin xem Chương 5 Salant and Dillman (1994); Henry (1990); and Chapter 8 of Frankfort-Nachmias and Nachmias (1996).

 

Các tỷ lệ trả lời


Việc lựa chọn một mẫu đầy đủ không thiên vị là một cấu phần quan trọng của bất cứ cuộc khảo sát khoa học nào, nhưng vẫn không đủ để đảm bảo rằng những người trả lời là đại diện của tập hợp lớn hơn mà các mẫu được lựa chọn ra từ đó. Việc có được một tỷ lệ trả lời cao cũng rất quan trọng. Tỷ lệ trả lời của một cuộc khảo sát đơn giản là một con số các cuộc khảo sát hữu ích và không thiên vị được chia ra theo số người được yêu cầu hoàn thiện cuộc khảo sát. Nếu bộ phận này quá thấp thì có thể rơi vào tình trạng “lỗi không trả lời”, có nghĩa là các con số ước tính là thiên vị vì những người không trả lời khảo sát có những đặc trưng khác hoặc quan điểm khác với những người trả lời. 

Để minh hoạ cho hiệu ứng thiên vị tiềm tàng của một tỷ lệ trả lời thấp, giả sử là 500 phiếu khảo sát được gửi đến các sinh viên được lựa chọn WPI ngẫu nhiên bằng cách hỏi về hai phương án bố trí dịch vụ ăn uống mà họ ưa thích. Gỉa sử thêm là 150 sinh viên (30%) trả lời và 98 sinh viên chọn phương án A còn 52 sinh viên chọn cách B. Vậy thì rõ ràng đa số 65% sinh viên thích phương án A. Tuy nhiên phép phân tích đơn giản này giả định rằng trong thực tế không có người tham gia trả lời nào lại chỉ có cùng một quan điểm. Điều gì sẽ xuất hiện nếu chẳng hạn 350 người không trả lời chỉ có một sở thích lớt phớt 55% so với 45% đối với phương án B?. Tỷ lệ đích thực thích phương án A trong trường hợp này sẽ chỉ là 0.3 x 65% + 0.7 x 45% = 51%, khác biệt không đáng kể với 50%. Điều gì sẽ xảy ra nếu thay vì 350 không trả lời lại có một sở thích mạnh chẳng hạn 70% so với 30% đối với phương án B? Trong trường hợp này tỷ lệ thực sự thích phương án A có lẽ chỉ 0.3 x 65% + 0.7 x 30% = 40.5. Theo kịch bản này thì các kết quả đạt được từ 150 người trả lời hoàn toàn xuyên tạc sở thích của toàn bộ số sinh viên! Tất nhiên một tỷ lệ trả lời thấp đối với một cuộc khảo sát không đảm bảo rằng các kết quả sẽ là thiên vị. Trong việc khảo sát dịch vụ ăn uống giả định chẳng hạn hoàn toàn có thể xảy ra trường hợp không người trả lời nào có cùng sở thích (65% thích phương án A) như họ đã trả lời.  

Vấn đề rất đơn giản là không có một cách hiểu nào để đảm bảo điều mà những người không trả lời thích hay họ đang nghĩ như thế nào. Chỉ có một cách giảm thiểu mức độ không chắc chắn này là phải có được một tỷ lệ trả lời cao ngay từ vị trí đầu tiên. Chẳng hạn giả sử là cuộc khảo sát về dịch vụ ăn uống cho thấy 65% sinh viên thích phương án A đã đạt được một tỷ lệ trả lời là 70% chứ không phải 30%. Theo kịch bản này thì ngay cả khi những người không trả lời rất không thích phương án A (chẳng hạn thay vào đó là 70% thích phương án B) thì phương án A như cuộc khảo sát cho thấy sẽ vẫn là sở thích của toàn bộ số sinh viên: 0.7 x 65% + 0.3 x 30% = 54.5%.  Việc đạt được một tỷ lệ trả lời cao đối với cuộc khảo sát đòi hỏi cần phải đầu tư thời gian và nỗ lực lớn. Chỉ bằng gửi câu hỏi qua bưu điện hoặc gọi điện thoại đến những người trả lời tiềm năng là hoàn toàn chưa đủ là chắn chắn là kết quả chỉ đạt được tỷ lệ 20% hoặc thấp hơn. Điều đó xảy ra không phải là do hầu hết mọi người không quan tâm hoặc không muốn giúp đỡ, mà chỉ đơn giản là vì họ bận và có rất nhiều mối bận tâm khác quan trọng hơn lôi kéo quỹ thời gian của mình. Vì vậy một số cuộc khảo sát bằng bưu điện không nên thực hiện vì chúng thường lẫn lộn với hàng đống thư từ khác và thường bị vứt bỏ. Còn việc phỏng vấn bằng điện thoại nếu họ không biểu hiện bận bịu hoặc có trả lời máy thì hầu hết người ta thường từ chối nói chuyện vì họ có bạn bè hoặc đang ăn uống, hoặc đang sắp ra khỏi nhà, hoặc phải chăm con.

Có hai việc mà nhà nghiên cứu có thể thực hiện để tăng cơ hội được trả lời: 1) thiết kế một bảng hỏi (và kèm theo là một thứ vật chất nào đó) hoặc giới thiệu qua điện thoại để làm rõ là cuộc khảo sát vừa quan trọng lại vừa dễ thực hiện [xem Phần VII]; 2) thiết kế một kế hoạch thực hiện bao gồm cả rất nhiều phiếu gửi qua bưu điện và cả bằng gọi điện thoại nếu cần thiết để trực tiếp hướng dẫn mỗi người trả lời tiềm năng [xem Phần IX]. Nếu sử dụng được các kỹ thuật này thì tỷ lệ trả lời là 60-70% hoặc có thể cao hơn. Tuy nhiên trong một số trường hợp mặc dù người nghiên cứu đã rất nỗ lực, nhưng cuối cùng tỷ lệ trả lời vẫn chỉ đạt dưới 60%. Trong những trường hợp như vậy người nghiên cứu cần cố gắng xác định đến mức tối đa xem những người không trả lời giống nhau hoặc khác nhau như thế nào với những người trả lời dựa trên các biến tương quan. Đôi khi điều đó lại có thể được thực hiện bằng nguồn thông tin có sẵn, chẳng hạn trong hầu hết các trường hợp thì lại biết được vị trí địa lý và giới của người không trả lời, và các danh mục mẫu tình cờ lại chứa đựng những biến khác có thể dùng để so sánh được. Cũng có thể việc lựa chọn ngẫu nhiên cả bằng điện thoại mà một mẫu nhỏ những người không trả lời và cần nỗ lực khiến họ trả lời tối thiểu là một đôi câu hỏi để giúp so sánh với người trả lời. Thậm chí những người từ chối tham gia ngay từ đầu vẫn thường đồng ý một cuộc phỏng vấn chỉ mất khoảng một, hai phút. Để có được thông tin thêm về các tỷ lệ trả lời xin xem Chương 2 của Salant & Dillman (1994) và Chương 2 của Groves (1989).
___________________________________________

 

Nguồn: James K. Doyle 2006. Introduction to Survey Methodology and Design, Chapter 10 from the book Handbook for Interactive Qualifying Project [IQP] Advisors and Students, prepared by Douglas W. Woods, Professor Emeritus.

 

Tác giả: James K. Doyle, Phó GS, Trưởng khoa Khoa học Xã hội và Nghiên cứu Chính sách, Viện Bách khoa Worcester, Anh quốc. Ông là nhà tâm lý học, chuyên nghiên cứu về các vấn đề môi trường, xã hội và các mô hình tâm lý về các hệ thống phức tạp giúp cho quá trình ra các quyết định. Ông cũng chuyên về tâm lý học nhận thức và việc ứng dụng tâm lý học nhận thức vào cải thiện các kỹ năng nhận thức và giải quyết các vấn đề môi trường. Ngoài ra các công trình nghiên cứu về phương pháp luận nghiên cứu, hệ thống phương pháp khảo sát khoa học cũng là những đóng góp lớn của Doyle.

Tài liệu dẫn

Agresti, A. 1997. Statistical Methods for the Social Sciences, 3rd. ed. Upper Saddle River, NJ: Prentice-Hall.

American Psychological Association 1982. Ethical Principles in the Conduct of Research with Human Participants. Washington, D.C.: American Psychological Association.

Clayton, P., Applebee, A., and Pascoe, C. 1996. Email surveys: Old problems with a new delivery medium. LASIE: Information Bulletin of the Library Automated Systems Information Exchange, 27(2), 30-39.

Dillman, D. A. 1978. Mail and Telephone Surveys: The Total Design Method. New York: Wiley.

Emerson, R. B. 1983. Contemporary Field Research. Boston: Little, Brown.

Fowler, F. J., Jr. 1995. Improving Survey Questions: Design and Evaluation. Thousand Oaks, CA: Sage Publications.

Frankfort-Nachmias, C., and Nachmias, D. 1996. Research Methods in the Social Sciences, 5th ed. London: Edward Arnold.

Groves, R. M. 1989. Survey Errors and Survey Costs. New York: Wiley.

Henry, G. T. 1990. Practical Sampling. Newbury Park, CA: Sage.

Judd, C. M., Smith, E. R., and Kidder, L. H. 1991. Research Methods in Social Relations, 6th ed. Fort Worth, TX: Holt, Rinehart, and Winston.

Labaw, P. J., 1980. Advanced Questionnaire Design. Cambridge, MA: Abt Books.

Martin, P., and Bateson, P. 1986. Measuring Behavior: An Introductory Guide. Cambridge: Cambridge Univ. Press.

McCall, R. B. 1998. Fundamental Statistics for the Behavioral Sciences, 7th ed. Pacific Grove, CA: Brooks/Cole.

McGrath, R. E. 1997. Understanding Statistics: A Research Perspective. New York: Longman.

McKenna, R. J. 1995. The Undergraduate Researcher's Handbook: Creative Experimentation in Social Psychology. Boston: Allyn and Bacon.

Morgan, D. L. 1988. Focus Groups as Qualitative Research. Newbury Park, CA: Sage Publications.

Rosnow, R. L., and Rosenthal, R. 1996. Beginning Behavioral Research: A Conceptual Primer, 2nd ed. Englewood Cliffs, NJ: Prentice-Hall.

Salant, P. A., and Dillman, D. A. 1994. How to Conduct Your Own Survey. New York: Wiley.

Shavelson, R. J. 1996. Statistical Reasoning for the Behavioral Sciences, 3rd ed. Boston, MA: Allyn and Bacon.

Survey Research Center 1983. General Interviewing Techniques: A Self-Instructional Workbook for Telephone and Personal Interviewer Training. University of Michigan, Ann Arbor: Survey Research Center.

Weber, R. P. 1985. Basic Content Analysis. Beverly Hills, CA: Sage.

Yin, R. K. 1989. Case Study Research: Design and Methods. Newbury Park, CA: Sage Publications.


Không có nhận xét nào:

Đăng nhận xét