Nhập môn Phương pháp luận và Thiết kế nghiên cứu Khoa học xã hội (I)
James K. Doyle
Người
dịch: Hà Hữu Nga
Giới thiệu
Các
dự án nghiên cứu như IQP [Interactive
Qualifying Project] xem xét giao điểm giữa khoa học, công nghệ và xã hội
thường đòi hỏi việc tập hợp và phân tích các dữ liệu xã hội. Phản xạ thông
thường nhất của những người mới bắt đầu nghiên cứu đối với nhu cầu tập họp và
phân tích dữ liệu là tiến hành một cuộc khảo sát. Cuối cùng mọi người đều có
kinh nghiệm về việc trả lời các phiếu khảo sát, và đó thường là một thao tác
trực tiếp và đơn giản. Xuất phát từ kinh nghiệm này nhiều người cho rằng việc
viết phiếu và tiến hành khảo sát sẽ là một vấn đề không khó khăn gì nhiều.
Tuy
nhiên trong thực tế thì các cảm giác như vậy về công việc nghiên cứu lại thường
không chính xác. Để kiểm tra các trực giác của bạn, bạn có thể xem mình trả lời
các câu hỏi thật/giả dưới đây (những câu trả lời ở cuối chương)
T/F
1. (True/False – Thật/Giả) 1. Việc xác định dư luận của người dân một thành phố
10.000.000 người đòi hỏi một mẫu lớn hơn nhiều so với một cuộc khảo sát một
thành phố 100.000 người.
T/F
2. Việc lựa chọn ngẫu nhiên những tên người từ một danh bạ điện thoại là cách
tốt nhất để chọn một mẫu khảo sát về bằng điện thoại.
T/F
3. Các câu hỏi khảo sát cần được thể hiện bằng một trật tự ngẫu nhiên.
T/F
4. Đưa phiếu khảo sát lên một trang Web là một cách làm tốt để có được một tập
hợp mẫu tham khảo lớn và tăng kích cỡ mẫu.
T/F
5. Nếu một mẫu khảo sát quá ít người dẫn đến không đạt được kết quả thì cần
phải chọn mẫu thứ hai để tăng số lượng người trả lời.
Việc
tìm hiểu những lời đáp cho các câu hỏi này và nhiều câu hỏi khác là rất cần
thiết cho việc tiến hành các khảo sát khoa học nhằm đạt được các kết quả chính
xác, không thiên vị và có tính khái quát. Nhưng hiếm có người nào giải thích
những nguyên do ẩn sau các câu hỏi như vậy một cách chính xác mà lại không cố
gắng nghiên cứu phương pháp luận và việc thiết kế khảo sát. Trong thực tế thì
có rất ít lý do để hy vọng thành công trong cách thức nghiên cứu khảo sát như
vậy mà lại không tiến hành nghiên cứu đề tài một cách chính thức. Các phương
pháp nghiên cứu cơ bản của khoa học xã hội thường phức tạp, khó học và phản
trực giác so với các phương pháp nghiên cứu cơ bản của các khoa học khác, vì
các đề tài nghiên cứu, và các lĩnh vực thuộc về con người thường phức tạp hơn
nhiều. Các nguyên tử và các hoá chất chẳng hạn không bao giờ có thể suy luận
được về các mục đích nghiên cứu của chúng ta, chúng không hề có ngày xấu, không
hề thay đổi tư duy từ khoảng khắc này sang khoảng khắc khác.
Các
nhà khoa học xã hội bằng cách tiến hành vô số nghiên cứu và thực nghiệm qua
nhiều thập kỷ, giờ đây đều hiểu rất rõ về việc tiến hành một cuộc khảo sát như
thế nào. Từ những câu hỏi quan trọng chẳng hạn như làm thế nào để lựa chọn được
một tập hợp mẫu ngẫu nhiên với những chi tiết tưởng chừng vặt vãnh chẳng hạn
như liệu việc khảo sát qua đường bưu điện bằng bảng hỏi in sẵn với phong bì đã
dán sẵn tem để người trả lời tiện gửi câu trả lợi lại cho người khảo sát có tốt
không, thì các câu trả lời đã có sẵn trong các tư liệu nghiên cứu đã được công
bố và trong các sách giáo khoa rồi. Những loại tài liệu này có trong các công
trình của các nhà nghiên cứu Rosnow và Rosenthal (1996), Salant và Dillman
(1994)]. Vậy thì đối với các sinh viên là những người chưa bao giờ thực hiện
một cuộc khảo sát nào rất cần phải học và thực hiện các nguyên tắc cơ bản về
phương pháp luận và cách thức thiết kế một khảo sát khoa học. Mục đích của công
trình này là giới thiệu cho các bạn về các nguyên tắc cơ bản và mô tả xem bạn
có thể học hỏi nhiều hơn ở đâu.
Các phương pháp luận khoa học xã hội khác nhau
Các
phiếu khảo sát có thể là một công cụ mạnh và hữu dụng cho việc tập hợp các dữ
liệu về tính cách, thái độ, ý nghĩ và hành vi của con người. Và đôi khi việc
tiến hành một cuộc khảo sát lại là một lựa chọn duy nhất để thu được các dữ
liệu cần thiết cho việc trả lời một câu hỏi nghiên cứu quan trọng. Tuy nhiên
việc thực hiện một cuộc khảo sát không phải là cách tiếp cận tốt nhất cho mỗi
dự án. Trước khi quyết tâm thực hiện một cuộc khảo sát trước hết bạn nên suy
xét kỹ xem liệu nhóm nghiên cứu của mình có phải là những người có chuyên môn
thích hợp hay không. Việc tìm được những người cộng tác có chuyên môn thích hợp
về tâm lý học, xã hội học hoặc các lĩnh vực khoa học xã hội khác thông qua Yêu
cầu Khoa học Xã hội WPI là rất quan trọng trong việc tìm hiểu xem các nhà
nghiên cứu đã biết gì về các cá nhân con người, các nhóm, và các xã hội và làm
thế nào để có được những tri thức này. Hơn nữa cần quen thuộc với các phương
pháp và các nguyên tắc cơ bản của môn phân tích thống kê để phân tích các dữ
liệu khảo sát.
Việc
tiến hành đánh giá tư liệu nghiên cứu về đề tài của bạn cũng là một yêu cầu
quan trọng cho việc thực hiện cuộc khảo sát. Những tư liệu này là kết quả lao
động của hàng nghìn nhà chuyên môn, các nhà khoa học xã hội tiến hành và công
bố các kết quả khảo sát và nghiên cứu về mỗi đề tài có khả năng nhận thức được.
Có thể các câu hỏi nghiên cứu của bạn đã được các nhà nghiên cứu khác đặt ra và
đã trả lời. Mặc dù sinh viên thường thất vọng khi chứng kiến thực tế đó, nhưng
nó vẫn mở ra các cơ hội mới: bằng cách học hỏi từ kinh nghiệm của các nhà
nghiên cứu khác thì dự án của bạn cũng vẫn sẽ được cải thiện về chất lượng; sau
khi đọc và phân tích công trình nghiên cứu đã được tiến hành thuộc lĩnh vực
chuyên môn mà bạn quan tâm thì bạn mới có thể chọn được một đề tài duy nhất,
quan trọng và cụ thể hơn.
Các
nghiên cứu khảo sát cũng có một số hạn chế cố hữu, bao gồm những giới hạn sau:
1.
Một cuộc khảo sát duy nhất có thể hoặc không thể xác lập được một mối quan hệ
giữa hai biến số mà lại không đủ để xác định khuynh hướng của quy luật nhân
quả. Ví dụ cuộc khảo sát về đề tài tính gây gổ có thể phát hiện ra một mối
tương quan có ý nghĩa giữa số lần trẻ em gây gổ hoặc đánh nhau với việc chúng
chơi video games mất bao nhiêu thời gian. Tuy nhiên điều đó cũng không tạo ra
đầy đủ bằng chứng để chứng tỏ rằng chơi games là nguyên nhân của tính gây gổ,
vì việc lý giải sau đây cũng tương thích với các dữ liệu đó: trẻ em có tính gây
gổ thường tiêu phí thời gian vào chơi games.
2.
Các nghiên cứu khảo sát dựa vào các dữ liệu “tự báo cáo”, có nghĩa là chúng tuỳ
thuộc vào những người tham dự thông báo một cách trung thực và chính xác về các
thái độ và tính cách của họ. Không phải lúc nào điều đó cũng xảy ra. Chẳng hạn
một số người được hỏi có thể cố ý trả lời các câu hỏi một cách thiếu chính xác
hoặc không nghiêm túc. Tuy nhiên nếu cuộc khảo sát được tiến hành bằng một thái
độ chuyên nghiệp thì điều đó sẽ ít xảy ra hơn so với bạn tưởng. Một điều còn
đáng bận tâm hơn rất nhiều là các chủ đề có thể làm cho người ta mắc lỗi bỏ
quên, lẫn lộn, hoặc ký ức giả.
3.
Các nghiên cứu khảo sát thường có tính khuynh hướng rất rõ. Chẳng hạn vì những
người trả lời biết rất rõ là họ đang là đối tượng nghiên cứu thì tối thiểu họ
cũng có một suy nghĩ là tại sao họ lại là đối tượng khảo sát, và họ có thể thay
đổi cách thức trả lời một cách có ý thức hoặc không có ý thức nhằm tự thể hiện
bản thân hoặc tìm cách thích ứng với người đang nghiên cứu mình. Ngoài ra chính
những người nghiên cứu cũng soạn thảo những câu hỏi theo hướng mà họ muốn người
được hỏi trả lời theo cách thức mà họ mong đợi.
4.
Nếu được thực hiện một cách chính xác thì các cuộc khảo sát có thể đại diện một
cách khách quan cho các quan điểm và suy luận của một tập hợp cư dân nào đó.
Tuy nhiên như vậy không có nghĩa là các quan điểm này là chính xác. Mặc dù các
dữ liệu khảo sát có thể được sử dụng để thông tin về việc ra quyết định và xây
dựng chính sách công, nhưng chúng vẫn không thể thay thế được cho sự phân tích
và đánh giá chuyên môn.
5.
Cuối cùng việc tiến hành một cuộc khảo sát khoa học không phải là một hoạt động
tầm thường, đơn giản. Khảo sát khoa học đòi hỏi nghiên cứu và xây dựng kế hoạch
cẩn thận và cần nỗ lực nhiều, có thể mất hàng tuần để thực hiện và phân tích.
Nếu nhóm nghiên cứu của bạn có dưới 7 tuần để thực hiện khảo sát thì bạn cần
phải nỗ lực trả lời các câu hỏi nghiên cứu của bạn bằng cách sử dụng phương
pháp khác. Sự tồn tại của các hạn chế nghiên cứu khảo sát như vậy không có nghĩa
là bạn không nên tiến hành cuộc khảo sát: tất cả các phương pháp luận khoa học
xã hội đều có hàng loạt hạn chế. Tuy nhiên trước khi quyết định tiến hành một
cuộc khảo sát điều quan trọng là phải tìm kiếm những phương pháp khác nhau đã
có và đo lường các phản đối và đồng thuận liên quan đến các mục tiêu dự án của
bạn. Dưới đây là một số phương pháp chủ yếu tiến hành nghiên cứu khảo sát:
1.
Việc quan sát theo chủ nghĩa tự nhiên liên quan đến việc quan sát và ghi chép
một cách hệ thống hành vi tự nhiên đang diễn ra. Vì các đối tượng khảo sát thậm
chỉ còn không biết mình đang được nghiên cứu thì nhà nghiên cứu lại có thể tin
chắc rằng các hành vi ấy là tự nhiên nhưng không được kiểm soát tốt đối với
những gì đang xảy ra. Xem Martin và Bateson [1986].
2.
Việc phân tích nội dung là một kỹ thuật để vạch ra những suy luận từ những hồ
sơ hiện có hoặc các tư liệu (kể cả Hồ sơ Quốc hội đến việc trợ giúp cá nhân
trong các tờ báo) bằng cách hệ thống và không thiên vị. Những thế mạnh này bao
gồm khả năng nghiên cứu các tập hợp lớn và tư liệu xuất hiện tự nhiên theo thời
gian; tuy nhiên nó liên quan đến các khuynh hướng lý giải và nhà nghiên cứu
không thể kiểm soát được sưu tập dữ liệu [Weber 1985].
3.
Các thực nghiệm chính thức về các đối tượng nghiên cứu là con người theo phương
pháp khoa học, bằng cách xác định một cách ngẫu nhiên các đối tượng nghiên cứu
để thay thế cho các điều kiện thực nghiệm tương tự ngoại trừ một biến số nhân
quả. Chúng cho phép xác định các mối quan hệ nhân quả, nhưng thường đạt được điều
này bằng cách hy sinh “giá trị bên ngoài”, có nghĩa là khả năng có thể áp dụng
vào các tình huống đời sống thực. Xem chương [Chapter 4 of Judd et al. (1991)
and Chapters 7 and 8 of Rosnow and Rosenthal (1996)].
4.
Nghiên cứu trường hợp là phân tích sâu về một tổ chức đặc biệt, như một đại
học, một doanh nghiệp, và một cộng đồng. Mặc dù một nghiên cứu trường hợp cho
phép xem xét triệt để một tình huống đặc biệt, những kết quả nghiên cứu như vậy
có thể được khái quát hoá vượt khỏi một trường hợp duy nhất, xem Yin
[1989].
5.
Phân tích dữ liệu thứ cấp là việc tái phân tích về các dữ liệu khảo sát hiện có
được ai đó thu thập vì một mục đích khác. Lợi thế chủ yếu của phương pháp này
là tiết kiệm lớn về thời gian và sức lực nhờ không phải thu thập các dữ liệu mới;
bất tiện đầu tiên của nó là sự thiếu kiểm soát đối với thông tin được thu thập
và không biết thông tin được thu thập như thế nào [Chapter 13 of
Frankfort-Nachmias and Nachmias (1996)].
6.
Khi quan sát tham dự các nhà nghiên cứu bắt đầu tham gia vào cuộc sống hàng
ngày của các đối tượng nghiên cứu và các ghi chép thực địa cụ thể về các kinh
nghiệm và các quan sát của họ. Điều đó cho phép các nhà nghiên cứu cam kết với
việc khai thác kết mở tạo ra tính linh hoạt, tuy nhiên các quan sát đó khó khái
quát hoá thành các tình huống khác và sự hiện diện của các nhà nghiên cứu có
thể làm thay đổi hành vi của mọi người [Emerson 1983].
7.
Các phỏng vấn cá nhân hoặc các cuộc thảo luận nhóm tập trung liên quan đến việc
phỏng vấn trực tiếp những người được lựa chọn vì các mối quan tâm và hiểu biết
của họ chứ không phải là là lựa chọn một cách ngẫu nhiên. Mặc dù chúng tạo điều
kiện cho việc tiếp cận giải thích nhiều hơn, nhưng các kết quả đó không thể
được khái quát hoá vượt khỏi các cá nhân hoặc các nhóm [Survey Research Center
(1983) and Morgan (1988)]. Xem thêm các phương pháp luận khoa học xã hội khác,
[xem Frankfort-Nachmias and Nachmias (1996) and McKenna (1995)].
Lấy mẫu
Mục đích của tất cả các cuộc khảo sát thực sự là tạo điều kiện cho nhà nghiên cứu dự báo một cách chính xác các tính cách đặc trưng hoặc tư duy của một nhóm người đã được xác định trước. Hướng đến kết quả này, đôi khi nó mang ý nghĩa cố gắng khảo sát toàn bộ tập hợp được quan tâm (chẳng hạn khi tập hợp này nhỏ, như một công ty dưới 100 người lao động, hoặc khi nó có ý nghĩa quan trọng vì lý do công bằng đem lại cho mỗi cá nhân cơ hội trả lời với trường hợp đánh giá khoá học của sinh viên). Tuy nhiên đối với đa số các trường hợp việc khảo sát toàn bộ một tập hợp là không thực tế và không cần thiết. Nếu được lựa chọn một cách khôn ngoan thì một mẫu tương đối nhỏ hoặc một tập con của một tập hợp vẫn có thể đạt được các dự báo chính xác, vì vậy việc sử dụng các nguồn lực hạn chế không phải được đem ra tiêu sài một cách hiệu quả nhất bằng cách cố gắng khảo sát mọi người mà bằng cách theo đuổi các mục tiêu khác khi có được một tỷ lệ trả lời cao [Section IV].
Hiện
nay các tổ chức bàu cử chuyên nghiệp có thể dự báo hơn 100 triệu người sẽ bỏ
phiếu như thế nào trong các cuộc bàu cử toàn quốc với biên độ sai số về điểm
chỉ vài phần trăm bằng cách khảo sát dưới 2000 người. Họ có thể làm được điều
đó bằng cách sử dụng các kỹ thuật lấy mẫu phức tạp để đảm bảo rằng những người
tham gia cuộc khảo sát là những người đại diện cao cho các cử tri Mỹ với tư
cách là một tổng thể. Tuy nhiên đối với hầu hết các dự án khảo sát kỹ thuật lấy
mẫu cơ bản là lấy mẫu ngầu nhiên. Mục đích của việc chọn mẫu ngẫu nhiên là để
đảm bảo rằng mỗi thành viên của một nhóm cư dân được lựa chọn đều có cơ hội
ngang nhau trong việc được chọn vào mẫu khảo sát. Để chọn được một mẫu, cần
phải có một danh sách những người có thể được chọn đưa vào mẫu (được gọi là
khung mẫu). Tất cả các danh sách như vậy phải được đánh giá cẩn thận để đảm bảo
rằng chúng chính xác và đầy đủ. Một số nguồn danh sách lại rất có vấn đề: các
danh bạ điện thoại chẳng hạn không thể bao gồm được những người không có điện
thoại hoặc những người có điện thoại nhưng lại không được kê vào bản danh sách,
hoặc có những danh sách lại kê nhiều lần cùng một tên người và những người mới
chuyển đến sau khi danh bạ điện thoại đã được công bố. Và ngay cả những danh
mục hoàn hảo nhất cũng vẫn mắc lỗi hoặc bỏ sót. Chẳng hạn một tập danh mục phân
loại từ Văn phòng Hộ tịch viên có thể là một nguồn dữ liệu tốt về danh sách tên
người dùng cho một cuộc khảo sát của các sinh viên WPI, nhưng chúng lại không
hoàn hảo: các danh sách như vậy, bao gồm các sinh viên chưa tốt nghiệp từ những
trường khác nhau và các học sinh trường trung học.
Khi
có được một danh sách thoả đáng thì việc lấy mẫu mới có thể được lựa chọn một
các ngẫu nhiên thực sự. Điều này có thể đi kèm với hàng loạt cách thức, chẳng
hạn bằng cách tham vấn một bảng số ngẫu nhiên trong một cuốn sách giáo khoa
thống kê, bằng cách lựa chọn từng người trong trong danh sách sau khi đã lựa chọn
một cách ngẫu nhiên một điểm xuất phát, hoặc ngay cả bằng việc rút ra những cái
tên hoàn toàn ngẫu nhiên khi viết một loạt các danh sách đó vào những mẩu giấy
và được sóc kỹ để xáo trộn bằng một cái mũ. Việc lấy được danh sách ngẫu nhiên
bằng cách nào không thành vấn đề, tất cả các mẫu có thể xuyên tạc tập hợp ở một
mức độ nào đó. Mặc dù lỗi lấy mẫu như vậy là không thể tránh khỏi nhưng vẫn có
thể giảm bớt lỗi bằng cách lấy mẫu với kích cỡ đủ lớn. Các nhà nghiên cứu trẻ
thường tìm kiếm một nguyên tắc giản đơn theo kinh nghiệm để quyết định kích cỡ
mẫu. Tuy nhiên không có nguyên tắc kinh nghiệm như vậy: cần phải thừa nhận rằng
một tập mẫu lớn đến độ nào là tuỳ thuộc vào việc nhà nghiên cứu trả lời hai câu
hỏi sau như thế nào:
1.
Lỗi lấy mẫu nhiều đến mức độ nào thì vẫn có thể chấp nhận được?
2.
Các câu trả lời của người tham gia cho những câu hỏi khảo sát quan trọng nhất
khác nhau đến mức độ nào?
Việc
trả lời cho câu hỏi 1) một phần tuỳ thuộc vào các nguồn có sẵn: mỗi khi kích cỡ
mẫu tăng lên thì độ chính xác cũng tăng lên, nhưng kéo theo là nó cũng sẽ làm
tăng chi phí thời gian và tiền bạc cho việc thực hiện dự án. Việc đánh đổi như
vậy giữa độ chính xác và chi phí là không thể tránh khỏi. Câu trả lời cũng tuỳ
thuộc vào các hệ quả đi liền với việc mắc lỗi.
Đối
với một vài dự án có thể đủ để ước lượng đặc trưng của một tập hợp ở mức 10
hoặc 15%; trong một số trường hợp khác khi các chi phí do mắc lỗi cao thì ước
tính trong khoảng 5% hoặc có thể ít hơn. Câu trả lời cho câu hỏi 2) chỉ có thể
được ước tính (nếu sai số tập hợp được biết một cách chính xác thì đã không cần
phải làm khảo sát). Ước tính này có thể có được bằng việc đánh giá tư liệu của
một nghiên cứu tương tự hoặc từ những kết quả của việc thử trước [xem Section
VIII]. Khi các câu hỏi trên đã được giải quyết thì kích cỡ mẫu cần thiết n có
thể được tính bằng công thức sau: n = (SD)2/(SE) 2, trong đó SD là độ lệch
chuẩn (standard deviation) (căn bậc hai của sai số bình phương trung bình) của
biến số tập hợp và SE là kích cỡ lệch chuẩn có thể chấp nhận (độ lệch chuẩn của
tập hợp toàn bộ các số trung bình mẫu). Vì vậy chẳng hạn khi ta giả định rằng
biến số quan trọng nhất đối với một cuộc khảo sát là điểm SAT và việc đánh giá
tư liệu không phát hiện được rằng độ lệch chuẩn của các điểm SAT (SAT scores) ở
cấp quốc gia là 150. Gỉa sử tiếp là các nhà nghiên cứu muốn là 95% đáng tin cậy
thì họ sẽ có thể ước tính điểm SAT trung bình của nhóm tập hợp mục tiêu trong
khoảng cộng trừ 30 điểm. Cụm từ “95% độ tin cậy” có nghĩa là trung bình mẫu sẽ
rơi vào dãy hai sai số chuẩn 95% lần đưa đến sai chuẩn là 15. Vậy thì kích cỡ
mẫu cần thiết n = (150) 2/(15) 2 = 22,500/225 = 100. Vì vậy cần lưu ý rằng các
kết quả của phương trình này cho ta con số về các cuộc khảo sát hữu ích và hoàn
thiện. Con số này sẽ chỉ điển hình là một phân số của các cuộc khảo sát được
tiến hành.
Để
tính số cuộc khảo sát phải được tiến hành, hãy chia n theo tỷ lệ trả lời mong
muốn của cuộc khảo sát [xem Phần IV]. Cũng cần phải lưu ý rằng trong hầu hết
các dự án khảo sát, người ta mong muốn đạt được các số lượng ước tính đáng tin
cậy cho các phụ nhóm của tập hợp mục tiêu. Trong những trường hợp như vậy, các
công thức trên có thể được sử dụng để tính kích cỡ cần thiết của các phụ nhóm
có thể được bổ sung cùng để đạt được một kích cỡ mẫu tổng thể cần thiết. Chẳng
hạn trong ví dụ mẫu SAT, nếu cấp độ đáng tin cậy tương tự là cần thiết cho
những phụ nhóm sinh viên năm thứ nhất, sinh viên năm thứ hai, các sinh viên năm
thứ ba, sinh viên năm cuối thì kích cỡ mẫu tổng thể cần thiết sẽ là 400 chứ
không chỉ có 100. Trong bất kỳ trường hợp nào thì một mẫu ngẫu nhiên đơn giản
vẫn là chưa đủ. Chẳng hạn hãy tưởng tượng một dự án được thiết kế để so sánh
các điểm SAT của những người nam và những người nữ ở WPI. Một mẫu ngẫu nhiên đơn
gồm 200 sinh viên sẽ gồm có 160 nam và 40 nữ - quá ít nữ để có thể rút ra kết
luận với một mức độ đáng tin cậy cao. Trong những trường hợp chẳng hạn như khi
một phụ nhóm quan trọng của một tập hợp tương đối hiếm, thì đó phải là mẫu quá
lớn, có nghĩa là được lựa chọn ở tỷ lệ cao hơn nhiều so với nó xuất hiện trong
tập hợp. Vì vậy nếu việc so sánh giữa nam và nữ là một mục tiêu quan trọng thì
sẽ có ý nghĩa hơn nhiều khi rút ra một mẫu bao gồm 100 nữ và 100 nam. Có thể
vẫn có được các con số ước tính tập hợp tổng thể bằng cách tạo thêm sức nặng
cho các kết quả đạt được từ mỗi phụ nhóm theo mức độ thịnh hành thực sự của nó
trong tập hợp; trong mẫu hiện tại, điểm SAT trung bình cho nam được nhân lên 8
và cho nữ được nhân lên 2 trước khi cộng chúng lại với nhau. Thông tin thêm xin
xem Chương 5 Salant and Dillman (1994); Henry (1990); and Chapter 8 of
Frankfort-Nachmias and Nachmias (1996).
Các tỷ lệ trả lời
Việc
lựa chọn một mẫu đầy đủ không thiên vị là một cấu phần quan trọng của bất cứ
cuộc khảo sát khoa học nào, nhưng vẫn không đủ để đảm bảo rằng những người trả
lời là đại diện của tập hợp lớn hơn mà các mẫu được lựa chọn ra từ đó. Việc có
được một tỷ lệ trả lời cao cũng rất quan trọng. Tỷ lệ trả lời của một cuộc khảo
sát đơn giản là một con số các cuộc khảo sát hữu ích và không thiên vị được
chia ra theo số người được yêu cầu hoàn thiện cuộc khảo sát. Nếu bộ phận này
quá thấp thì có thể rơi vào tình trạng “lỗi không trả lời”, có nghĩa là các con
số ước tính là thiên vị vì những người không trả lời khảo sát có những đặc
trưng khác hoặc quan điểm khác với những người trả lời.
Để
minh hoạ cho hiệu ứng thiên vị tiềm tàng của một tỷ lệ trả lời thấp, giả sử là
500 phiếu khảo sát được gửi đến các sinh viên được lựa chọn WPI ngẫu nhiên bằng
cách hỏi về hai phương án bố trí dịch vụ ăn uống mà họ ưa thích. Gỉa sử thêm là
150 sinh viên (30%) trả lời và 98 sinh viên chọn phương án A còn 52 sinh viên
chọn cách B. Vậy thì rõ ràng đa số 65% sinh viên thích phương án A. Tuy nhiên
phép phân tích đơn giản này giả định rằng trong thực tế không có người tham gia
trả lời nào lại chỉ có cùng một quan điểm. Điều gì sẽ xuất hiện nếu chẳng hạn
350 người không trả lời chỉ có một sở thích lớt phớt 55% so với 45% đối với
phương án B?. Tỷ lệ đích thực thích phương án A trong trường hợp này sẽ chỉ là
0.3 x 65% + 0.7 x 45% = 51%, khác biệt không đáng kể với 50%. Điều gì sẽ xảy ra
nếu thay vì 350 không trả lời lại có một sở thích mạnh chẳng hạn 70% so với 30%
đối với phương án B? Trong trường hợp này tỷ lệ thực sự thích phương án A có lẽ
chỉ 0.3 x 65% + 0.7 x 30% = 40.5. Theo kịch bản này thì các kết quả đạt được từ
150 người trả lời hoàn toàn xuyên tạc sở thích của toàn bộ số sinh viên! Tất
nhiên một tỷ lệ trả lời thấp đối với một cuộc khảo sát không đảm bảo rằng các
kết quả sẽ là thiên vị. Trong việc khảo sát dịch vụ ăn uống giả định chẳng hạn
hoàn toàn có thể xảy ra trường hợp không người trả lời nào có cùng sở thích
(65% thích phương án A) như họ đã trả lời.
Vấn
đề rất đơn giản là không có một cách hiểu nào để đảm bảo điều mà những người
không trả lời thích hay họ đang nghĩ như thế nào. Chỉ có một cách giảm thiểu
mức độ không chắc chắn này là phải có được một tỷ lệ trả lời cao ngay từ vị trí
đầu tiên. Chẳng hạn giả sử là cuộc khảo sát về dịch vụ ăn uống cho thấy 65%
sinh viên thích phương án A đã đạt được một tỷ lệ trả lời là 70% chứ không phải
30%. Theo kịch bản này thì ngay cả khi những người không trả lời rất không
thích phương án A (chẳng hạn thay vào đó là 70% thích phương án B) thì phương
án A như cuộc khảo sát cho thấy sẽ vẫn là sở thích của toàn bộ số sinh viên:
0.7 x 65% + 0.3 x 30% = 54.5%. Việc đạt
được một tỷ lệ trả lời cao đối với cuộc khảo sát đòi hỏi cần phải đầu tư thời
gian và nỗ lực lớn. Chỉ bằng gửi câu hỏi qua bưu điện hoặc gọi điện thoại đến
những người trả lời tiềm năng là hoàn toàn chưa đủ là chắn chắn là kết quả chỉ
đạt được tỷ lệ 20% hoặc thấp hơn. Điều đó xảy ra không phải là do hầu hết mọi
người không quan tâm hoặc không muốn giúp đỡ, mà chỉ đơn giản là vì họ bận và
có rất nhiều mối bận tâm khác quan trọng hơn lôi kéo quỹ thời gian của mình. Vì
vậy một số cuộc khảo sát bằng bưu điện không nên thực hiện vì chúng thường lẫn
lộn với hàng đống thư từ khác và thường bị vứt bỏ. Còn việc phỏng vấn bằng điện
thoại nếu họ không biểu hiện bận bịu hoặc có trả lời máy thì hầu hết người ta
thường từ chối nói chuyện vì họ có bạn bè hoặc đang ăn uống, hoặc đang sắp ra
khỏi nhà, hoặc phải chăm con.
Có
hai việc mà nhà nghiên cứu có thể thực hiện để tăng cơ hội được trả lời: 1)
thiết kế một bảng hỏi (và kèm theo là một thứ vật chất nào đó) hoặc giới thiệu
qua điện thoại để làm rõ là cuộc khảo sát vừa quan trọng lại vừa dễ thực hiện
[xem Phần VII]; 2) thiết kế một kế hoạch thực hiện bao gồm cả rất nhiều phiếu
gửi qua bưu điện và cả bằng gọi điện thoại nếu cần thiết để trực tiếp hướng dẫn
mỗi người trả lời tiềm năng [xem Phần IX]. Nếu sử dụng được các kỹ thuật này
thì tỷ lệ trả lời là 60-70% hoặc có thể cao hơn. Tuy nhiên trong một số trường
hợp mặc dù người nghiên cứu đã rất nỗ lực, nhưng cuối cùng tỷ lệ trả lời vẫn
chỉ đạt dưới 60%. Trong những trường hợp như vậy người nghiên cứu cần cố gắng
xác định đến mức tối đa xem những người không trả lời giống nhau hoặc khác nhau
như thế nào với những người trả lời dựa trên các biến tương quan. Đôi khi điều
đó lại có thể được thực hiện bằng nguồn thông tin có sẵn, chẳng hạn trong hầu
hết các trường hợp thì lại biết được vị trí địa lý và giới của người không trả
lời, và các danh mục mẫu tình cờ lại chứa đựng những biến khác có thể dùng để
so sánh được. Cũng có thể việc lựa chọn ngẫu nhiên cả bằng điện thoại mà một
mẫu nhỏ những người không trả lời và cần nỗ lực khiến họ trả lời tối thiểu là
một đôi câu hỏi để giúp so sánh với người trả lời. Thậm chí những người từ chối
tham gia ngay từ đầu vẫn thường đồng ý một cuộc phỏng vấn chỉ mất khoảng một,
hai phút. Để có được thông tin thêm về các tỷ lệ trả lời xin xem Chương 2 của
Salant & Dillman (1994) và Chương 2 của Groves (1989).
___________________________________________
Nguồn: James K. Doyle 2006. Introduction to Survey Methodology and Design, Chapter 10 from the book Handbook for Interactive Qualifying Project [IQP] Advisors and Students, prepared by Douglas W. Woods, Professor Emeritus.
Tác giả: James K. Doyle, Phó
GS, Trưởng khoa Khoa học Xã hội và Nghiên cứu Chính sách, Viện Bách khoa Worcester,
Anh quốc. Ông là nhà tâm lý học, chuyên nghiên cứu về các vấn đề môi trường, xã
hội và các mô hình tâm lý về các hệ thống phức tạp giúp cho quá trình ra các
quyết định. Ông cũng chuyên về tâm lý học nhận thức và việc ứng dụng tâm lý học
nhận thức vào cải thiện các kỹ năng nhận thức và giải quyết các vấn đề môi trường.
Ngoài ra các công trình nghiên cứu về phương pháp luận nghiên cứu, hệ thống
phương pháp khảo sát khoa học cũng là những đóng góp lớn của Doyle.
Tài liệu dẫn
Agresti, A. 1997. Statistical Methods for the Social Sciences,
3rd. ed. Upper Saddle River, NJ: Prentice-Hall.
American Psychological Association 1982. Ethical Principles in the Conduct of Research with Human Participants. Washington, D.C.: American Psychological Association.
Clayton, P., Applebee, A., and Pascoe, C. 1996. Email surveys: Old problems with a new delivery medium. LASIE: Information Bulletin of the Library Automated Systems Information Exchange, 27(2), 30-39.
Dillman, D. A. 1978. Mail and Telephone Surveys: The Total Design
Method. New York: Wiley.
Emerson, R. B. 1983. Contemporary Field Research. Boston:
Little, Brown.
Fowler, F. J., Jr. 1995. Improving Survey Questions: Design and
Evaluation. Thousand Oaks, CA: Sage Publications.
Frankfort-Nachmias, C., and Nachmias, D. 1996. Research Methods in the Social Sciences, 5th ed. London: Edward Arnold.
Groves, R. M. 1989. Survey Errors and Survey Costs. New
York: Wiley.
Henry, G. T. 1990. Practical Sampling. Newbury Park, CA:
Sage.
Judd, C. M., Smith, E. R., and Kidder, L. H. 1991. Research Methods in Social Relations, 6th ed. Fort Worth, TX: Holt, Rinehart, and Winston.
Labaw, P. J., 1980. Advanced Questionnaire Design. Cambridge, MA: Abt Books.
Martin, P., and Bateson, P. 1986. Measuring Behavior: An Introductory Guide.
Cambridge: Cambridge Univ. Press.
McCall, R. B. 1998. Fundamental Statistics for the Behavioral
Sciences, 7th ed. Pacific Grove, CA: Brooks/Cole.
McGrath, R. E. 1997. Understanding Statistics: A Research
Perspective. New York: Longman.
McKenna, R. J. 1995. The Undergraduate Researcher's Handbook:
Creative Experimentation in Social Psychology. Boston: Allyn and Bacon.
Morgan, D. L. 1988. Focus Groups as Qualitative Research. Newbury Park, CA: Sage Publications.
Rosnow, R. L., and Rosenthal, R. 1996.
Beginning Behavioral Research: A
Conceptual Primer, 2nd ed. Englewood Cliffs, NJ: Prentice-Hall.
Salant, P. A., and Dillman, D. A. 1994.
How to Conduct Your Own Survey. New
York: Wiley.
Shavelson, R. J. 1996. Statistical Reasoning for the Behavioral
Sciences, 3rd ed. Boston, MA: Allyn and Bacon.
Survey Research Center 1983. General Interviewing Techniques: A Self-Instructional
Workbook for Telephone and Personal Interviewer Training. University of
Michigan, Ann Arbor: Survey Research Center.
Weber, R. P. 1985. Basic Content Analysis. Beverly Hills, CA: Sage.
Yin, R. K. 1989. Case Study Research: Design and Methods.
Newbury Park, CA: Sage Publications.
Không có nhận xét nào:
Đăng nhận xét