Ý nghĩa của sự khác biệt giữa các phương tiện

Sau khi đọc bài viết này, bạn sẽ tìm hiểu về tầm quan trọng của sự khác biệt giữa các phương tiện.

Giả sử chúng tôi muốn kiểm tra xem các bé trai 12 tuổi và bé gái 12 tuổi của Trường Công có khác nhau về khả năng cơ học hay không. Vì dân số của những bé trai và bé gái như vậy quá lớn, chúng tôi lấy một mẫu ngẫu nhiên của những bé trai và bé gái như vậy, quản lý một bài kiểm tra và tính toán riêng phương tiện của bé trai và bé gái.

Giả sử điểm trung bình của những bé trai như vậy là 50 và của những bé gái đó là 45. Chúng tôi đánh dấu sự khác biệt 5 điểm giữa phương tiện của bé trai và bé gái. Có thể có một sự khác biệt như vậy có thể phát sinh do biến động lấy mẫu.

Nếu chúng ta vẽ hai mẫu khác, một mẫu từ dân số bé trai 12 tuổi và mẫu khác từ dân số bé gái 12 tuổi, chúng ta sẽ thấy một số khác biệt giữa các phương tiện nếu chúng ta cứ lặp đi lặp lại trong một số lượng lớn thời gian trong việc vẽ mẫu Các bé trai 12 tuổi và các bé gái 12 tuổi chúng ta sẽ thấy rằng sự khác biệt giữa hai bộ phương tiện sẽ khác nhau.

Đôi khi sự khác biệt này sẽ là tích cực, đôi khi tiêu cực và đôi khi bằng không. Phân phối của những khác biệt này sẽ tạo thành một phân phối bình thường xung quanh sự khác biệt bằng không. SD của phân phối này được gọi là lỗi Tiêu chuẩn về sự khác biệt giữa các phương tiện.

Đối với biểu tượng sau đây được sử dụng:

SEM 1 - M 2 hoặc SE D hoặc σ DM

Hai tình huống phát sinh liên quan đến sự khác biệt giữa các trung bình:

(a) Những người có nghĩa là không tương quan / độc lập và

(b) Những người trong đó phương tiện có tương quan.

(a) SE của sự khác biệt giữa hai phương tiện độc lập:

Phương tiện không tương quan hoặc độc lập khi được tính toán từ các mẫu khác nhau hoặc từ các xét nghiệm không tương quan được quản lý cho cùng một mẫu.

Trong trường hợp như vậy, hai tình huống có thể phát sinh:

(i) Khi phương tiện không tương thích hoặc độc lập và mẫu lớn, và

(ii) Khi phương tiện không tương thích hoặc độc lập và mẫu nhỏ.

(i) SE của chênh lệch (SE D ) khi phương tiện không tương thích hoặc độc lập và mẫu lớn:

Trong tình huống này, SE D có thể được tính bằng cách sử dụng công thức:

Trong đó SE D = Lỗi tiêu chuẩn của sự khác biệt của phương tiện

SEm 1 = Sai số chuẩn của giá trị trung bình của mẫu đầu tiên

SEm 2 = Sai số chuẩn của giá trị trung bình của mẫu thứ hai

Ví dụ 1:

Hai nhóm, một nhóm gồm 114 nam và nhóm còn lại gồm 175 nữ. Điểm trung bình của nam và nữ trong bài kiểm tra xây dựng từ lần lượt là 19, 7 và 21, 0 và SD của hai nhóm này lần lượt là 6, 08 và 4, 89. Kiểm tra xem sự khác biệt quan sát được của 1, 3 đối với phụ nữ có ý nghĩa ở mức 0, 05 và ở mức 0, 01 hay không.

Dung dịch:

Đây là một thử nghiệm hai đuôi → Vì hướng không rõ ràng.

Để kiểm tra tầm quan trọng của sự khác biệt thu được giữa hai mẫu có nghĩa là chúng ta có thể tiến hành qua các bước sau:

Bước 1:

Trong bước đầu tiên, chúng ta phải làm rõ liệu chúng ta sẽ thực hiện thử nghiệm hai đuôi hay thử nghiệm một đuôi. Ở đây chúng tôi muốn kiểm tra xem sự khác biệt là đáng kể. Vì vậy, nó là một thử nghiệm hai đuôi.

Bước 2:

Chúng tôi đặt ra một giả thuyết không có giá trị (H 0 ) rằng không có sự khác biệt giữa phương tiện dân số của nam và nữ trong việc xây dựng từ. Chúng tôi giả sử sự khác biệt giữa các phương tiện dân số của hai nhóm bằng không, tức là H o : D = 0.

Bước 3:

Sau đó, chúng tôi phải quyết định mức độ quan trọng của bài kiểm tra. Trong ví dụ của chúng tôi, chúng tôi sẽ kiểm tra sự khác biệt ở mức ý nghĩa 0, 05 và 0, 01.

Bước 4:

Trong bước này, chúng ta phải tính toán Lỗi tiêu chuẩn về chênh lệch giữa các phương tiện tức là SE D.

Như ví dụ của chúng tôi là phương tiện không tương quan và các mẫu lớn, chúng tôi phải áp dụng công thức sau để tính SE D :

Bước 5:

Sau khi tính toán giá trị của SE D, chúng ta phải biểu thị sự khác biệt của phương tiện mẫu theo thuật ngữ SE D. Như ví dụ của chúng tôi là dễ dàng cho các mẫu lớn, chúng tôi sẽ phải tính Z ở đâu,

Bước 6:

Với tham chiếu đến bản chất của thử nghiệm trong ví dụ của chúng tôi, chúng tôi phải tìm ra giá trị tới hạn cho Z từ Bảng A ở cả 0, 05 và ở mức 0, 01 mức ý nghĩa.

Từ Bảng A, Z.05 = 1.96 và Z.01 = 2.58. (Điều này có nghĩa là giá trị của Z có ý nghĩa ở mức 0, 05 trở xuống phải là 1, 96 trở lên).

Bây giờ 1, 91 <1, 96, sự khác biệt được đánh dấu là không đáng kể ở mức 0, 05 (tức là H 0 được chấp nhận).

Diễn dịch:

Vì mẫu lớn, chúng tôi có thể giả sử phân phối Z bình thường. Z thu được chỉ không đạt được mức ý nghĩa 0, 05, đối với các mẫu lớn là 1, 96.

Do đó, chúng tôi sẽ không bác bỏ giả thuyết khống và chúng tôi sẽ nói rằng sự khác biệt thu được là không đáng kể. Thực tế có thể có một số khác biệt, nhưng chúng tôi không có đủ sự đảm bảo về nó.

Một kết luận thực tế hơn là chúng ta không có đủ bằng chứng về bất kỳ sự khác biệt giới tính nào trong khả năng xây dựng từ ngữ, ít nhất là trong loại dân số được lấy mẫu.

Ví dụ 2:

Dữ liệu về hiệu suất của bé trai và bé gái được đưa ra như sau:

Kiểm tra xem các chàng trai hay cô gái hoạt động tốt hơn và liệu sự khác biệt của 1.0 so với các chàng trai có đáng kể ở mức 0, 05 hay không. Nếu chúng tôi chấp nhận sự khác biệt là đáng kể thì lỗi Loại 1 sẽ là gì.

Dung dịch:

1, 85 <1, 96 (Z .05 = 1, 96). Do đó, H 0 được chấp nhận và sự khác biệt rõ rệt của 1.0 đối với các bé trai không đáng kể ở mức 0, 05.

Nếu chúng tôi chấp nhận sự khác biệt là đáng kể, chúng tôi cam kết lỗi Loại 1. Bằng cách đọc Bảng A, chúng tôi thấy rằng ± 1, 85 Z bao gồm 93, 56% trường hợp. Do đó chấp nhận sự khác biệt được đánh dấu là có ý nghĩa, chúng tôi sai 6, 44% (100 - 93, 56) nên lỗi Loại 1 là 0644.

Ví dụ 3:

Lớp A được dạy trong một cơ sở huấn luyện chuyên sâu trong khi Lớp B trong một lớp dạy bình thường. Vào cuối năm học, lớp A và B trung bình lần lượt là 48 và 43 với SD 6 và 7, 40.

Kiểm tra xem huấn luyện chuyên sâu có đạt được điểm trung bình cho lớp A. Lớp A tạo thành học sinh 60 và lớp B 80 không.

. . . 4, 42 nhiều hơn Z, 01 hoặc 2, 33. Thế là H o bị từ chối. Sự khác biệt được đánh dấu là có ý nghĩa ở mức 0, 01.

Do đó, chúng tôi kết luận rằng việc huấn luyện chuyên sâu đã lấy được điểm trung bình tốt của Lớp A.

(ii) SE của chênh lệch (SE D ) khi phương tiện không tương thích hoặc độc lập và mẫu nhỏ:

Khi N của hai mẫu độc lập nhỏ, có thể tính SE của chênh lệch của hai phương tiện bằng cách sử dụng hai công thức sau:

Khi điểm số được đưa ra:

trong đó x 1 = X 1 - M 1 (nghĩa là độ lệch của điểm của mẫu đầu tiên so với giá trị trung bình của mẫu đầu tiên).

X 2 = X 2 - M 2 (nghĩa là độ lệch của điểm số của mẫu thứ hai so với giá trị trung bình của chúng)

Khi phương tiện và SD của cả hai mẫu được đưa ra:

Ví dụ 4:

Một bài kiểm tra quan tâm được thực hiện cho 6 nam sinh trong một lớp đào tạo nghề và 10 nam sinh trong một lớp học tiếng Latin. Là sự khác biệt trung bình giữa hai nhóm có ý nghĩa ở mức 0, 05?


Bước vào bảng:

D chúng ta thấy rằng với df = 14, giá trị tới hạn của t ở mức 0, 05 là 2, 14 và ở mức 0, 01 là 2, 98. Giá trị tính toán của 1, 78 nhỏ hơn 2, 14 ở mức 0, 05 có ý nghĩa.

Do đó H 0 được chấp nhận. Chúng tôi kết luận rằng không có sự khác biệt đáng kể giữa điểm số trung bình của Kiểm tra sở thích của hai nhóm nam sinh.

Ví dụ 5:

Một bản kiểm kê tính cách được quản lý tại một trường tư thục cho 8 cậu bé có hồ sơ ứng xử là mẫu mực và 5 cậu bé có hồ sơ rất kém.

Dữ liệu được đưa ra dưới đây:

Là sự khác biệt giữa các nhóm có nghĩa là đáng kể ở mức 0, 05? ở cấp 01?

Bước vào Bảng D, chúng ta thấy rằng với df 11, giá trị tới hạn của t ở mức 0, 05 là 2, 20 và ở mức 0, 01 là 3, 11. Giá trị tính toán của 2, 28 chỉ hơn 2, 20 nhưng nhỏ hơn 3, 11.

Chúng tôi kết luận rằng sự khác biệt giữa các phương tiện nhóm có ý nghĩa ở mức 0, 05 nhưng không đáng kể ở mức 0, 01.

Ví dụ 6:

Trong bài kiểm tra lý luận số học, 11 bé trai mười tuổi và 6 bé gái mười tuổi đã cho điểm sau:

Là sự khác biệt trung bình của 2, 50 có ý nghĩa ở mức 0, 05?

Dung dịch:

Bằng cách áp dụng công thức (43 b).

Bước vào Bảng D, chúng ta thấy rằng với df 15, giá trị tới hạn của t ở mức 0, 05 là 2, 13. Giá trị thu được của 1, 01 nhỏ hơn 2, 13. Do đó, sự khác biệt được đánh dấu là 2, 50 không đáng kể ở mức 0, 05.

(b) SE của sự khác biệt giữa hai phương tiện tương quan:

(i) Phương pháp nhóm đơn:

Chúng tôi đã giải quyết vấn đề xác định xem sự khác biệt giữa hai phương tiện độc lập có đáng kể hay không.

Bây giờ chúng tôi quan tâm đến tầm quan trọng của sự khác biệt giữa các phương tiện tương quan. Phương tiện tương quan được lấy từ cùng một bài kiểm tra được quản lý cho cùng một nhóm trong hai lần.

Giả sử rằng chúng tôi đã thực hiện một bài kiểm tra cho một nhóm trẻ em và sau hai tuần chúng tôi sẽ lặp lại bài kiểm tra. Chúng tôi muốn đo lường hiệu quả của thực hành hoặc đào tạo đặc biệt dựa trên bộ điểm số thứ hai. Để xác định tầm quan trọng của sự khác biệt giữa các phương tiện thu được trong thử nghiệm ban đầu và thử nghiệm cuối cùng.

Chúng ta phải sử dụng công thức:

trong đó σ M1 và σ M2 = SE của thử nghiệm ban đầu và cuối cùng có nghĩa là

r 12 = Hệ số tương quan giữa điểm số được thực hiện trong các bài kiểm tra ban đầu và cuối cùng.

Ví dụ 7:

Vào đầu năm học, điểm trung bình của 81 học sinh sau bài kiểm tra thành tích giáo dục về đọc là 35 với SD là 5.

Vào cuối phiên, điểm trung bình trên một hình thức tương đương của cùng một bài kiểm tra là 38 với SD là 4. Mối tương quan giữa điểm số được thực hiện trong bài kiểm tra ban đầu và bài kiểm tra cuối cùng là 0, 53. Lớp học đã có tiến bộ đáng kể trong việc đọc trong năm chưa?

Chúng tôi có thể lập bảng dữ liệu của chúng tôi như sau:

(Kiểm tra ở mức 0, 01 mức ý nghĩa)

Dung dịch:

Vì chúng tôi chỉ quan tâm đến tiến độ hoặc lợi ích, đây là thử nghiệm một đầu.

Bằng cách áp dụng công thức:

Vì có 81 học sinh, có 81 cặp điểm số và 81 điểm khác biệt, do đó, df trở thành 81 - 1 hoặc 80. Từ Bảng D, t cho 80 df là 2, 38 ở mức 0, 02. (Bảng đưa ra 2, 38 cho thử nghiệm hai đuôi là 0, 01 cho thử nghiệm một đầu).

T thu được của 6, 12 lớn hơn nhiều so với 2, 38. Do đó sự khác biệt là đáng kể. Dường như chắc chắn rằng lớp học đã đạt được tiến bộ đáng kể trong việc đọc trong năm học.

(ii) Phương pháp khác biệt:

Khi các nhóm nhỏ, chúng tôi sử dụng phương pháp khác biệt của nhóm vì mục đích tính toán dễ dàng và nhanh chóng.

Ví dụ 8:

Mười đối tượng được đưa ra 5 thử nghiệm liên tiếp trong một bài kiểm tra ký hiệu chữ số trong đó chỉ có điểm cho các thử nghiệm 1 và 5 được hiển thị. Là mức tăng trung bình từ thử nghiệm ban đầu đến thử nghiệm cuối cùng có ý nghĩa?

Cột của sự khác biệt được tìm thấy từ sự khác biệt giữa các cặp điểm. Sự khác biệt trung bình được tìm thấy là 4 và SD xung quanh giá trị trung bình này (SD D )

Tính SE của chênh lệch trung bình:

Trong đó SE MD = Lỗi tiêu chuẩn của chênh lệch trung bình

SD = Độ lệch chuẩn xung quanh chênh lệch trung bình.

Số t thu được là 5, 26> 2, 82. Giá trị 5, 26 của chúng tôi lớn hơn nhiều, so với mức 0, 01 là 2, 82 và có rất ít nghi ngờ rằng mức tăng từ Thử nghiệm 1 đến Thử nghiệm 5 là rất đáng kể.

(iii) Phương pháp của các nhóm tương đương:

Ghép đôi theo cặp:

Đôi khi chúng ta có thể được yêu cầu so sánh hiệu suất trung bình của hai nhóm tương đương được ghép theo cặp.

Trong phương pháp của các nhóm tương đương, việc khớp được thực hiện ban đầu theo cặp để mỗi người trong nhóm thứ nhất có một trận đấu trong nhóm thứ hai.

Trong những trường hợp như vậy, số người trong cả hai nhóm là như nhau tức là n 1 = n 2 .

Ở đây chúng ta có thể tính SE D bằng cách sử dụng công thức:

trong đó SE M1 vàSE M2 = Các lỗi tiêu chuẩn về điểm số cuối cùng của Nhóm Nhóm I và Nhóm II.

r 12 = Hệ số tương quan giữa điểm số cuối cùng của nhóm I và nhóm II.

Ví dụ 9:

Hai nhóm được thành lập trên cơ sở điểm số mà học sinh đạt được trong một bài kiểm tra trí thông minh. Một trong các nhóm (nhóm thử nghiệm) đã được cung cấp một số hướng dẫn bổ sung trong một tháng và nhóm khác (nhóm được kiểm soát) không được cung cấp hướng dẫn đó.

Sau một tháng, cả hai nhóm đều được kiểm tra như nhau và dữ liệu liên quan đến điểm số cuối cùng được đưa ra dưới đây:

Diễn dịch:

Nhập bảng của t (Bảng D) với df 71, giá trị tới hạn của t ở mức 0, 05 trong trường hợp kiểm tra một đầu là 1, 67. T thu được 2, 34> 1, 67. Do đó, sự khác biệt có ý nghĩa ở mức 0, 05.

. . . Giá trị trung bình đã tăng do hướng dẫn bổ sung.

Với df là 71 giá trị tới hạn của t ở mức 0, 01 trong trường hợp thử nghiệm một đuôi là 2, 38. Do đó thu được t là 2, 34 <2, 38. Do đó, sự khác biệt không đáng kể ở mức 0, 01.

Lỗi tiêu chuẩn về sự khác biệt giữa các thống kê khác:

(i) SE về sự khác biệt giữa các trung vị chưa được xử lý:

Tầm quan trọng của sự khác biệt giữa hai trung vị thu được từ các mẫu độc lập có thể được tìm thấy từ công thức:

(ii) SE về sự khác biệt giữa độ lệch chuẩn: