Các vấn đề và thủ tục liên quan đến lựa chọn công việc

Trước khi tiến hành kiểm tra các mô hình lựa chọn cơ bản có sẵn cho nhà tâm lý học, cần phải quan tâm đến bản thân chúng ta bằng một cái nhìn ngắn gọn về mô hình đa dự đoán chung. Mô hình này thường được gọi là mô hình hồi quy bội. Trong mô hình dự đoán chung, chúng tôi phát triển một đường hồi quy để phù hợp với tập hợp các điểm dữ liệu được xác định bởi điểm số của mọi người trên một công cụ dự đoán (trục x hoặc abscissa) và trên tiêu chí ( trục y hoặc tọa độ).

Hình 3.1 cho thấy một tình huống như vậy. Đường hồi quy trong Hình 3.1 là một đường thẳng và được đặt sao cho tổng khoảng cách 'được tính từ mỗi điểm đến đường thẳng (chạy song song với trục y) càng nhỏ càng tốt. Chúng tôi sử dụng một đường thẳng phù hợp nhất vì chúng tôi đã giả định mối quan hệ tuyến tính giữa x và y.

Công thức cơ bản cho một đường thẳng là

y = a + bx

Trong đó y = điểm dự đoán về tiêu chí

a = hằng số chỉ ra điểm tại đó đường hồi quy đi qua trục y

b = độ dốc của đường, được biểu thị bằng ∆y / x hoặc thay đổi trong y quan sát thấy sự thay đổi tương ứng trong x

x = điểm quan sát trên yếu tố dự đoán

Do đó, mô hình đường hồi quy cơ bản xuất hiện như trong Hình 3.2.

Lưu ý rằng trong Hình 3.2, đường hồi quy đi qua trục y với giá trị là 2. Do đó a = 2. Cũng lưu ý rằng với mỗi lần tăng 2 đơn vị trong x, có một mức tăng 1 đơn vị tương ứng trong y. Do đó y / x = 1/2 = 0, 5 = b. Phương trình hồi quy sau đó trở thành

y = 2 + 0, 5x

Với bất kỳ giá trị x nào, chúng ta có một đường hồi quy cho phép chúng ta dự đoán điểm ay, tương ứng với nó. Ví dụ: nếu x là 8, thì

y = 2 + 0, 5 (8)

= 2 + 4

= 6

Tóm lại: Trong trường hợp dự đoán duy nhất, người ta tính một đường thẳng phù hợp nhất với các điểm được quan sát, trong đó thuật ngữ phù hợp nhất với độ cứng có nghĩa là tổng độ lệch bình phương của các giá trị quan sát xung quanh đường thẳng sẽ là tối thiểu.

Các công thức cần thiết để tính các hằng số a và b xác định đường thẳng phù hợp nhất này được gọi là các công thức bình phương nhỏ nhất và như sau:

Công thức cho b là tỷ lệ hiệp phương sai giữa yếu tố dự đoán và tiêu chí và tổng biến thiên của yếu tố dự đoán. Khi phương sai tiêu chí và phương sai dự đoán bằng nhau, thì b = r hoặc độ dốc của đường hồi quy bằng hệ số tương quan.

Hai dự đoán:

Thật hợp lý khi cho rằng nếu dự đoán X 1 có thể góp phần dự đoán thành công điểm số tiêu chí và nếu dự đoán X 2 cũng có thể góp phần dự đoán thành công điểm số tiêu chí, thì sử dụng cả hai yếu tố dự đoán cùng nhau sẽ cho phép dự đoán tổng thể tốt hơn so với sử dụng dự đoán cá nhân. Tuy nhiên, mức độ mà hai yếu tố dự đoán (khi kết hợp) sẽ cải thiện khả năng dự đoán phụ thuộc vào một số yếu tố, trong đó quan trọng nhất là mối tương quan giữa chính hai yếu tố dự đoán.

Ví dụ, xem xét tình huống trong đó hai yếu tố dự đoán tương quan với nhau theo một tiêu chí nhưng không tương quan với nhau, như sau:

Rõ ràng, rất nhiều phương sai tiêu chí bổ sung có thể được giải thích bằng cách sử dụng yếu tố dự đoán 2 cùng với yếu tố dự đoán 1. Mối quan hệ kết hợp giữa hai hoặc nhiều yếu tố dự đoán và một tiêu chí được gọi là tương quan nhiều và có ký hiệu R. Như trường hợp với r 2, giá trị của Rỏ thể hiện tổng số phương sai của tiêu chí có thể được giải thích bằng cách sử dụng một số yếu tố dự đoán. Khi các yếu tố dự đoán 1 và 2 không tương quan với nhau, hệ số tương quan nhiều bình phương có thể được hiển thị là một hàm cộng của các hệ số tương quan bình phương riêng lẻ, hoặc

R 2 c . 12 = r 2 1c + r 2 2c (3.1)

Do đó, khi (tương quan giữa các yếu tố dự đoán) bằng 0, thì hiệu lực bội bình phương là tổng của các giá trị riêng lẻ bình phương.

Khi hai yếu tố dự đoán tương quan với nhau, mọi thứ trở nên phức tạp hơn. Xem xét một tình huống (như trong sơ đồ sau) trong đó mỗi dự đoán có hiệu lực cá nhân đáng kể nhưng trong đó r 12 cũng khá lớn.

Do mối tương quan giữa các yếu tố dự đoán này, sơ đồ cho thấy mức độ chồng chéo giữa yếu tố dự báo 2 và tiêu chí có thể được chia thành hai phần: khu vực đó duy nhất cho khu vực dự báo 2 và khu vực đó được chia sẻ với người dự đoán 1. Do đó, việc sử dụng một yếu tố dự báo thứ hai trong tình huống này cho phép chúng ta tính toán phương sai tiêu chí nhiều hơn so với chỉ sử dụng công cụ dự báo 1, nhưng tất cả các phương sai tiêu chí được dự đoán bởi 2 không phải là phương sai mới. Do đó, một quy tắc chung có thể được nêu liên quan đến nhiều yếu tố dự đoán.

Tất cả những thứ khác đều bằng nhau, mối tương quan giữa các yếu tố dự đoán càng cao, dự đoán tổng thể sẽ càng ít được cải thiện bằng cách sử dụng cả hai yếu tố dự đoán cùng nhau. Tất nhiên, trường hợp cực đoan sẽ là tình huống mà các yếu tố dự đoán có mối tương quan hoàn hảo và chúng ta sẽ không có phương sai tiêu chí bổ sung nào được tính bằng cách thêm yếu tố dự đoán 2 vào pin lựa chọn của chúng ta.

Trong trường hợp hai yếu tố dự đoán tương quan với nhau, chúng ta có thể biểu thị R 2 như là một hàm của các giá trị riêng biệt và kích thước của mối tương quan giữa các yếu tố dự đoán với công thức 2

R 2 c . 12 = r 2 1c + r 2 2c - 2r 12 r 1c r 2c / 1 - r 2 12 (3.2)

lưu ý rằng nếu r 12 = 0, thì công thức 3.2 giảm xuống

R 2 c . 12 = r 2 1c + r 2 2c

đó là công thức 3.1.

Một minh họa rõ ràng hơn về ảnh hưởng của mối tương quan của yếu tố dự đoán đối với kích thước của các hệ số tương quan có thể được lấy từ Bảng 3.1, trong đó các ví dụ về giá trị R và R 2 được đưa ra cho các cặp dự đoán có giá trị 0, 30, 0, 50 và 0, 70 trong các điều kiện giả thuyết là 0, 00, 0, 30 và 0. 60 tương quan lẫn nhau. Hình 3.3 cho thấy xu hướng chung sử dụng dữ liệu được đưa ra trong Bảng 3.1. Đạo đức đối với nhà tâm lý học khá rõ ràng là tránh sử dụng các yếu tố dự đoán có liên quan cao với nhau.

Phương trình dự đoán:

Phương trình dự đoán trong tình huống hai dự báo là một phần mở rộng của mô hình dự báo một. Dạng tổng quát của phương trình là

y = a + b 1 x 1 + b 2 x 2 (3.3)

Đây là phương trình cho một mặt phẳng thay vì một đường thẳng. Đối với người đọc quen thuộc với hình học, Hình 3.4 trình bày bản vẽ ba chiều về mối quan hệ giữa các biến x 1, x 2 và y tương ứng với phương trình 3.3. Các công thức có sẵn cho phép tính toán các hằng số a, b và sẽ dẫn đến mặt phẳng hồi quy phù hợp nhất. Khi các hằng số này đã được xác định, phương trình kết quả có thể được sử dụng để đưa ra dự đoán hiệu suất tiêu chí của những người xin việc mới, cho điểm của họ trên các yếu tố dự đoán riêng biệt.

Để minh họa, giả sử dữ liệu có sẵn trên 100 người đàn ông được tuyển dụng cho công việc X trong một tháng cụ thể bao gồm điểm số trong hai bài kiểm tra cũng như dữ liệu tiêu chí sau khoảng thời gian sáu tháng. Những dữ liệu này có thể được phân tích để xác định các giá trị cho a, b 1 và bi mô tả đúng nhất các mối quan hệ giữa các biến.

Giả sử phương trình sau là kết quả cuối cùng:

y = 2 + 0, 5x 1 + 0, 9x 2 (3, 4)

Phương trình này nói rằng điểm số tiêu chí có khả năng nhất cho bất kỳ thuê mới nào sẽ bằng một nửa điểm của anh ta trong bài kiểm tra 1 cộng với chín phần mười điểm của anh ta trong bài kiểm tra 2 cộng với hai. Do đó, nếu một ứng viên mới đạt 20 điểm trong bài kiểm tra 1 và 30 trong bài kiểm tra 2, hiệu suất tiêu chí dự đoán của anh ta vào cuối sáu tháng kể từ thời điểm thuê sẽ là

= 2 + 0, 5 (20) + 0, 9 (30)

= 2 -t-10 + 27

= 39

Việc mở rộng mô hình hai yếu tố dự báo sang mô hình k dự đoán, trong đó k là một số lượng lớn tiền giả tiềm năng thành công trong công việc, về mặt khái niệm không quá khó. Mô hình của chúng tôi mở rộng đến hình thức

y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + cộng + b k x k (3.5)

Tuy nhiên, các quy trình tính toán để giải các giá trị bình phương nhỏ nhất của tất cả các hằng số trong phương trình như vậy trở nên khá phức tạp trừ khi người ta có sẵn phương tiện máy tính. Người đọc cũng nên nhớ rằng trong tất cả các cuộc thảo luận trước đó, đã có ẩn ý, ​​giả định về một thế giới tuyến tính, tức là tất cả các mối quan hệ giữa các cặp biến là tuyến tính. Có thể sửa đổi mô hình hồi quy bội để tránh giả định này, nhưng điều đó nằm ngoài phạm vi của cuốn sách này.

Người điều hành:

Một trong những khái niệm quan trọng hơn trong lý thuyết lựa chọn và vị trí là khái niệm về biến điều hành. Đôi khi được gọi là biến kiểm soát dân số, biến điều hành có thể được xem là bất kỳ biến nào, khi được thay đổi một cách có hệ thống, có ảnh hưởng đến mức độ quan hệ giữa hai hoặc nhiều biến khác.

Có lẽ một ví dụ giả thuyết (Hình 3.15) về cách thức hoạt động của người điều hành sẽ phục vụ để minh họa ảnh hưởng của nó đối với quá trình lựa chọn. Biểu đồ phân tán trên cùng minh họa giá trị chung là 0, 5 giữa yếu tố dự đoán và tiêu chí. Tuy nhiên, dân số Hồi giáo được đại diện trong cốt truyện phân tán là một nhóm bao gồm cả hai giới, viz., Cả nam và nữ được nhóm lại với nhau để xác định tính hợp lệ. Ngay cả một cuộc kiểm tra ngẫu nhiên về âm mưu phân tán hàng đầu cũng chỉ ra (nếu nam và nữ được mã hóa khác nhau như đã được thực hiện ở đây) rằng mô hình điểm số quan sát được đối với nam giới khác với quan sát đối với phụ nữ.

Để có được một bức tranh rõ ràng hơn về chính xác chúng khác nhau như thế nào, hai sơ đồ phân tán thấp hơn trong Hình 3.15 cho thấy mối quan hệ giữa các yếu tố dự đoán - tiêu chí riêng biệt giữa nam và nữ. Bây giờ sự khác biệt là nổi bật. Đối với những người đàn ông, chúng tôi quan sát thấy một mối quan hệ tích cực cao, một mối quan hệ có giá trị 0, 80. Đối với phụ nữ, mặt khác, chúng ta thấy rằng hầu như không có mối quan hệ nào giữa người dự đoán và tiêu chí. Hiệu lực đối với phụ nữ là 0, 05.

Biến điều hành trong ví dụ trên dĩ nhiên là biến giới tính. Mối quan hệ giữa yếu tố dự đoán và tiêu chí bị ảnh hưởng mạnh mẽ bằng cách thay đổi người điều hành. Câu hỏi về sự hợp lệ của công cụ dự đoán của tôi rõ ràng trở nên phức tạp hơn. Những gì ban đầu có vẻ là một hiệu lực đáng nể vừa phải giờ đã biến thành hai hiệu lực khá khác biệt và riêng biệt, một là rất cao và một rất thấp.

Một tên cho các giá trị sau này có thể là giá trị có điều kiện, đó là tính hợp lệ của yếu tố dự đoán cho rằng dân số bao gồm phụ nữ hoặc cho rằng dân số bao gồm nam giới. Một đặc điểm thú vị của các biến điều hành là người điều hành không cần có bất kỳ mối quan hệ trực tiếp nào với biến dự báo hoặc biến tiêu chí (nghĩa là r ym và r im = 0).

Ví dụ về Người điều hành:

Các ví dụ thực tế của người điều hành đã được tìm thấy trong một số cuộc điều tra nghiên cứu. Ví dụ, Vroom (1960) đã tìm thấy các hiệu ứng của người điều hành khá được đánh dấu bằng cách sử dụng mức độ động lực của các nhà quản lý và giám sát viên tuyến đầu làm biến kiểm duyệt. Tất cả những người đàn ông được nghiên cứu là nhân viên trong nhà máy ở Chicago hoặc New York của một công ty dịch vụ giao hàng quốc gia chuyên cung cấp các gói nhỏ và bưu kiện từ bộ phận và các cửa hàng bán lẻ khác đến nhà ở tư nhân. Dữ liệu từ nghiên cứu minh họa rõ nhất cho khái niệm người điều hành được đưa ra trong Bảng 3.4.

Tất cả các giám sát viên được chia thành ba nhóm dựa trên mức độ động lực được đánh giá của họ bằng cách sử dụng tổng hợp của một số chỉ số động lực thu được trong nghiên cứu. Các giá trị cho một bài kiểm tra khả năng suy luận không lời sau đó đã đạt được cho mỗi trong bốn loại xếp hạng giám sát khác nhau của những người đàn ông này.

Điều này đã được thực hiện riêng ở mỗi cấp độ động lực. Như Bảng 3.4 cho thấy, thử nghiệm rõ ràng là một dự đoán khá hợp lệ về mức độ một người đàn ông sẽ được người giám sát của mình đánh giá cao như thế nào nếu chỉ những người đàn ông có động lực cao được xem xét. Nếu chúng ta thay đổi động lực một cách có hệ thống bằng cách chuyển xuống các nhóm chỉ có mức động lực trung bình hoặc thấp, chúng ta sẽ thấy một sự thay đổi có hệ thống tương ứng trong mối quan hệ giữa bài kiểm tra và tiêu chí. Động lực của nhân viên càng thấp, tính hợp lệ của người dự đoán trong thực tế càng ít, tính hợp lệ thậm chí trở nên tiêu cực đối với các nhóm có động lực thấp.

Các ví dụ khác về người điều hành có thể được tìm thấy trong các nghiên cứu của Dunnette và Kirchner (1960) và Ghiselli và các đồng nghiệp của ông (1956, I960). Công việc của Dunnette và Kirchner đã được hướng chủ yếu vào việc xác định người điều hành liên quan đến công việc đang tập hợp mọi người vào các công việc tương tự nhau về trách nhiệm của họ để có được dự đoán tối đa trong mỗi nhóm công việc.

Phương pháp của Ghiselli có thể được gọi là một người điều hành hệ thống điều tiết không biến đổi của người Viking được nhóm lại đơn giản dựa trên mức độ thành công của họ có thể được dự đoán mà không cần tham chiếu trực tiếp đến bất kỳ biến số bên ngoài nào. Fredericksen và Gilbert (I960) cũng đã thực hiện nghiên cứu về người điều hành để xác định mức độ mà hiệu ứng của người điều hành có thể nhất quán theo thời gian. Họ phát hiện ra rằng một người điều hành được xác định trong một nghiên cứu năm 1954 (Fredericksen và Melville, 1954) vẫn đang hoạt động theo dõi I960.

Lý thuyết lựa chọn hiện đại so với truyền thống:

Khái niệm về biến điều hành có lẽ minh họa rõ nhất cho xu hướng modem trong việc lựa chọn và nhấn mạnh vị trí. Theo truyền thống, lựa chọn và xác nhận là những vấn đề được xem là giải quyết tốt nhất bằng cách đơn giản là thiết lập một tiêu chí có vẻ đáng tin cậy và là một công cụ dự đoán có thể dự đoán tốt nhất tiêu chí đó.

Sự nhấn mạnh gần như hoàn toàn khi thiết lập tính hợp lệ cao với rất ít hoặc không có ý nghĩ về việc khám phá nhiều biến bổ sung mà khi thay đổi, có thể thêm hoặc bớt đi từ mối tương quan thu được. Phương châm chung mà tất cả quá thường xuyên dường như tiêu biểu cho phương pháp lựa chọn là khẩu hiệu Ăn Nếu nó hoạt động, hãy sử dụng nó!

Không có câu hỏi, chính sách này chịu trách nhiệm cho sự phát triển khá khác nhau trong tâm lý công nghiệp. Đầu tiên, nó có lẽ đã đóng góp cho mức độ mà các nhà tâm lý học được chấp nhận vào ngành công nghiệp. Quản lý thường được định hướng theo kết quả tích cực như được thể hiện bằng lựa chọn được cải thiện và không quá quan tâm đến cách thức thực hiện.

Tuy nhiên, thật không may, định hướng này cũng có thể chịu trách nhiệm cho thực tế là tính hợp lệ trong dự đoán đã không tăng đáng kể (nếu có) trong suốt 50 năm qua, một bài bình luận khá đáng lo ngại về những nỗ lực của các nhà tâm lý học tham gia vào loại công việc này.

Trong một đánh giá năm 1955 về một số lượng lớn các nghiên cứu về tính hợp lệ, Ghiselli (1955) đã chỉ ra rằng đó thực sự là một sự kiện bất thường để có được hệ số hiệu lực là 0, 5 hoặc tốt hơn. Hình 3.16 trình bày các phân phối tần số được trình bày bởi Ghiselli về các hệ số hiệu lực có độ lớn khác nhau cho các loại công việc khác nhau. Lưu ý rằng chỉ trong phân phối hiệu lực cho nhân viên văn thư sử dụng các bài kiểm tra trí thông minh làm công cụ dự đoán và các biện pháp thành thạo vì các tiêu chí mới có số lượng lớn hiệu lực trên 0, 5.

Sự quan tâm hiện tại đối với người điều hành là đại diện cho một cách tiếp cận rộng hơn và có phần phức tạp hơn đối với lựa chọn. Có thể bắt nguồn từ khi Toops (1948) đưa ra lời kêu gọi các nhà tâm lý học xem xét khả năng bằng cách phân tầng con người (ví dụ, người lao động) một cách có hệ thống theo các biến số cá nhân, người ta có thể cải thiện dự đoán. Phương pháp phân loại của ông, mà ông gọi là thủ tục bổ sung, là tiền thân của người điều hành.

Mô hình lựa chọn của Dunnette:

Có lẽ quan điểm hiện tại về phương pháp lựa chọn có thể được thể hiện tốt nhất bằng mô hình lựa chọn được đề xuất bởi Dunnette (1963). Mô hình này được thể hiện trong sơ đồ trình bày trong Hình 3.17 và được thiết kế để chỉ ra mê cung của sự phức tạp và mối quan hệ tương quan tồn tại trong tình huống lựa chọn. Mô hình có thể được xem nhiều hơn là một nỗ lực chỉ để chỉ ra bản chất năng động của lựa chọn, nó cũng thể hiện một lời biện hộ cho các nhà tâm lý học để tận dụng các động lực này và sử dụng chúng để có lợi nhất để cải thiện khả năng dự đoán.

Có lẽ người ta có thể hiểu quan điểm được đại diện bởi mô hình theo mô tả chính xác được sử dụng bởi Dunnette (1963, trang 318):

Lưu ý rằng mô hình dự đoán được sửa đổi có tính đến các tương tác phức tạp có thể xảy ra giữa các yếu tố dự đoán và các kết hợp dự đoán khác nhau, các nhóm (hoặc loại) khác nhau của các cá nhân, các hành vi khác nhau trong công việc và hậu quả của các hành vi này liên quan đến các mục tiêu của tổ chức . Mô hình cho phép khả năng của các yếu tố dự đoán là hữu ích khác nhau để dự đoán hành vi của các tập hợp con khác nhau của các cá nhân.

Hơn nữa, nó cho thấy các hành vi công việc tương tự có thể được dự đoán bằng các mô hình tương tác khá khác nhau giữa các nhóm người dự đoán và cá nhân hoặc thậm chí cùng một mức độ thực hiện trên các yếu tố dự đoán có thể dẫn đến các mô hình hành vi công việc khác nhau cho các cá nhân khác nhau. Cuối cùng, mô hình nhận ra một thực tế khó chịu rằng các hành vi công việc tương tự hoặc tương tự có thể, sau khi đi qua bộ lọc tình huống, dẫn đến hậu quả tổ chức khá khác nhau.

Xu hướng hiện tại trong lựa chọn được thể hiện bằng nhận thức của người điều hành và theo mô hình lựa chọn của Dunnette sẽ dẫn đến sự tiến bộ trong cả hiệu quả lựa chọn và mức độ hiểu biết về động lực của dự đoán chính xác.

Các biến áp suất:

Không có thảo luận về lựa chọn sẽ được hoàn thành mà không có một số đề cập đến các biến số triệt tiêu. Theo một nghĩa nào đó, một biến số triệt tiêu tương tự như một biến điều hành ở chỗ nó được định nghĩa là một biến có thể có ảnh hưởng đến cường độ của một mối quan hệ tiêu chí dự đoán nhất định mặc dù nó có rất ít hoặc không có mối quan hệ nào với chính biến tiêu chí đó. Giáo dục

Động lực của một biến số triệt tiêu trong dự đoán có thể được hiểu rõ nhất bằng cách xem xét lại khái niệm về một mối tương quan một phần và biện pháp liên quan của nó, mối tương quan bán một phần. Nếu một người có hai yếu tố dự đoán và một tiêu chí tương quan như được trình bày ở đây thì tương quan một phần giữa tiêu chí và yếu tố dự đoán x, đó là r 1c. 2, được định nghĩa là mối tương quan giữa x 1 và C sau khi các hiệu ứng của x 2 đã được tách ra khỏi cả hai, vì vậy

Giả sử chúng ta chỉ muốn loại bỏ các ảnh hưởng của X2 khỏi tiêu chí trước khi tính toán tương quan. Một mối tương quan như vậy được gọi là tương quan bán một phần hoặc một phần. Ví dụ: chúng tôi có thể quan tâm đến mối tương quan giữa điểm kiểm tra trí thông minh (dự đoán x 1 ) và mức độ kỹ năng cuối cùng khi kết thúc chương trình đào tạo đánh máy (tiêu chí) x 2 có thể đại diện cho cấp độ kỹ năng ban đầu của tất cả nhân viên về tốc độ đánh máy của họ trước khi tham gia khóa đào tạo. Vì vậy, chúng tôi muốn loại bỏ ảnh hưởng của cấp độ kỹ năng ban đầu đối với hiệu suất cuối cùng trước khi tính toán tính hợp lệ của bài kiểm tra trí thông minh của chúng tôi.

Mối tương quan bán một phần của chúng tôi bây giờ trở thành:

Cơ chế của một biến số triệt tiêu giống hệt như đã trình bày ở trên, ngoại trừ (1), biến x 2 chỉ có một mối quan hệ nhỏ (nếu có) với tiêu chí và (2) người ta quan tâm đến việc loại bỏ các hiệu ứng của nó khỏi yếu tố dự đoán x 1 .

Do đó, tình hình chung có thể được sơ đồ hóa như sau:

Người ta không thể dự đoán hoàn toàn chắc chắn liệu tương quan một phần hay bán một phần sẽ lớn hơn hay nhỏ hơn tương quan đơn giản hiện có giữa các biến, vì kích thước của cả tử số và mẫu số đều bị ảnh hưởng bởi quá trình chia phần. Lần duy nhất không phải như vậy là khi biến bị tách ra chỉ liên quan đến một trong hai biến khác, như trong trường hợp của bộ triệt. Trong tình huống như vậy, chỉ có mẫu số bị ảnh hưởng sau đó (phương sai được loại bỏ) và kết quả tương quan bán một phần lớn hơn tương quan đơn giản giữa các biến.

Xác thực chéo:

Một đặc điểm của hầu hết các hệ thống lựa chọn dự đoán là trong sự phát triển của chúng, người ta thường có xu hướng tận dụng sự thay đổi cơ hội tồn tại trong mẫu nhân viên đang được sử dụng cho mục đích xác nhận. Điều này đặc biệt đúng với mô hình hồi quy bội nhưng cũng áp dụng cho quy trình cắt nhiều lần. Bởi vì mô hình hồi quy bội có các thuộc tính bình phương nhỏ nhất, nghĩa là chúng tôi cố tình giảm thiểu các lỗi trong việc dự đoán mẫu cụ thể của chúng tôi, nên có thể nếu bây giờ chúng tôi áp dụng phương trình của chúng tôi cho một mẫu mới (từ cùng một quần thể), chúng tôi sẽ không tìm thấy dự đoán của mình hiệu quả như trước.

Do đó, R 2 được tính toán của chúng tôi là sự đánh giá quá cao về tính hợp lệ trong tương lai của hệ thống dự đoán của chúng tôi là gì, vì sử dụng phương trình của chúng tôi cho mục đích dự đoán sẽ tự động áp dụng nó cho các mẫu công nhân mới. Sự sụt giảm dự kiến ​​trong R 2 này được biết đến trong các số liệu thống kê là vấn đề co ngót và có thể được minh họa rõ nhất bằng cách kiểm tra Hình 3.18.

Trong hình 3.18 chúng ta có hai mẫu của các cá nhân. Mỗi đại diện cho một mẫu ngẫu nhiên được rút ra từ hoặc thuộc cùng một quần thể. Ví dụ, mẫu A có thể đại diện cho tất cả những người xin việc cho công việc X trong những tháng được đánh số lẻ và mẫu B có thể đại diện cho tất cả những người xin việc trong những tháng được đánh số chẵn cho một năm cụ thể.

Sẽ rất bất thường, ngay cả với số lượng rất lớn người nộp đơn trong mỗi mẫu, cho hai mẫu giống hệt nhau về mặt phân tán của chúng. Do các biểu đồ phân tán của chúng có thể được dự kiến ​​sẽ thay đổi do lỗi lấy mẫu, nên mối tương quan giữa yếu tố dự đoán và tiêu chí (tính hợp lệ) cũng có thể được dự kiến ​​sẽ thay đổi phần nào, như phương trình hồi quy được tính trên mỗi mẫu.

Giả sử chúng ta đã lấy phương trình hồi quy được tính toán trên mẫu A và sử dụng nó để dự đoán điểm số từ mẫu B. Rõ ràng chúng ta không thể làm tốt việc giảm thiểu sử dụng dòng A với mẫu B vì chúng ta có thể sử dụng dòng hồi quy B. dòng B theo định nghĩa tối thiểu hóa Σd 2 cho mẫu đó. Do đó, bất kỳ dòng nào khác sẽ có một lỗi lớn hơn liên quan đến nó. Do đó R 2 phải được giảm tương ứng.

Có các công thức có sẵn để ước tính mức độ co ngót mà người ta có thể mong đợi khi sử dụng phương trình này trên một mẫu mới. Một công thức như vậy là

R 2 8 = 1 - [(1 - R2) n-1 / n - k - 1]

Ở đâu

R 2 = thu nhỏ nhiều bình phương tương quan

R 2 = nhiều bình phương tương quan thu được từ mẫu xác nhận

n = số người trong mẫu xác nhận

k = số lượng dự đoán trong phương trình hồi quy

Tuy nhiên, tốt nhất là xác nhận chéo phương trình bằng cách lấy mẫu thứ hai và thử nó để xem nó dự đoán tốt như thế nào. Nếu dường như có một giọt rất lớn, người ta có thể muốn sửa lại phương trình (có lẽ bằng cách kết hợp cả hai mẫu trong một nhóm). Độ co lớn thường được tìm thấy khi kích thước mẫu nhỏ và / hoặc số lượng dự đoán lớn so với kích thước mẫu.

Mosier (1951) đã thảo luận về một số loại xác nhận chéo có thể được tiến hành tùy thuộc vào thiết kế của nghiên cứu và liệu người ta có quan tâm đến việc chỉ khái quát hóa cho một mẫu mới hay không nếu muốn phương trình dự đoán phối hợp rộng hơn (ví dụ, đến các giới tính khác nhau, các tiêu chí khác nhau, v.v.). Cái trước được gọi là một trường hợp tổng quát hóa hiệu lực; sau này là một trường hợp gia hạn hợp lệ. Tất nhiên, độ co rút lớn hơn sẽ được dự kiến ​​trong trường hợp sau và công thức 3.9 trên% áp dụng cho các trường hợp tổng quát hóa tính hợp lệ.