Một cách tiếp cận lý thuyết quyết định về dự đoán và tiêu chí của các ngành công nghiệp

Vấn đề lựa chọn có thể được xem xét từ một quan điểm hơi khác so với quan điểm được sử dụng. Cách tiếp cận thứ hai này chứng tỏ thú vị ở chỗ chúng ta sẽ thấy rằng tính hợp lệ của yếu tố dự đoán có thể không phải là một biến số quan trọng trong lựa chọn như quan điểm truyền thống đưa ra. Quan điểm mới của chúng tôi dựa trên mô hình lý thuyết quyết định. Chúng ta nên bắt đầu bằng cách khôi phục mục tiêu trong một tình huống lựa chọn điển hình. Trong nhiều tình huống lựa chọn, chúng tôi muốn thiết lập một số điểm cắt trên dự đoán của chúng tôi, điều này sẽ giúp giảm thiểu các lỗi quyết định của chúng tôi.

Ẩn ý trong loại tình huống này là giả định rằng tỷ lệ lựa chọn có thể được thao tác theo ý muốn; đó là, nó không phải là cố định của cải ở một số giá trị. Cũng ngầm định là khái niệm rằng biến tiêu chí của chúng tôi có thể được phân tách thành hai hoặc nhiều nhóm khác nhau một cách có ý nghĩa như thành công và không thành công. Mục tiêu của chúng tôi là thao túng điểm cắt (giống như thao tác với tỷ lệ lựa chọn) theo thứ tự để giảm thiểu số lỗi xảy ra trong quá trình chúng tôi quyết định liệu một người nên được thuê hay từ chối.

Trước đó chúng tôi đã chỉ ra rằng có hai loại lỗi quyết định riêng biệt trong mô hình lựa chọn, dương tính giả và phủ định sai, như được hiển thị dưới đây:

Mục tiêu của chúng tôi sau đó là tìm ra điểm giới hạn sẽ dẫn đến số lỗi nhỏ nhất. Vì mục đích thuận tiện, chúng tôi sẽ bắt đầu bằng cách giả sử rằng cả hai loại lỗi đều được coi là tốn kém như nhau. Đó là, chúng tôi không có lý do gì để thích tạo ra một lỗi dương tính giả so với một lỗi âm tính giả, hoặc ngược lại. Bằng cách đưa ra giả định này, có thể đưa ra vấn đề trực tiếp theo cách giảm thiểu tổng số lỗi của cả hai loại thay vì phải cân nhắc hai loại lỗi bằng chi phí tương ứng của chúng.

Vị trí của Điểm cắt:

Để minh họa cách tiếp cận vấn đề tìm vị trí tối ưu cho điểm cắt của chúng tôi, hãy xem xét trường hợp chúng tôi có hiệu lực cụ thể (ví dụ: khoảng 0, 70) và một tỷ lệ phần trăm nhân viên hiện tại được coi là thành công (thường được đề cập trong ngữ cảnh này như tỷ lệ cơ sở của NỀN TẢNG).

Điều này có thể được sơ đồ hóa như sau:

Bước tiếp theo là trình bày cùng một dữ liệu ở dạng hơi khác nhau. Đầu tiên, chúng tôi biết rằng tổng số nhóm nhân viên của chúng tôi được giả định là có phân phối bình thường về điểm số dự đoán của họ. Thứ hai, và không kém phần quan trọng, cả hai nhóm con (thành công và không thành công) đều được coi là có phân phối bình thường. Bằng cách nhìn vào ví dụ trên, có thể dễ dàng suy ra rằng điểm dự đoán trung bình của nhóm thành công sẽ cao hơn so với nhóm không thành công.

Chúng tôi có thể sơ đồ này là:

Cả hai bản phân phối sẽ có kích thước bằng nhau vì chúng dựa trên cùng một số người (nghĩa là 50 phần trăm trong mỗi nhóm). Có một mối quan hệ đại số giữa sự khác biệt giữa phương tiện của hai nhóm nhỏ như được xem trong thời trang này và kích thước của hệ số tương quan. Nếu các phương tiện nhóm khác biệt đáng kể với nhau (giả sử ở mức ý nghĩa 0, 05) thì hệ số tương quan cũng sẽ được tìm thấy có ý nghĩa ở cùng cấp.

Đưa sơ đồ của chúng ta tiến thêm một bước, chúng ta có thể đặt hai phân phối tần số của các nhóm con cạnh nhau trên cùng một đường cơ sở, như được hiển thị bên dưới.

Sau khi thực hiện điều này, bây giờ chúng ta có thể quay lại câu hỏi ban đầu của chúng ta, nơi chúng ta xác định vị trí cắt trên bộ dự đoán để tổng số lỗi sẽ được giảm thiểu? Nó chỉ ra rằng giải pháp toán học cho vấn đề này dẫn đến một câu trả lời rất đơn giản: Điểm giới hạn tối thiểu hóa lỗi là điểm tại đó hai phân phối giao nhau.

Điều này có thể dễ dàng được chứng minh ở cấp độ khái niệm bằng cách xem xét ba trường hợp được minh họa dưới đây. Sự khác biệt giống nhau giữa các phương tiện (nghĩa là tương quan giống nhau) được sử dụng trong mỗi trường hợp, tất cả những gì đã được thay đổi là vị trí của điểm giới hạn trên bộ dự đoán.

Trong hình minh họa (a), số lượng dương tính giả (thất bại ở trên mức bị cắt) được đưa ra bởi khu vực B. Số lượng âm tính giả (thành công nằm dưới ngưỡng) được đưa ra bởi khu vực A. Do đó,

Tổng lỗi = A + B

Đối với hình minh họa (b), số lượng dương tính giả được đưa ra bởi B và số lượng âm tính giả được đưa ra bởi A + C. Do đó,

Tổng lỗi = A + B + C

Đối với hình minh họa (c), số lượng dương tính giả được đưa ra bởi B + C và số lượng âm tính giả được đưa ra bởi A. Do đó,

Tổng lỗi = A + B + C

Do việc kiểm tra cả ba hình minh họa nhanh chóng xác nhận rằng khu vực A + B giống nhau cho cả ba trường hợp, nên rõ ràng là lỗi tăng lên một số lượng C bất cứ khi nào điểm cắt được di chuyển ra xa (theo một trong hai hướng) từ điểm tại đó hai phân phối giao nhau.

Một số thay đổi bất thường:

Bây giờ chúng ta có một nguyên tắc chung để định vị điểm cắt sẽ giảm thiểu tổng số lỗi trong một tình huống ra quyết định lựa chọn, cụ thể là, tại điểm giao nhau.

Hóa ra, miễn là cả hai loại lỗi đều được coi là tốn kém như nhau, đây là một quy tắc rất chung chung và không bị ảnh hưởng bởi:

(1) Kích thước tương đối của hai nhóm (nghĩa là phần trăm được coi là thành công) hoặc

(2) Phương sai hoặc phân tán tương ứng của hai bản phân phối.

Điều này dẫn đến một số khía cạnh thú vị và rất quan trọng của vấn đề dự đoán chung liên quan đến mối quan hệ của tính hợp lệ của thử nghiệm với tiện ích thử nghiệm. Rorer, Hoffman, LA Forge và Hsieh (1966) đã chỉ ra ba trường hợp thú vị như vậy.

Trường hợp 1:

Cả phương tiện và phương sai của hai nhóm khác nhau. Giả sử rằng nhóm thành công của chúng tôi có kích thước tương đương với nhóm không thành công và có ý nghĩa cao hơn đáng kể đối với người dự đoán, nhưng phương sai của nó nhỏ hơn nhiều.

Một sơ đồ của một tình huống như sau:

Nguyên tắc thiết lập các điểm giới hạn của chúng tôi nói rằng chúng ta nên đặt chúng ở bất cứ nơi nào hai phân phối giao nhau. Lưu ý rằng điều này xảy ra hai lần trong trường hợp cụ thể này. Vì vậy, chúng ta có một mức cắt trên và mức cắt dưới. Chúng ta chỉ nên chọn những người nằm trong khoảng giữa các điểm giới hạn về điểm kiểm tra của họ. Bất kỳ điểm giới hạn nào khác sẽ dẫn đến tổng lỗi lớn hơn so với các điểm nằm ở các điểm giao nhau.

Trường hợp 2:

Các nhóm có phương tiện bằng nhau nhưng phương sai khác nhau. Trong trường hợp rất thú vị này, hai nhóm không khác nhau về điểm số dự đoán trung bình của họ, nghĩa là, trung bình các nhân viên không thành công cũng làm bài kiểm tra cũng như các nhân viên thành công. Điều này ngụ ý rằng hệ số tương quan bằng không giữa yếu tố dự đoán và tiêu chí. Tuy nhiên, chúng tôi đã tuyên bố thêm rằng hai nhóm khác nhau về sự biến đổi của chúng.

Nếu chúng ta giả sử nhóm thành công là nhóm có độ biến thiên nhỏ hơn cho mục đích giải trình, chúng ta có thể biểu thị sơ đồ này như sau:

Mặc dù hai nhóm có cùng điểm tiêu chí trung bình, có thể phát triển các điểm giới hạn sẽ cải thiện dự đoán về phương pháp hiện đang được hưởng thông qua các phương pháp hiện tại, do hai phân phối giao nhau tại hai điểm do tính biến thiên không đồng đều của chúng. Do đó, chúng ta có một tình huống duy nhất là sẽ không có giá trị rõ ràng (được đo bằng hệ số tương quan) nhưng ở đó dự đoán có thể được cải thiện nhiều bằng cách sử dụng các điểm cắt thích hợp.

Trường hợp 3:

Phương tiện nhóm là khác nhau đáng kể nhưng kích thước nhóm cũng khác nhau rất nhiều. Giả sử chúng ta đang đối phó với một tình huống trong đó tỷ lệ cơ bản của nhân viên không thành công là rất nhỏ, nghĩa là khoảng 90 phần trăm nhân viên hiện tại của chúng ta được coi là thành công. Một tình huống như vậy được thể hiện trong sơ đồ sau.

Ở đây chúng tôi có một tình huống độc đáo khác. Mặc dù nhóm có nghĩa là có thể khác nhau đáng kể do đó có mối tương quan đáng kể giữa tiêu chí và yếu tố dự đoán, nhưng sẽ không thể thiết lập bất kỳ sự cắt giảm nào sẽ dẫn đến giảm lỗi so với những gì hiện có được với các phương pháp hiện tại. Do sự khác biệt về kích thước được đánh dấu giữa hai nhóm, chúng tôi thấy rằng hai bản phân phối không giao nhau tại bất kỳ điểm nào.

Theo hệ thống lựa chọn hiện tại của chúng tôi, chúng tôi chỉ mắc lỗi 10 phần trăm thời gian. Nếu chúng ta di chuyển giới hạn từ trái sang phải trong trường hợp 3 (nó nằm ở cực bên trái để bắt đầu, vì chúng ta hiện đang chọn tất cả những người này), tất nhiên, chúng ta sẽ bắt đầu loại bỏ một số người không thành công hiện đang làm việc theo hệ thống hiện tại.

Tuy nhiên, đồng thời, chúng tôi sẽ bắt đầu từ chối những nhân viên sẽ thành công. Nhìn vào sơ đồ nhanh chóng cho chúng ta biết rằng sự gia tăng âm tính giả này sẽ lớn hơn mức giảm tương ứng của dương tính giả cho dù chúng ta đã cắt đứt ở đâu. Do đó, bất kỳ sự cắt đứt dựa trên thử nghiệm nào cũng sẽ dẫn đến nhiều lỗi hơn chúng ta không có thử nghiệm, mặc dù thử nghiệm có giá trị cao.