F-test
Đây là một case study về ứng dụng f-test, f-statistic
Câu hỏi :
Giá cả quần áo của 3 thương hiệu thời trang Snapzi , Irisa và LoloMoon là “như” nhau hay không ?
Ta có giả thuyết null :
Note. Như vậy giả thuyết null trong one-way ANOVA hay f-statistic thường sẽ là "tất cả chúng nó giống nhau"
Còn giả thuyết thay thế sẽ là có ít nhất 2 "thằng" khác nhau
Đây là dữ liệu thu thập được
Còn giả thuyết thay thế sẽ là có ít nhất 2 "thằng" khác nhau
Đây là dữ liệu thu thập được
Như bài trước chúng ta hoàn toàn có thể dùng t-test để trả lời câu hỏi trên . Tuy nhiên nhược điểm của t-test là chỉ kiểm tra được 2 nhóm , với số nhóm lớn số lần thực hiện t-test sẽ rất lớn , nó sẽ bằng tôt hợp chập 2 của N nhóm. Nên trong trường hợp này chúng ta sẽ sử dụng f-test .
Bước 1 . Tính giá trung bình của từng nhóm , tính giá trung bình của toàn bộ data , từ đó tính SSbetween dựa trên công thức dưới.
SSbetween còn được gọi là Between-Group Variability hay variance of the group means hay Sum of square Between-Group .
Tiếp theo sẽ tính SSwithin theo công thức :
Bước tiếp theo là tính bậc tự do , với df1 bằng số nhóm - 1 = 3-1 =2
Với DF2 sẽ bằng tổng số sample trừ đi số nhóm = 12-3=9
Tiếp theo là tính Mean Squares , bước này đơn giản là lấy SS chua cho DF
Tiếp theo ta có thể tính được f-statistic = Ms1/Ms2 = 15.72
Để có thể kết luận chấp nhận giả thuyết null hay không ta tính f-critical (chọn alpha = 0.05)
Tra bảng f-table (0.05) với df1=2 và df2=9
Ta có :
F-critical = 4.2565
Vậy f-statistic > F-critical-value nên có thể kết luận không chấp nhận giả thuyết null . Điều nài có thể phát biểu rằng , giá của 3 thương hiệu thời trang Snapzi , Irisa và LoloMoon là không giống nhau .