ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN
TRÌNH ĐỘ ĐÀO TẠO: ĐẠI HỌC
LOẠI HÌNH ĐÀO TẠO: CHÍNH QUY
1. TÊN HỌC PHẦN:
Tiếng Việt: PHÂN TÍCH SỐ LIỆU ĐỊNH TÍNH
Tiếng Anh: Categorical Data Analysis
Mã học phần: TOKT1116 .Tổng số tín chỉ: 2
2. BỘ MÔN PHỤ TRÁCH GIẢNG DẠY: Toán Kinh Tế
3. ĐIỀU KIỆN HỌC TRƯỚC: Kinh Tế Lượng 1
4. MÔ TẢ HỌC PHẦN:
Học phần phân tích số liệu định tính sẽ cung cấp cho người học những kỹ thuật phân tích các số liệu dạng thuộc tính trong đó các phương pháp mô tả và suy diễn thống kê đối với loại số liệu này sẽ là nội dung chính của học phần. Đối với số liệu định tính, việc phân tích các bảng ngẫu nhiên, 2 hoặc nhiều chiều sẽ được đề cập chi tiết. Ngoài ra, một số nội dung cơ bản như xây dựng và giải thích các mô hình cho các biến dạng nhị phân, các mô hình logarit tuyến tinh (log-linear) và các dạng mô hình tuyến tính tổng quát khác như mô hình đa biến cho số liệu theo cặp và số liệu theo trình tự thời gian cũng được đề cập. Khóa học này cũng sẽ sử dụng một số phần mềm phân tích số liệu thông dụng, đặc biệt là cho số liệu định tính như SAS và R. Người học cần nắm được các kiến thức cơ bản của mô hình hồi quy tuyến tính bao gồm cả mô hình hồi quy bội có sử dụng phương pháp biến giả để giải quyết các mô hình trong đó có sử dụng các biến độc lập là biến định tính.
5. MỤC TIÊU HỌC PHẦN:
Sau khi kết thúc học phần, người học có thể:
– Xác định được các dạng bảng ngẫu nhiên (2 hoặc nhiều chiều) và các phương pháp thích hợp để đo lường và kiểm định các mối quan hệ giữa 2 hoặc nhiều biến định tính.
– Xây dựng và ước lượng được các mô hình cho các biến giải thích dạng nhị phân (binary), dạng nhiều tỷ lệ (multinomial). Giải thích và thực hiện được các kiểm định về tính phù hợp của mô hình.
– Giải thích và truyền tải được ý nghĩa của các phương pháp phân tích số liệu định tính.
– Hiểu và ứng dụng được các phương pháp phân tích cao cấp cho các dạng số liệu phức tạp (số liệu nhiều mức, lồng ghép…)
6. NỘI DUNG HỌC PHẦN:
PHÂN BỐ THỜI GIAN
STT |
Nội dung |
Tổng số tiết |
Trong đó |
Ghi chú |
|
Lý thuyết |
Bài tập, |
||||
1 |
Chương 1 Chương 2 Chương 3 Chương 4 Chương 5 |
4 |
3 |
1 |
|
Cộng |
30 |
21 |
9 |
CHƯƠNG 1 – GIỚI THIỆU VỀ BIẾN ĐỊNH TÍNH
Trong chương mở đầu này, học phần sẽ giới thiệu cho người đọc khái niệm cơ bản về biến định tính, các phân phối xác suất của biến định tính. Tiếp đó, các suy diễn thống kê trong phân tích biến định tính, cụ thể là các biến nhị phân (binomial) và biến dạng nhiều tỷ lệ (multinomial) sẽ được giới thiệu khái quát. Các bài tập nhận biết và lý thuyết sẽ được trình bày để người học củng có kiến đã học trong chương.
1.1. Số liệu định tính là gì?
1.2. Phân phối xác suất của số liệu định tính.
1.3. Suy diễn thống kê cho số liệu định tính.
1.4. Suy diễn thống kê cho các tham số trong mô hình nhị phân
1.5. Suy diễn thống kê cho các tham số trong mô hình nhiều tỷ lệ
1.6. Các chú ý chính và bài tập thực hành.
Tài liệu tham khảo của chương:
1 – Nguyễn Mạnh Thế, Bài giảng Phân tích số liệu định tính, Chương 1
2 – Alan Agresti, 2002, Categorical Data Analysis, 2nd Edition
3 – Stokes, M. ,Davis, C., Koch, G. ,2001, Categorical Data Analysis Using The SAS System
CHƯƠNG 2 – BẢNG NGẪU NHIÊN VÀ SUY DIỄN THỐNG KÊ
Trong chương này, khái niệm về bảng ngẫu nhiên dùng để biểu diễn mối quan hệ giữa 2 biến định tính sẽ được gới thiệu. Tham số dùng để đặc trưng cho mối quan hệ này cũng sẽ được đề cập. Tỷ số xác suất (odds ratio) sẽ đóng vai trò quan trọng trong việc so sánh tỷ lệ của các nhóm trong biến giải thích (response variable). Chương sẽ tập trung ban đầu vào biến giải thích nhị phân, sau đó mở rộng ra cho các biến định danh (nominal) và biến thứ tự (ordinal) với nhiều hơn 2 thuộc tính. Trong phần suy diễn thống kê, các công thức khoảng tin cậy cho tham số đo mối liên hệ, các kiểm định giả thiết về tính độc lập trong bảng sẽ được xây dựng.
2.1. Cấu trúc xác suất của bảng ngẫu nhiên
2.2. So sánh 2 tỷ lệ trong bảng ngẫu nhiên
2.3. Các mối liên hệ riêng trong bảng ngẫu nhiên 2´2 phân tầng
2.4. Mở rộng cho bảng tổng quát dạng I´J
2.5. Khoảng tin cậy cho tham số đo mối liên hệ.
2.6. Kiểm định giả thiết về tính độc lập trong bảng 2 chiều
2.7. Bảng 2 chiều với các thuộc tính có thứ tự
2.8. Mở rộng cho bảng nhiều chiều
Bài tập và thảo luận
Tài liệu tham khảo của chương:
1 – Nguyễn Mạnh Thế, Bài giảng Phân tích số liệu định tính, Chương 2
2 – Alan Agresti, 2002, Categorical Data Analysis, 2nd Edition
3 – Stokes, M. ,Davis, C., Koch, G. ,2001, Categorical Data Analysis Using The SAS System
CHƯƠNG 3 – MÔ HÌNH TUYẾN TÍNH TỔNG QUÁT NHỮNG VẤN ĐỀ CƠ BẢN
Trong chương này sẽ giới thiệu một lớp các mô hình có thể đưa về dạng tuyến tính gọi là mô hình tuyến tính tổng quát (GLM). Các mô hình được giới thiệu trong phần này sẽ giúp cho việc mô hình hóa nhiều dạng số liệu định tính cũng như liên tục khác nhau. Các mô hình phổ biến như logistic, log-linear. Phương pháp ước lượng hợp lí tối đa để ước lượng các mô hình loại này cũng sẽ được giới thiệu.
3.1. Mô hình tuyến tính tổng quát (GLM)
3.2. Mô hình tuyến tính tổng quát cho biến nhị phân
3.3. Mô hình tuyến tính tổng quát cho biến dạng đếm được (count data)
3.4. Phương pháp ước lượng hợp lí tối đa
3.5. Suy diễn thống kê cho mô hình tuyến tính tổng quát
Bài tập và thảo luận
Tài liệu tham khảo của chương:
1 – Nguyễn Mạnh Thế, Bài giảng Phân tích số liệu định tính, Chương 3
2 – Alan Agresti, 2002, Categorical Data Analysis, 2nd Edition
3 – Stokes, M. ,Davis, C., Koch, G. ,2001, Categorical Data Analysis Using The SAS System
CHƯƠNG 4 – MÔ HÌNH LOGISTIC VÀ MÔ HÌNH MULTINOMIAL
Chương này sẽ giới thiệu mô hình logistic và mở rộng của nó trong việc ứng dụng vào các nghiên cứu xã hội học và kinh tế. Ý nghĩa của các hệ số, phương pháp ước lượng, kiểm định sự phù hợp, phương pháp lựa chọn mô hình sẽ được đề cập. Bên cạnh đó, các khía cạnh như suy diễn cho các mối liên hệ có điều kiện trong bảng 2´2´k, tính toán kích thước mẫu, một số mô hình tương đương như probit và complementary log-log, hồi quy logistic có điều kiện cũng được giới thiệu.
4.1. Giải thích ý nghĩa các tham số trong mô hình logistic
4.2. Suy diễn trong mô hình logistic
4.3. Mô hình logistic đa biến
4.4. Ước lượng mô hình logistic
4.5. Các phương pháp lựa chọn mô hình
4.6. Các kiểm định về tính đúng đắn của mô hình
4.7. Suy diễn về mối liên hệ có điều kiện trong bảng ngẫu nhiên 2x2xk
4.8. Xác định kích thước mẫu
4.9. Mô hình probit và complementary log-log
Bài tập và thảo luận
Tài liệu tham khảo của chương:
1 – Nguyễn Mạnh Thế, Bài giảng Phân tích số liệu định tính, Chương 4
2 – Alan Agresti, 2002, Categorical Data Analysis, 2nd Edition
3 – Stokes, M. ,Davis, C., Koch, G. ,2001, Categorical Data Analysis Using The SAS System
CHƯƠNG 5 – MÔ HÌNH LOG-LINEAR CHO BẢNG NGẪU NHIÊN
Mô hình logarit tuyến tính (loglinear) có thể được biểu diễn dưới dạng mô hình tuyến tính tổng quát (GLM) trong đó sử dụng kết nối dạng loga (log link function) với biến phụ thuộc có phân phối Poisson. Dạng mô hình này xác định sư phụ thuộc của các trung bình của tần suất xuất hiện của các thuộc tính của biến định tính vào các cấp độ của các thuộc tính đó. Mục đích của việc sử dụng mô hình này là phân tích mối liên hệ và sự tương tác. Trong chương này, các dạng của mô hình loglinear sẽ được xây dựng cho bảng ngẫu nhiên hai chiều, bảng ba chiều và bảng tổng quát nhiều chiều. Chương này cũng sẽ trình bày mối liên hệ giữa mô hình logit và loglinear trong đó nhấn mạnh đến đặc điểm là mô hình loglinear được sử dụng khi có ít nhất 2 biến phụ thuộc.
5.1 Giới thiệu mô hình loglinear
5.2 Mô hình loglinear cho bảng ngẫu nhiên hai chiều
5.3 Mô hình loglinear nghiên cứu mối quan hệ phụ thuộc và tương tác trong bảng ngẫu nhiên 3 chiều
5.4 Suy diễn thống kê trong mô hình loglinear
5.5 Mô hình loglinear cho bảng tổng quát nhiều chiều
5.6 Mối liên hệ giữa mô hình logistic và loglinear
5.7 Một số khía cạnh trong ước lượng mô hình loglinear
Bài tập và thảo luận
Tài liệu tham khảo của chương:
1 – Nguyễn Mạnh Thế, Bài giảng Phân tích số liệu định tính, Chương 5
2 – Alan Agresti, 2002, Categorical Data Analysis, 2nd Edition
3 – Stokes, M. ,Davis, C., Koch, G. ,2001, Categorical Data Analysis Using The SAS System
7. GIÁO TRÌNH:
Nguyễn Mạnh Thế, Bài giảng Phân tích số liệu định tính
8. TÀI LIỆU THAM KHẢO:
1- Agresti, Alan, 2002, Categorical Data Analysis, John Wiley & Sons, Inc.
2 – Stokes, M. ,Davis, C., Koch, G, 2001, Categorical Data Analysis Using The SAS System.
3 – Agresti, Alan, 2007, An Introduction to Categorical Data Analysis, John Wiley & Sons, Inc.
4 – Venables, W. N. and Smith, D. M. , 2007, An Introduction to R.
9. PHƯƠNG PHÁP ĐÁNH GIÁ HỌC PHẦN
– Thang điểm: 10
– Cơ cấu điểm:
+ Điểm thực hành: 20%
+ Điểm bài kiểm tra: 20%
+ Điểm thi cuối kì: 60%
– Điều kiện dự thi học phần:
+ Phải tham dự ít nhất 80% số tiết học trên lớp