Học phần Hồi quy tuyến tính tổng quát

ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN
TRÌNH ĐỘ ĐÀO TẠO: ĐẠI HỌC
LOẠI HÌNH ĐÀO TẠO: CHÍNH QUY

1. TÊN HỌC PHẦN:
Tiếng Việt:     MÔ HÌNH TUYẾN TÍNH TỔNG QUÁT
Tiếng Anh:      Generalized Linear Models
Mã học phần:  TOKT1115                                       .Tổng số tín chỉ: 2

2. BỘ MÔN PHỤ TRÁCH GIẢNG DẠY: Toán Kinh Tế

3. ĐIỀU KIỆN HỌC TRƯỚC: Kinh Tế Lượng 1

4. MÔ TẢ HỌC PHẦN:

Học phần sẽ giới thiệu các mô hình thống kê dùng để phân tích các dạng số liệu định tính và định lượng trong các tình huống thường gặp của kinh tế xã hội học. Các mô hình sẽ được giới thiệu bao gồm mô hình tuyến tính cho biến phụ thuộc là biến định lượng, mô hình logistic cho biến phụ thuộc định tính, mô hình cho biến phụ thuộc rời rạc đếm được (count data), mô hình cho phân tích sống (survival analysis). Khóa học sẽ tập trung vào mục tiêu hiểu và ứng dụng các kỹ thuật thống kê, không đi sâu vào các vấn đề lý thuyết. Tuy nhiên để có thể nắm được những kiến thức cơ bản của khóa học, người học cần nắm vững các kỹ thuật ước lượng, kiểm định giả thiết, các dạng mô hình hồi quy bội. Lý thuyết về ma trận và đại số tuyến tính cũng cần được trang bị. Bên cạnh đó, việc sử dụng các phần mềm thống kê trng khóa học là bắt buộc. Phần mềm được gợi ý sử dụng là Stata, nhưng người học có thể sủ dụng một số phần mềm khác cho học phần này như R hoặc SAS.  

5. MỤC TIÊU HỌC PHẦN:

Học phần cung cấp cho người học những công cụ hiện đại để mô hình hóa và ước lượng tính toán các mối quan hệ kinh tế xã hội tổng quát, các biến dưới dạng định tính, định danh, thứ bậc. Người học có khả năng vận dụng các lớp mô hình đã được phát triển bởi các nhà lý thuyết trong các vấn đề thực tiễn, giải quyết các bài toán kinh tế xã hội. Bên cạnh đó người học cũng sẽ thành thạo trong việc sử dụng các phần mềm chuyên dụng để phân tích đánh giá định lượng và kiểm chứng, hỗ trợ cho các nhận xét định tính.

6. NỘI DUNG HỌC PHẦN:

PHÂN BỐ THỜI GIAN

STT

Nội dung

Tổng số tiết

Trong đó

Ghi chú

Lý thuyết

Bài tập,
thảo luận,
kiểm tra

 

1
2
3
4
5
6

Chương 1
Chương 2
Chương 3
Chương 4
Chương 5
Chương 6

3
6
5
5
6
5

2
4
3
3
4
3

1
2
2
2
2
2

 
  Cộng

30

19

11

 

CHƯƠNG I – CÁC MÔ HÌNH TUYẾN TÍNH CHO BIẾN LIÊN TỤC

Chương này nhằm ôn lại những kiến thức cơ bản cho người học đã được học ở những học phần trước đó như Kinh tế lượng và Thống kê. Chương bắt đầu với mô hình tuyến tính dạng tổng quát với các phương pháp ước lượng và kiểm định giả thiết. Tiếp theo là một số các mô hình phân tích phương sai một nhân tố, hai nhân tố và mô hình phân tích phương sai có biến độc lập định lượng.

1.1. Giới thiệu mô hình tuyến tính
1.2. Ước lượng tham số trong mô hình tuyến tính
1.3. Kiểm định giả thiết
1.4. Mô hình hồi quy đơn và mô hình hồi quy bội
1.5. Phân tích phương sai một nhân tố
1.6. Phân tích phương sai hai nhân tố
1.7. Phân tích phương sai với mô hình có biến độc lập dạng số (ANCOVA)
1.8. Kiểm định mô hình

Tài liệu tham khảo của chương:
           1 – Nguyễn Mạnh Thế, Bài giảng Mô hình hồi quy tuyến tính tổng quát, Chương 1.
           2 – P. McCullagh and J.A. Nelder, 1989, Generalized Linear Models, 2nd edition.
           3 – D. W. Hosmer, S. Lemeshow, 2000, Applied Logistic Regression, 2nd edition.
           4 – Alan Agresti, 1996, An Introduction to Categorical Data Analysis.
           5 – D. W. Hosmer and S. Lemeshow, 1999, Applied Survival Analysis.

CHƯƠNG 2 – MÔ HÌNH LOGIT CHO BIẾN NHỊ PHÂN

Chương sẽ tập trung vào giới thiệu mô hình cho biến có giá trị 0-1 là mô hình logistic trong đó các vấn đề cơ bản như ước lượng và kiểm định mô hình, các suy diễn thống kê từ mô hình sẽ được đề cập chi tiết. Tiếp đó, các thủ tục so sánh 2 hoặc nhiều nhóm thuộc tính dưới dạng các bảng ngẫu nhiên 2´2 hoặc k´2 sẽ được trình bày. Mô hình có 2 biến độc lập được trình bày dưới dạng phân tích phương sai. Các phương pháp lựa chọn mô hình và các dạng hàm kết nối khác nhau cũng được thảo luận trng chương này.

2.1 Giới thiệu mô hình logit
2.2 Ước lượng và kiểm định giả thiết
2.3 So sánh hai nhóm và nhiều nhóm
2.4 Mô hình với hai hoặc nhiều biến độc lập
2.5 Các cách lựa chọn hàm kết nối khác (link function)
2.6 Kiểm định mô hình

Tài liệu tham khảo của chương:
           1 – Nguyễn Mạnh Thế, Bài giảng Mô hình hồi quy tuyến tính tổng quát, Chương 2
           2 – P. McCullagh and J.A. Nelder, 1989, Generalized Linear Models, 2nd edition
           3 – D. W. Hosmer, S. Lemeshow, 2000, Applied Logistic Regression, 2nd edition
           4 – Alan Agresti, 1996, An Introduction to Categorical Data Analysis
           5 – D. W. Hosmer and S. Lemeshow, 1999, Applied Survival Analysis 

CHƯƠNG 3 – MÔ HÌNH POISSON CHO BIẾN PHỤ THUỘC DẠNG ĐẾM ĐƯỢC

Khi biến phụ thuộc có dạng đếm được, mô hình với biến phụ thuộc có phân phối Poisson sẽ được sử dụng. Trong chương này, mô hình dạng loglinear sẽ được giới thiệu để mô hình hóa biến dạng này. Sử dụng hàm kết nối thích hợp (log link), ta sẽ đưa mô hình về dạn hồi quy tuyến tính tổng quát và sử dụng phương pháp ước lượng và kiểm định giả thiết đã được xây dựng từ các chương trước đó cho mô hình dạng này. Cuối cùng, chương này sẽ đi xem xét một trường hợp trong đó phương sai của biến phụ thuộc là thay đổi.

3.1 Giới thiệu mô hình Poisson
3.2 Ước lượng và kiểm định giả thiết trong mô hình Poisson
3.3 Mô hình cho trường hợp phương sai không thuần nhất 

Tài liệu tham khảo của chương:
           1 – Nguyễn Mạnh Thế, Bài giảng Mô hình hồi quy tuyến tính tổng quát, Chương 3
           2 – P. McCullagh and J.A. Nelder, 1989, Generalized Linear Models, 2nd edition
           3 – D. W. Hosmer, S. Lemeshow, 2000, Applied Logistic Regression, 2nd edition
           4 – Alan Agresti, 1996, An Introduction to Categorical Data Analysis
           5 – D. W. Hosmer and S. Lemeshow, 1999, Applied Survival Analysis 

CHƯƠNG 4 – MÔ HINH LOG-LINEAR CHO BẢNG NGẪU NHIÊN

Chương này tập trung phân tích và trình bày các mô hình dạng loglinear cho các loại bảng ngẫu nhiên. Kiểm định về mối quan hệ phụ thuộc trong các bảng ngẫu nhiên 2 chiều, 3 chiều và nhiều chiều. Các loại mô hình cho bảng ngẫu nhiên như multinomial, Poisson, Binomial Product sẽ được trình bày.

4.1 Mô hình cho bảng ngẫu nhiên 2 chiều
4.2 Mô hình cho bảng ngẫu nhiên 3 chiều
4.3 Mô hình cho bảng ngẫu nhiên nhiều chiều 

Tài liệu tham khảo của chương:
           1 – Nguyễn Mạnh Thế, Bài giảng Mô hình hồi quy tuyến tính tổng quát, Chương 4
           2 – P. McCullagh and J.A. Nelder, 1989, Generalized Linear Models, 2nd edition
           3 – D. W. Hosmer, S. Lemeshow, 2000, Applied Logistic Regression, 2nd edition
           4 – Alan Agresti, 1996, An Introduction to Categorical Data Analysis
           5 – D. W. Hosmer and S. Lemeshow, 1999, Applied Survival Analysis

CHƯƠNG 5 – MÔ HÌNH CHO BIẾN PHỤ THUỘC CÓ DẠNG NHIỀU TỈ LỆ (MULTINOMIAL)

Chương sẽ giới thiệu một dạng số liệu khá phổ biến trong các nghiên cứu kinh tế xã hội học gọi là số liệu dạng multinomial. Đây có thể coi là một dạng mở rộng của số liệu nhị phân và mô hình dùng để phân tích loại số liệu này cũng là mô hình mở rộng của logistic. Trong chương này, các dạng mô hình phức tạp hơn được mở rộng từ mô hình logistic như mô hình logistic có điều kiện, mô hình logistic dạng phân cấp hay mô hình logistic cho số liệu có thứ bậc sẽ được trình bày và thảo luận.

5.1 Bản chất của số liệu dạng multinomial
5.2 Mô hình logit cho số liệu dạng multinomial
5.3 Mô hình logit có điều kiện
5.4 Mô hình logit dạng phân cấp (hierarchical data)
5.5 Mô hình cho biến phụ thuộc dạng thứ bậc (ordinal data)

Tài liệu tham khảo của chương:
           1 – Nguyễn Mạnh Thế, Bài giảng Mô hình hồi quy tuyến tính tổng quát, Chương 5
           2 – P. McCullagh and J.A. Nelder, 1989, Generalized Linear Models, 2nd edition
           3 – D. W. Hosmer, S. Lemeshow, 2000, Applied Logistic Regression, 2nd edition
           4 – Alan Agresti, 1996, An Introduction to Categorical Data Analysis
           5 – D. W. Hosmer and S. Lemeshow, 1999, Applied Survival Analysis 

CHƯƠNG 6 – CÁC MÔ HÌNH CHO SỐ LIỆU DẠNG SỐNG (SURVIVAL DATA)

Chương cuối cùng sẽ tập trung nghiên cứu các mô hình cho một dạng số liệu đặc biệt, có ba đặc điểm chính như sau: 1 là biến phụ thuộc là thời gian chở trước khi một sụ kiện nào đó xảy ra (thời gian sống còn lại của một người mắc bênh hiểm nghèo); 2 là số liệu có thể bị chặn hay không đầy đủ (censored) theo nghĩa là đến thời điểm số liệu được phân tích thì một số số liệu là không quan sát được (ví dụ như người bệnh trong thí nghiệm chết trước khi đo được tác dụng của thuốc); 3 là có các biến độc lập ảnh hưởng đến biến phụ thuộc trong các mô hinh nghiên cứu.

6.1 Các hàm Hazard và Survival
6.2 Số liệu bị chặn (censoring) và hàm hợp lí
6.3 Một số phương pháp mô hình hóa cho số liệu dạng sống
6.4 Mô hình cho chuỗi thời gian rời rạc.

Tài liệu tham khảo của chương:
1 – Nguyễn Mạnh Thế, Bài giảng Mô hình hồi quy tuyến tính tổng quát, Chương 6

           2 – P. McCullagh and J.A. Nelder, 1989, Generalized Linear Models, 2nd edition
           3 – D. W. Hosmer, S. Lemeshow, 2000, Applied Logistic Regression, 2nd edition
           4 – Alan Agresti, 1996, An Introduction to Categorical Data Analysis
           5 – D. W. Hosmer and S. Lemeshow, 1999, Applied Survival Analysis

7. GIÁO TRÌNH:

Nguyễn Mạnh Thế, Bài giảng Mô hình hồi quy tuyến tính tổng quát

8. TÀI LIỆU THAM KHẢO:
1 – P. McCullagh and J.A. Nelder, 1989, Generalized Linear Models, 2nd edition
2 – D. W. Hosmer, S. Lemeshow, 2000, Applied Logistic Regression, 2nd edition
3 – Alan Agresti, 1996, An Introduction to Categorical Data Analysis
4 – D. W. Hosmer and S. Lemeshow, 1999, Applied Survival Analysis 

9. PHƯƠNG PHÁP ĐÁNH GIÁ HỌC PHẦN
– Thang điểm:             10
– Cơ cấu điểm:
+ Điểm thực hành:                 20%
+ Điểm bài kiểm tra:             20%
+ Điểm thi cuối kì:                60%
– Điều kiện dự thi học phần:
+ Phải tham dự ít nhất 80% số tiết học trên lớp

This entry was posted in Uncategorized. Bookmark the permalink.