Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Assignment 3: ECON-UA 266 - Intro to Econometrics

Fall 2023

The solution of this assignment will be released on Friday, September 29th 2022. You will work on algebraic  properties of the OLS estimators.  You are encouraged to discuss your solutions with your colleagues on  Piazza. However, you should also work on your own solutions, since it will be great practice for your exam. It’s also good practice to report nice regression results, not simply copying down the tables generated by R. Be clear and concise in your answers.

Question 1

Define the three assumptions to derive the OLS estimator properties. Choose one and discuss whether it is a plausible assumption. Give a specific example where the assumption might be violated.

Question 2

In your assignment, you are asked to show that σ(ˆ)Z(2)  = i(2)    is an unbiased and consistent estimator for σZ(2) .

Question 3

Show that

SST = SSE + SSR

Question 4

1.  Explain the differences between these three equations:

Y = α + βX + ε

Y = αOLS + βOLSX + e

2. What is the difference between e and ε from the previous question?

3.  Suppose you consider a model where Y = βX + ε, what is the consequence for e(¯)?  What about SeX?

Explain your answer intuitively or algebraically.

4.  Explain what a sampling distribution is and why an estimator has a sampling distribution. Sampling distribution is a probability distribution of a statistic obtained from a larger number of samples drawn from a specific population.  The sampling distribution of a given population is the distribution of frequencies of a range of different outcomes that could possibly occur from a statistic of a population.

The reason why an estimator has a sample distribution is that the samples are chosen randomly. For each different set of samples, we will get different estimators. The different estimators we got from the samples are also random variables, so those estimators also have corresponding probability distribution. That’s the reason why estimator has a sampling distribution.

Question 5

Suppose you are interested by the relationship between earnings and the number of years of education: Earningsi  = α + β × Educi + εi ,

a.  Explain what εi  is. What is included in εi?

b.  Do you think it is likely that E(εi |Educi )  0?  Explain.

c. If the assumption is not satisfied, what is the consequence in terms of the properties of the OLS estimator of α? what about the properties of β?

Question 6

Consider the following population linear regression model: Yi  = α + βXi + εi.

Give the formula for the OLS estimator of β.  Explain how the formula is being derived.  What is the intuition behind the OLS estimator?

β(ˆ) = Cov(X, Y)

This is derived from solving the minimization problem below:

min (yi  α(ˆ)  β(ˆ)xi )2

Let W = Σ(yi  α(ˆ)  β(ˆ)Xi )2

First, we take First Order Condition with respect to both α and β .

 = −2 (yi −α(ˆ) − β(ˆ)xi ) = 0                                                          (5)


 = −2 (yi  −α(ˆ) − β(ˆ)xi )xi  = 0                                                        (6)

Then, we solve these two conditions for α and β from equations (5) and (6).

From equation (5), we have:

(yi  α(ˆ)  β(ˆ)xi ) = 0

yi  α(ˆ)  β(ˆ)xi  = 0

As Σ yi  = ny(¯) andΣ xi  = nx(¯) . We have:

ny(¯)  nα(ˆ)  nβ(ˆ) = 0

α

Then we plug equation (7) into equation (6):

(yi (y(¯)  β(ˆ)x(¯))  β(ˆ)xi )xi  = 0

[yi xi (y(¯)  β(ˆ)x(¯))xi  β(ˆ)xi(2)] = 0

yi xi  y(¯)xi  β(ˆ)x(¯) xi  β(ˆ)xi(2) = 0

β(ˆ) =  =  = 

Question 7

Which of the following can cause OLS estimators to be biased?

(i) The variance of the population linear regression model error term depends on X .

(ii)  Omitting an important variable.

(iii) A sample where Xi  and Xj  is not independent.


Data Question

Follow up with the dataset you downloaded in the previous question,  i.e.,  2016  CPS,  which contains observations on weekly earnings, sex, age, race, and education for respondents aged 25-64.

a.  Define the univariate population regression model formally.

b.  Run the regression and interpret the economic significance of the coefficient.