Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Question 1

(i) Consider the following model for the log of out-of-pocket expenditures on prescribed medications (log(drugexp)):

log(drugexp) = β0  + β1totchr + β2 age + β3 age2  + β4 (age × totchr) + β5 female + β6 log(inc) + u

where totchr is the number of chronic conditions, age is age in years, female is a gender dummy (= 1 if female) and log(inc) is the log of household income.  In terms of the parameters of the population model, what is the partial effect on expected out-of-pocket expenditures on prescribed medications (drugexp) of age?

(ii) What is the interpretation of a 95% confidence interval for an estimate βj?  The coefficient estimate for β1 in the model in (i) is 0.303 and its standard error is 0.017, and the model was estimated using a sample of 3000 individuals. Construct the 95% confidence interval for β1 .

(iii) What does it mean for an estimator to be “unbiased”?  State the assumptions that are necessary for the OLS estimator to be unbiased.

(iv) What does it mean for an estimator to be “consistent”? State what assumptions are necessary for the OLS estimator to be consistent. Which on of these assumptions can we weaken compared to question (iii)?

(v) STATA reported the p-value for a test was 0.064; should I therefore reject the null hypothesis at the 5% level of significance? What about at the 10% level of significance?

Question 2

The following regression model explains the monthly wages as a function of years of education  (educ), years of labour market experience (exper) and current job tenure (tenure):

log(wage) = β0  + β1 educ + β2 exper + β3 tenure + u (2.1)

With a random sample of data the following output was obtained using STATA:

Source    |     SS        df     MS                   Number of obs   = 935

----------+------------------------------              F( 3, 931)     = 56.97

Model    | 25.6953242   3   8.56510806              Prob > F      = 0.0000

Residual | 139.960959 931   .150334005              R-squared     = 0.1551

----------+------------------------------              Adj R-squared  = 0.1524

Total    |  165.656283 934   .177362188                Root MSE       = .38773


lnwage   |  Coef.     Std. Err.    t      P>|t|   [95% Conf. Interval]

----------+----------------------------------------------------------------

educ

| .0748638

.0065124

11.50

0.000

.062083

.0876446

exper

| .0153285

.0033696

4.55

0.000

.0087156

.0219413

tenure

| .0133748

.0025872

5.17

0.000

.0082974

.0184522

cons

_

| 5.496696

.1105282

49.73

0.000

5.279782

5.713609

(i) What is the interpretation of the estimated coefficient on tenure, β3 ?

(ii) Test the statistical significance of β3 , against the alternative β3  > 0, using a 1% significance level.

(iii) Calculate an (unbiased) estimate of the error variance Var(u) = σ2  based on the STATA output.

(iv) What does the R-squared statistic represent? For this model and data, R2  = 0.1551.

(v) I want to test the null hypothesis H0   : β1   =  β2  + 2β3   against the alternative H1   :  β1 β2  + 2β3 .  The STATA output above does not provide enough information to allow me to test this restriction.  Write down a transformed version of the model in (2.1) which I can then estimate and use to t-test on a single parameter of the transformed model. Which parameter of the transformed model do I test?

Question 3

The following model can be used to study the salary of graduates from MBA programs:

log(salary) = β0  + β1 testsc + β2 W AM + β3 rank + u                                            (3.1)

where salary is the annual salary of an MBA graduate five years after graduation, testsc is his/her test score on a professional exam, W AM is his/her weighted average (course) mark during the MBA degree and rank is world-wide rank of the MBA program they attended (where rank = 1 is the best).

Based on a sample of 930 MBA graduates the following estimates were obtained:

log(salar(-)y) = 11.000 + 0.050 testsc + 0.048 W AM − 0.0009 rank

(0.143)    (0.017)            (0.023)              (0.0001)

n = 930,   R2  = 0.0927,     SSR = 0.45511

(i) I want to test whether the two characteristics of the graduates - testsc and W AM - are jointly significant in explaining log(salary). When I re-estimate the model with the restrictions imposed I find R2  = 0.0645 and SSR = 0.46926. Carry out the appropriate F-test using a 1% significance level.

(ii) I am concerned that the model above may be misspecified due to neglected nonlinearities. Outline the steps required to carry out the RESET test, and clearly state the null and alternative hypotheses of the test.

(iii) A possible omitted variable in (3.1) is years of work experience.  If we expect that their WAM during the MBA and their experience are positively correlated and assuming the usual positive relationship between annual salary and experience holds, what is the expected bias in β2  the coefficient on WAM?

(iv) If I selected the sample for the estimation of this model based on salary, for example, choosing only those graduates with annual salaries in excess of $120,000, what is the consequence for my estimates?

(v) I have a proxy variable for the years of work experience for these MBA grads.  It is their (age−6 − 20), since this should be the number of years they were not in some kind of schooling or tertiary education.  Call this expec_exper. I think I may be able to use expec_exper as a proxy variable. What are the requirements for this variable expec_exper to be a valid proxy?

Question 4

Consider the following model for explaining family expenditure on food:

FoodExp = β0  + β1 Income + β2 Adults + β3 Kids + β4 Urban + u                                (4.1)

where FoodExp is monthly family food expenditure, Income is family income, Adults is number of adults in the family, Kids is number of children and Urban is an indicator variable indicating whether the family resides in a city or not.

(i) With a random sample of n = 8, 695 observations, I first estimate the model by OLS and obtain R2  = 0.279. Test the overall significance of this regression using a 1% significance level.

Question 5

(i) If our dependent variable y *  is measured with error such that the data we observe is y where y = y *  + e and where e is the measurement error, what do we require in order to ensure that we do not get a biased estimate of β1  in the model y *  = β0  + β1 x + u?  What is the expected effect of the measurement error on our standard errors?