Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON0019A5UC/ECON0019A5UD

ECON0019 - Quantitative Economics and Econometrics

2022

Time allowance

You have 3 hours to complete this examination, plus an Upload Window of 20 minutes. The Upload Window is for uploading, completing the Cover Sheet and correcting any minor mistakes and should not be used for additional writing time.

If you have been granted SoRA extra time and/ or rest breaks, your individual examination duration will be extended pro-rata and you will also have the 20-minute Upload Window added to your indi- vidual duration.

All work must be submitted anonymously in a PDF le and you should follow the instructions for submitting an online examination in the AssessmentUCL Guidance for Students.

If you miss the submission deadline, you will not be able to submit your work via AssessmentUCL and you will not be permitted to submit the work via email or any other channel. If you are unable to submit your work due to technical difficulties which are substantial and beyond your control, you should apply for a Deferral via the AssessmentUCL Query Form.

Page limit:  8 pages.

Your answers, excluding the Cover Sheet, should not exceed this page limit. Please note that a page is one side of an A4 sheet with a minimum margin of 2 cm from the top, bottom, left and right borders of the page. The submission can be handwritten or typed, but the font size should be no smaller than the equivalent to an 11pt font size.  This page limit is generous to accommodate students with large handwriting.  We expect most of the submissions to be significantly shorter than the set page limit. If you exceed the maximum number of pages, the mark will be reduced by 10 percentage points, but the penalized mark will not be reduced below the pass mark and marks already at or below the pass mark will not be reduced.

Answer ALL  TWO questions from Part A and answer ONE question from Part B .

Questions in Part A  carry 60 per cent of the total mark and questions in Part B carry 40 per cent of the total.  Tables for the normal and F-distribution are  at the  end of the examination paper.

In cases where a student answers more questions than requested by the examination rubric, the policy of the Economics Department is that the student’s rst set of answers up to the required number will

be the ones that count (not the best answers). All remaining answers will be ignored.

If you have a query about the examination paper, instructions or rubric, you should complete an As- sessmentUCL Query Form. Please note that you will not receive a response during your examination.

By submitting this assessment, you are confirming that you have not violated UCL’s Assessment Regulations relating to Academic Misconduct contained in Section 9 of Chapter 6 of the Academic Manual.

PART A

Answer all questions from this section.

A.1 You wish to measure the effect of hiring more teachers on student performance.  To this end

you randomly select 300 schools; for each school you collect data on the number of students per teacher (str) and the average exam score (score) for nal year students in 2021.  Suppose that in the population the following equation holds:

score = β) + β1 str + β2 ability + β3 (str × ability) + u,                            (1)

where ability is the average level of student ability in a given school.  This equation statisfies MLR.3–MLR.4 in Wooldridge’s text book.

(a) You do not have data on ability and so decide to estimate β 1  by regressing score on str .

Derive the probability limit of the estimator.

(b) A colleague of yours conjectures that Cov (str, ability) < 0, Cov (str, str × ability) > 0,

β2  > 0 and β3  < 0.  Do these sign restrictions seem plausible to you?  Explain.  Supposing they hold, is it possible to determine the sign of the asymptotic bias of the estimator in (a)?

E [abilitylstr] = E [ability] .                                               (2)

Interpret the restriction in (2). Do you think it is likely to hold?

(d) Assuming that (2) holds, demonstrate that the probability limit of the OLS estimator in (a) equals β1 +β3E [ability]. Interpret the probability limit. In particular, is it a meaningful measure of the effect of class size on student performance?

(e) You decide to collect additional data on the average mark that the nal–year students

earned in their rst year at each school.   With  mark  denoting this new variable,  you hypothesise that, for some unknown coefficients θ, the following two conditions hold:

E [scorelstr, ability, mark] = E [scorelstr, ability] ,                            (3)

E [abilitylstr, mark] = E [abilitylmark] = θmark .                             (4)

Interpret the two conditions and compare them to (2). Do they seem reasonable? (f) You run the following regression,

score = βˆ) + βˆ1 str + βˆ2mark + βˆ3 (str × mark)

A.2 You are interested in the relationship between sales, profits and research & development (R&D).

For that purpose you obtain the following regression based on data collected from a sample of 45 firms in the UK concrete industry in 2016,

rd = 1 +  log (sales) + profit,     2 = .079,                          (5)

where rd is expenditures on R&D of a rm as percentage of its annual sales, sales is the rm’s annual sales (in millions GBP) and profit is its annual profits as percentage of sales.  Robust standard errors are reported in parentheses.

(a) Interpret the coefficient on log (sales). If sales increases by 10% what is the exact estimated

percentage point change in rd? Is this an economically large effect?

(b)  Test the hypothesis that rd does not change with sales against the alternative that it does

increase with sales. Perform the test at the 5% and 10% level. What is the p-value of the test? Conclude.

(c) You compute the F-test statistic of the hypothesis that sales and profit are jointly in- significant and obtain F = 4.12. Do you accept or reject the null at the 5% level? Explain.

(d)  Do you trust the critical values that you used in (b) and (c) and the the p-value that you computed in (b)? Are they valid? What do you conclude about the reported test results?

(e) You estimate the following alternative regression model for rd,

rd   =   .35 + .030sales - .0000070sales2 + 0.048profit,     2 = .099.            (6)

At what point does the estimated marginal effect of sales on rd become negative in this model?

(f) Write up a composite model that would allow you to test (5) and (6), respectively, against

the composite model.  Would the outcomes of these two tests be able to determine which of the two models, (5) and (6), is the preferred one? Explain.

(g) You collect data on annual R&D, sales and profits of the same 45 firms in 2017 and re- estimate (6) by running a pooled regression across the two years, 2016 and 2017. A colleague tells you that you should rather estimate the model using the rst-difference estimator. Is your colleague right? Explain.

PART B

Answer ONE question from this section.

B.1 In  Rainfall and  Conflict:  A  Cautionary Tale”  (Journal of Development Economics,  2015),

Heather Sarsons studies whether lower income can lead to more violent conflict among religious groups in India.  She studies a sample of 142 districts in the country’s 28 states.  Simplifying things a bit, the baseline equation of interest is:

28

Ci = βYi +      γs1 [Si = s] + εi ,

s=1

where Ci  (“conflict”) is the number of riots in district i in a particular year, Yi  (“income”) is income per capita, Si  is the state in which district i is located, 1 [Si = s] indicates a dummy variable which takes the value of one when Si = s, and εi  is the error term.

(a) Why may the OLS estimate of β be inconsistent? Provide at least one economic justification.

Sarsons proceeds to use an instrumental variable strategy:  she instruments income with two measures of rainfall in the district. The rst one, R1i, is the amount of rainfall in district i in the year of study minus its typical value (across many years) for the district. The second measure, R2i, is a dummy variable that R1i  is below its 20th percentile.  The idea is that agricultural production is a key source of income in much of India and it relies on sufficient rainfall.

(b) Explain in detail (step by step) how her instrumental variable estimate βˆ is constructed from data on (Ci, Yi, R1i, R2i, Si). Then write down the formal conditions under which βˆ is consistent for β . Which of them can be tested?  For those which can, describe the testing procedure.  For those which cannot, explain why not.

(c) Why does Sarsons subtract the typical rainfall in the district when constructing R1i? Which condition or conditions from part (b) would be more likely violated if she did not do this? Give an economic justification.

For simplicity, drop R2i  and keep R1i  as the single instrument in the nal parts of the question. Sarsons observes that in some Indian districts there are dams on local rivers, and thus reservoirs of water which do not dry out even in low-rainfall years. This should make income less dependent on weather. Another issue is that the causal effects of income on conflict can be heterogeneous across regions.

(d) With these complications, can the instrumental variable estimate βˆ still be interpreted as some average of causal effects of income on conflict and, if so, what kind of average?  Which

condition or conditions would have to be added, compared to part (b), for such an interpretation to be valid? Is it (or are they) plausible?

(e) Sarsons nds that in the districts with a dam the reduced-form coefficient is significantly different from zero, but the rst-stage coefficient is not. She concludes that rainfall may not be an exogenous instrument. Explain intuitively and formally how she makes this conclusion.

B.2 In  Does Hospital Crowding Matter?   Evidence from Trauma and Orthopedics in England”

(American Economic Journal:  Economic Policy, forthcoming), Thomas Hoe examines the im- pact of hospital crowding on medical treatment outcomes exploiting variation in emergency admissions.  For simplicity, we abstract from some of the details examined in the paper.  One possible outcome of interest is the length of the illness (measured in days) for a particular patient i. Let this be denoted by yi . Suppose one focusses on the following model relating this outcome for an individual i admitted to a particular hospital:

ln(yi) = β) + xβx + ∈i ,                                                  (7)

where xi  comprises variables such as the individual’s age, race and disease stage at the time of admission. As indicated in the article, other elements that might affect the outcome of interest relate to patient composition and hospital operation details (such as capacity constraints and utilisation) at the hospital where the individual is admitted, among other factors. Note that the unit of observation in items (a)-(c) below are the individual whereas in items (d)-(e) relates to a time period (day) for a particular hospital.

(a)  Suppose that one is interested in estimating (7) with data from a particular hospital. Let

ci  > 0 denote the number of days an individual is at the hospital.  This variable and xi  is observed for every patient in the hospital. If individual i is discharged after recovering from the illness (i.e., ci  2 yi), yi is known, but otherwise we only know ci and that yi  > ci . What additional assumptions would one need to estimate  (7) by maximum likelihood?   Write down the log-likelihood function for this regression and explain your answer.

(b)  Suppose that individual i opts to go to a hospital according to the following choice model: hi = 1(γ) + γddi + vi  2 0)                                                (8)

where hi   =  1 if individual i goes to the hospital and = 0, otherwise.   The variable di records i’s distance to the closest hospital and vi  marks idiosyncratic unobservable factors informing this decision.  Assume that vi  follows a standard normal distribution.  One is interested in estimating (7) and information on yi  is only available for those who go to the hospital. Assume that OLS estimates are obtained for those observations. First, if i and vi are not necessarily independent, but γd = 0, would the OLS estimator above be consistent? Explain. What if γd  is not necessarily zero, but di  and xi  are independent? Explain.

(c)  Suppose that going to the hospital depends not only on di  but also on xi . In other words, consider now the following extended version of equation (8):

hi = 1(V) + Vddi + Vxi + vi  2 0)                                          (9)

How would you estimate the parameters in (7) consistently? Explain your answer.

(d)  Suppose you have time series data on daily admissions to a particular hospital, denoted by qt where t is a particular date, and consider for simplicity a linear regression of qt  on week- of-the-year dummy variables st  recording which week of the year t pertains to.  Using the number of admissions per hospital, Hoe notes that there is no evidence of serial correlation in the residuals of a regression of (emergency) admissions on seasonal dummies once one examines the estimated AR(1) coefficients for a regression of residuals on lagged residuals. Under what conditions does this residual regression offer a valid test for the absence of serial correlation? Describe the test in detail.

(e) For the regression above, under what conditions would the OLS estimator be consistent?

Explain your answer.


5 % Critical values for the Fν1 ,ν2   distribution

5         6         7         8        10       12       15       20

246.