Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

QBUS2810

Statistical Modelling for Business

Individual Assignment Task 1

This individual assignment will contribute 20% towards your final result in the unit. The deadline is Tuesday March 26, 2024 by midnight (Sydney time). Submission is via Turnitin on Canvas.

Key requirements:

. Complete your entire assignment in Jupyter Notebook, including your code and markdown sections for your written answers. Use LaTex in markdown sections where needed.

. Submit the resulting downloaded html file as your entire assignment.  Care must be taken with presentation in this file, however unavoidable error messages and page formatting issues will be ignored in marking.

. Only relevant analysis outputs (graphs, tables, etc) should appear in the as- signment file and all output should appear together with the discussion of that output, in the file.

. Any use of Generative AI has to be acknowledged and carefully described, all prompts that have been used need to be carefully reported in the submission.

TASK 1

Business problem:

This assignment is about the predictive relationship between house’s price and living area size in square meters. You will also assess whether the house price is affected by waterfront location of the house (0: for no waterfront (NWF), 1: for waterfront (WF)). Specifically, whether investing in an office location at the waterfront may increase the sales of real estate.

Data:

The data file for the analysis is “house data 2024.csv” .

Questions:

1. Conduct an appropriate exploratory analysis on the house priced, for all houses. Discuss any cleaning of the data you did, including why and how you did it, or why you didn’t do it.  Explore the distribution of the houses in the two subgroups, waterfront and not.  (4 marks)

2. Conduct (with α = 0.05) the appropriate t-test, median and Mann-Whitney tests, to assess whether waterfront house prices are typically higher (the alternative of unequal prices is fine for the median test). Assess all assumptions made.  (9 marks)

3. Which test’s result do you believe the most in Task 2?  Discuss and explain.  (2 marks)

4. Conduct an appropriate exploratory analysis to assess whether there maybe a linear relationship between houses’ prices and living area size in square meters.  (3 marks)

5. Conduct a simple linear regression analysis, first using OLS and then using LAD estimation,  for houses’ prices on living area size in square meters. Fully  assess all assumptions.  (10 marks)

6. Write a brief (e.g.   0.5  page) report summarising and discussing your findings and conclusions. Include  a discussion of whether you would recommend opening a waterfront area office in view of increasing real estate sales based on your findings.  (4 marks)

TASK 2

Consider the population SLR model:

Yi  = β0 + β1Xi + εi

and an observed, random sample of data (y1 , x1 ), . . . , (yn , xn ) from that model. Suppose you ran an OLS regression on this data but made a mistake and did not include the intercept in the regression.

Questions:

1. Is the mean of the estimated residuals from your OLS regression still equal 0, i.e. ¯(e) = 0?  How does your answer relate to LSA 2?  (2 marks)

2. Is the correlation between the estimated residuals and the observed x’s still equal 0.  (5 points)

Hint: look at the second equation found when differentiating the residual sum of squares with respect to β1 .

3. What form does the OLS estimator of the slope coefficient in your regression have? (2 marks)

Hint: derive the solution from the 2nd equation found when differentiating the residual sum of squares with respect to β1 .

4. Show  whether or not the  OLS estimator of your regression is still an unbiased estimator of the true β1.  (3 marks)