Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECMT1010 (2023, Semester 2) Assignment

Due: 6.00pm Friday 27 October 2023

Aim:  This assignment illustrates the use of various statistical techniques in an economic ap- plication.  You will use software  (e.g.,  Excel, StatKey) to analyze real data to investigate the relationship between wage rates and level of education as well as differences between males and females.

Data description:  The dataset is a student survey containing information on hours of exercise per week,  GPA,  and  Gender. You  are  assigned  a  data  set  containing  150  randomly-selected students from the survey.

Your data set is available in the Excel spreadsheet Studnets#.xlsx (where # is the last digit of your SID). It contains  3 columns and  151 rows.   The first row contains the variable names; the remaining 150 rows contain the information for each of the 150 students in your sample. The  Exercise column  identifies  the  number  of  hours   of  exercise  per  week,  GPA is   each student’s grade point average, GenderCode is gender (1 = male, 0 = female).

Hint:  You can import the Excel file into StatKey using the ‘Upload File’ facility after first con- verting the file into csv format.

Specific instructions: Answer all 9 questions below. Show all numerical answers to 3 decimal places.  Carryout all tests using a 1% level of significance.

QUESTIONS

Virgil believes that GPA depend negatively on hours per week of exercise.

1.  Using  appropriate  software,  produce  a  scatterplot  of  GPA  against  hours  per  week  of exercise using your sample.  Compute the sample correlation and comment on whether you agree with Amy.  [2 marks]

2.  Test whether there is a statistically significant linear association between GPA and hours per week of exercise,  showing  all  your   steps  and  clearly  stating  your   conclusion.   [4 marks]

Virgil sets up a regression model to investigate whether GPAs depend negatively on hours per week of exercise.

3.  Write down Virgil’s regression model taking care to define your notation clearly.  Using ap- propriate software, estimate the regression model and report your results.  [2 marks]

4.  Use your regression results to give a one-sentence interpretation of the regression slope estimate.  [2 marks]

5.  Test  whether  on  hours  per  week  of  exercise  is  an  effective  predictor  of  GPAs  in  the regression model you have  estimated  in  question  3.   Make  sure to  report your null  and alternative hypotheses, the test statistic, decision rule, and conclusion to the test.  [2 marks]

Virgil  suspects that women have higher GPA than men  on  average.   To  investigate  this  claim statistically, you will use a hypothesis test.

6.  Set up the null and alternative hypotheses taking care to define your notation clearly.  [2 marks]

7.  Using the ‘Shift Groups’ randomization method in Statkey, produce a dotplot of the random- ization distribution (with at least 2,000 samples) of the appropriate sample statistic.  Carry out the hypothesis test using the randomization distribution and state your conclusion. [2 marks]

8.  Verify that the  Central  Limit Theorem applies in this case, carry out the same hypothesis test using the appropriate approximation and state your conclusion.  Briefly compare these results to your findings in question 7.  [2 marks]

9.  Does the evidence suggest that women’s GPAs are higher than men’s GPA because of their gender?  Explain.  [2 marks]