Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON 250: Introductory Statistics

Fall 2023

Assignment 2

DUE: OnQ by 11:59 PM on November 30, 2023

No group submissions will be accepted

PLEASE READ THIS BEFORE ANSWERING THE QUESTIONS

You will have to submit two files:  a pdf file as well as a Stata do file.  The pdf file should con- tain your writeup to the questions and be sure to include any relevant output from Stata and graphs. For the Stata output, you may take a screenshot and include them along with your answers. That being said do not include all of the Stata output, rather only the output nec- essary to answer the question.  The Stata do file will contain your full Stata code.  The name of your two files should be as follows Assignment2_yourlastname_yourfirstname_yourstu- dentID. The submission is done through OnQ under Assessments/Assignments/Stata As- signment 2.

Unless otherwise stated in the question, you may use any built in function in Stata.

A table that is generated in your pdf file needs to have a title.   Every  column  needs  a name. Every row needs a name.

A graph that is added to your pdf file needs to have a title.   The horizontal axis needs a name. The vertical axis needs a name. Add a legend to your graph when needed.

Explain your reasoning for all of your answers.

Be as clear and as clean as possible. Otherwise, points will be taken off.

Question 1:  7.94 Giannis Antetokounmpo rebounds [30 marks]

Sports analytics have permeated nearly all sports at all levels.  Predictive analytic meth- ods are used to study and monitor a variety of statistics on teams and players.  Consider the provided data on the number of rebounds that NBA superstar Giannis Antetokounmpo made for each of the 75 consecutive 2017–2018 regular season games that he played in.  An analysis of the consecutive rebounds would show them to behave randomly over time with no patterns. This data is provided in the file “ex07-94giannis.csv”.

a) Obtain a histogram and Normal quantile plot of the rebounds data.  Even though techni- cally the distribution cannot exactly be Normal due to the discreteness of the data values, do the plots suggest that Normality is a reasonable approximation? Explain. [7.5 marks]

b) Use software to find the values of and the sample standard deviation s. [2.5 marks]

c) Assuming that Giannis’s rebounding process continues in the same manner and using the standard deviation value found in part (b) as σ, what is a 90% prediction interval for the number of rebounds in his next game?  Report the prediction interval as computed in decimal form. [5 marks]

d) In general, when dealing with predicting integer outcomes, as with rebounds, how would you suggest converting the lower and upper limit values to integers so that the resulting interval is minimally of the specified C level?  Be careful when thinking about the conversion of a lower limit value versus an upper limit value. Explain. [5 marks]

e) Following your approach of part  (d), what is the conservative 90% prediction interval with integer endpoints for the prediction interval found in part (c)? [5 marks]

f) If you were to expand your predictive model to narrow the prediction interval width, list at least two factors or pieces of information that you would gather. [5 marks]

Question 2: 8.28, 8.126 Investigating the endowment effect.  [20 marks]

Consider an ice-cold glass of lemonade on a hot July day.   What is the maximum price you’d be willing to pay for it? What is the minimum price at which you’d be willing to sell it? For most people, the maximum buying price will be less than the minimum selling price. In behavioral economics, this occurrence is called the endowment effect.  People seem to add value to products, regardless of attachment, just because they own them.

As part of a series of studies, a group of researchers recruited 40 students from a graduate marketing course and obtained from each of them their maximum (to pay) and minimum (to sell) prices for a Vosges Woolloomooloo gourmet chocolate bar made with milk chocolate and coconut. This data is given in “ex08-28endow.csv”.

a) Test the null hypothesis that there is no difference between the two prices.  Also con- struct a 95% confidence interval of the endowment effect. [10 marks]

b) The group of researchers also asked these same 40 students from a graduate market- ing course to consider a Vosges Oaxaca gourmet chocolate bar made with dark chocolate and chili pepper.  This data is given in “ex08-126endow.csv”.  Test the null hypothesis that there is no difference between the two prices.  Also construct a 95% confidence interval of the endowment effect. [10 marks]

Question 3: 8.120-8.122 Durable press and breaking strength.  [20 marks]

“Durable press” cotton fabrics are treated to improve their recovery from wrinkles after washing.   Unfortunately, the treatment also reduces the strength of the fabric.   A study compared the breaking strength of fabric treated by two commercial durable press processes. Five specimens of the same fabric were assigned at random to each process.  The dataset named “ex08-120brkstr.csv” gives the pounds of pull needed to tear the fabric.

a) Conduct a significance test at the 5% significance level of the hypothesis that there is no difference in the mean breaking strengths for the two treatments. [5 marks]

b)  Give  the  corresponding  95%  confidence  interval  for  the  difference  in  mean  breaking strengths. [5 marks]

c) Of course, the reason for durable press treatment is to reduce wrinkling.  “Wrinkle re- covery angle” measures how well a fabric recovers from wrinkles.   Higher is better.   The dataset named ”ex08-122wrinkle.csv” gives data on the wrinkle recovery angle (in degrees) for the same fabric specimens discussed in the previous two exercises. Which treatment has the better wrinkle recovery?  Conduct a significance test at the 5% significance level of the hypothesis that there is no difference in mean wrinkle recovery for the two treatments. [5 marks]

d) Give the corresponding 95% confidence interval for the difference in mean wrinkle re- covery. [5 marks]

Question 4: Grading Scheme [30 marks]

A professor wants to evaluate whether testing students weekly with a quiz improves their learning of the class material.  The professor teaches the same course in two different aca- demic years, with a class size of 30 in both.  In the first year, the students completed a quiz each week.  In the second year, the students were not given any quizzes.  Assume that the teaching was otherwise identical in each semester.   The course percentage grade for each student is given in the dataset titled ”Test Scores.csv”.

a) Analyze whether the class that was given the weekly quizzes scored higher on average in the class.  Give a 95% confidence interval as well as an appropriate test result.  Be sure to provide evidence on the validity of each of the two inference methods for this data. [20 marks]

b) Suppose that the professor taught the course to two different classes in one semester, rather than in two different years.  Ethics aside, would this be a better or worse study de- sign? Why? [10 marks]