Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Examination paper for STAT0008 (Level 6)

Statistical Inference

Academic year: 2021/22

Instructions

· Answer ALL questions.

· You have two hours and thirty minutes to complete this paper.

·  After the two hours and thirty minutes has elapsed, you have 20 minutes to upload your solutions. · You may submit only one answer to each question.

· Section A carries 40% of the total marks and Section B carries 60%. The relative weights attached to

each question are as follows: A1(10), A2(20), A3(10); B1(20), B2(25), B3(15) marks.

·  The numbers in square brackets indicate the relative weights attached to each part question. ·  Marks are awarded not only for the nal result but also for the clarity of your answer.

Administrative details

· You can hand-write or type your solutions.

· This is an open-book exam.  You may use your course materials to answer questions.

· You may not contact the course lecturer with any questions, even if you want to clarify something or report an error on the paper. If you have any doubts about a question, make a note in your answer explaining the assumptions that you are making in answering it. You should also ll out the exam paper query form online.

·  Some questions may ask you to approach a problem in a particular way; please take note of this. Failure to do so may result in marks being deducted.

Formatting your solutions for submission

· Your solutions should be presented in the same order as the (part-) questions.

·  You should submit ONE pdf document that contains your solutions for all questions/ part-questions. Please follow UCLs guidance on combining text and photographed/ scanned work should you need to do so.

· Make sure that your handwritten solutions are clear and are readable in the document you submit.

Plagiarism and collusion

· You must work alone.   In particular, any discussion of the paper with anyone else is not acceptable. You are encouraged to read the Department of Statistical Sciences advice on collusion and plagiarism.

· Parts of your submission will be screened to check for plagiarism and collusion.

· If there is any doubt as to whether the solutions you submit are entirely your own work you may be required to participate in an investigatory viva to establish authorship.

Section A

Question A1 [10 marks]

Let X = (X1 , . . . , Xn )T  be a collection of independent and identically distributed random variables with probability density function:

f (x; θ) = exp {, } ,   x > 0,

where θ > 0. The mean of this distribution is 3θ .

(a)  Find a sucient statistic for θ . [2]

(b)  Find the Fisher information of θ . [4]

(c)  If W = W (X1 , . . . , Xn ) is an unbiased estimator of g(θ) = θ4 , find the Cramer–Rao lower bound for the variance of W . [2]

(d)  If W = W (X1 , . . . , Xn ) is an unbiased estimator of g(θ) = e 29 , find the Cramer–Rao lower bound for the variance of W . [2]

Question A2 [20 marks]

Let X be a random variable with Geometric distribution. The Geometric probability mass function is given by:

p(k } θ) = P (X = k } θ) = (1 , θ)k 1 θ,    k = 1, 2, 3, . . . ,

and 0 < θ < 1. The mean of the Geometric distribution is E[X] = . Let k = {k1 , . . . , kn { be an independent and identically distributed sample from a Geometric distribution with parameter θ .

(a)  Recall that the Beta distribution with parameters α, β > 0 has probability density function:

π(θ } α, β) = ,

where B is the Beta function. The mean of this distribution is

α + β .

Show that the Beta distribution, with parameters α, β > 0, is a conjugate prior for θ . Specify the parameters of the posterior distribution. [4]

(b)  Calculate a Bayesian point estimator of θ using this conjugate prior. [2]

(c)  Calculate the Jereys prior of θ . [8]

(d)  Calculate the posterior distribution, up to a proportionality constant, associated to this Jeffreys prior and identify this distribution. [3]

(e)  Calculate a Bayesian point estimator of θ using the Jereys prior. [3]

Question A3 [10 marks]

Suppose that X = (X1 , . . . , Xn )T  are independent and identically distributed continuous uniform random variables such that Xi  ↓ U [0, kθ], with 0 < θ < & unknown, k > 0 known, and i ← {1, . . . , n{ (n > 2).

(a) Write down the probability density function of Xi . [1]

(b)  Find a sucient statistic for θ . [2]

(c)  Find an unbiased estimator of θ . Hint: Transform the estimator = Xi  to remove its bias. [5]

(d)  Let k = 3.1416, and x = (0.90, 2.48, 1.28, 2.77, 2.95)T  be a realisation of X.  Calculate the unbiased estimate of θ obtained in (c) for this sample. [2]

Section B

Question B1 [20 marks]

Let f (x; θ) be the probability density function:

f (x; θ) = θx9 – 1 I(0 ,1) (x),

where θ > 0, and I(0 ,1) (x) is the indicator function of the interval (0, 1):

I(0 ,1) (x) =

Suppose that X is one observation from a population with probability density function f (x; θ).

For testing:

H0  : θ ( 1   versus   H1  : θ > 1,

calculate the power function and nd the size of the test that rejects H0  if X > . [4]

H0  : θ = 1   versus   H1  : θ = 2. [6]

(c) Is the test that you constructed in (b) uniformly most powerful for a level α test of the hypotheses: H0  : θ = 1   versus   H1  : θ > 1?

Justify your answer. [4]

(d)  Now, suppose that we are interested in testing the hypotheses:

H0  : θ = 1   versus   H1  : θ = 2,

using a Bayesian approach.   Consider the decisions d0  and d1  associated to choosing H0  and H1 , respectively. The losses associated with taking these decisions are:

L(θ, d0 ) = θ , 1,

L(θ, d1 ) = 2 , θ .

If the prior probabilities of the events {“H0  is true { and {“H1  is true { are 1/2 and 1/2 respectively, and one observation of X is collected, say x.

Determine the range of values of x for which H1  is chosen over H0 . [6]

Question B2 [25 marks]

Let X = (X1 , . . . , Xn )T  be a collection of independent and identically distributed random variables with probability density function:

f (x; θ, ν) = I[v,乂)() ,

where θ > 0 and ν > 0, and x ) ν .

(a)  Find the maximum likelihood estimators of θ and ν . [7]

(b)  Consider the hypotheses:

H0  : θ = 1,    ν unknown   versus   H1  : θ 1,    ν unknown.

Define T = log ( Xi ) , n log(X(1) ), where X(1)  = min{X{.

Write down the Generalised Likelihood Ratio Test statistic for testing these hypotheses in terms of T.

[10]

(c)  State the asymptotic distribution of the Generalised Likelihood Ratio Test statistic. [2]

(d)  Suppose that the insurance company iPay received three insurance claims last year. They only report these claims in terms of some unknown units (there are rumors that they are expressed in billions of US Dollars). The observed claims, which are assumed to be realisations of independent and identically distributed random variables with probability density function f (x; θ, ν), are x = (1, 2, 3)T . Using this sample, test the hypotheses:

H0  : θ = 1,    ν unknown   versus   H1  : θ 1,    ν unknown, based on the Generalised Likelihood Ratio Test statistic at a 5% level. [6] Hint: The 95% quantile of the χ1(2)  is 3.84.

Question B3 [15 marks]

Let X = (X1 , . . . , Xn )T  be a collection of independent and identically distributed random variables with cumulative distribution function:

,.0,

P (Xi  ( x } α, β) = a

(1,

where α > 0 and β > 0.

if x < 0,

if 0 ( x ( β,

if x > β,

(a)  Find a two-dimensional sucient statistic for (α, β). [4]

(b)  Find the maximum likelihood estimators of α and β . [6]

(c)  The length in millimetres of n Cukoos’ eggs collected by a team of Biologists is assumed to be a sample of independent and identically distributed random variables which follow the distribution P (Xi  ( x } α, β), i = 1, . . . , n. Consider the sample:

{22.0, 23.9, 20.9, 23.8{.

Find the maximum likelihood estimates of α and β based on this sample. [5]