BGSU / Math / MATH 1150

# What is the description of how a statistician thinks data is produced? Description

##### Description: This study guide covers what will be on the final exam, chapter 6-8. This includes all vocabulary, formulas and examples. Textbook page numbers are also provided so you can find practice problems and additional formulas.
FINAL EXAM STUDY GUIDE: Chapters 6­8 Intro to Statistics *images/graphs taken from Google Images*

## What is the description of how a statistician thinks data is produced?

CHAPTER 6

∙ Pg. 285: 6.1­6.12

∙ Pg. 292: 6.81­6.84, 6.87a/b, 6.88a/b, 6.89, 6.90

∙ Chapter 6 Chapter Review pg. 284

Section 6.1 – Probability Distributions are Models of Random Experiments ∙ Probability model

o A description of how a statistician thinks data is produced

o There are different types of models:

 Uniform

 Linear

 Normal

∙ Probability distribution (PDF)

o Also called probability distribution function (pdf) is a table, graph or formula that  gives all the outcomes of an experiment and their probabilities

## What is the main definition of discrete outcomes?

∙ Discrete outcomes

o A random variable is discrete if the outcomes can be listed or counted o Ex. number of siblings, roll of a die

∙ Continuous outcomes

o A random variable is called continuous if the outcomes cannot be listed because  they occur over a range, there are an infinite number of possibilities the random  variable can be

o Ex. exact weight, height of a person

∙ Probability density curve

o

## What is the main definition of continuous outcomes?

∙ Area under curves

o The area under a rectangle is pretty familiar and reasonable to calculate (LxW)

o The area under a normal curve is a lot harder to calculate using area formulas, so  a computer or table is needed

Section 6.2 – The Normal Model

∙ Normal model

o The distribution is unimodal

o The distribution is approximately symmetric

o The distribution is approximately bell shaped

∙ Normal curve (distribution)

∙ Normal curve (distribution)

∙ Mean of a probability distribution

o Population Parameter:  μ

o Sample Statistic: x  (x­bar) ̅

∙ Standard deviation of a probability distribution

o Population Parameter: σ (sigma)

o Sample Statistic: s

∙ Standard Normal Model

o a normal distribution with a mean = 0 and a standard deviation = 1 o N (0,1)

CHAPTER 7

∙ 7.75­7.78, .91­7.96

∙ Chapter 7 Chapter Review pg. 338

∙ Chapter 7 Review Exercises pg. 326

Section 7.1 – Learning about the World through Surveys

∙ Population

o the group of people or objects we wish to study

∙ Parameter

o a numerical value that characterizes some aspect of the population

∙ Sample

o a collection of people or objects taken from the population

∙ Statistic

o a number derived from the data

∙ Census

o a survey in which every member of the population is measured

o same as statistic

o same as statistic

∙ Statistical inference

o the art and science of drawing conclusions about a population on the basis of

observing only a small subset of that population

∙ Bias

o sampling bias

o voluntary­response bias

o response bias

o convenience sample

o measurement bias

∙ Simple random sampling (SRS)

o involves randomly drawing people from the population without replacement. o SRS is one in which every member of the population and every possible sample is

equally likely to be chosen for the sample

Section 7.2 – Measuring the Quality of a Survey

∙ Accuracy

o The method measures what it intended; correctly estimates the population

parameter

o Bias measures accuracy

o How close are the values to the true value?

∙ Precision

o If the method is repeated, the estimates are very consistent

o Standard error measures precision

o How scattered are the values?

∙ Standard Error (SE)

o That variability among samples

o Look in the book for formulas, examples and review problems

 Pg. 326­338

 7.75–7.86, 7.91­7.96

∙ Key Points to Remember:

o Statisticians evaluate the method used for a survey, not the outcome of a single

survey

o Statistics Vary from Sample to Sample

o The Size of the Population Does Not affect Precision

o Large Samples Produce More Precise Estimators

Section 7.3 – The Central Limit Theorem for Sample Proportions

∙ Random sample with independent observations

o The sample is collected randomly and the trials are independent of each other

∙ Large sample

o (np ≥ 10 and n (1­p) ≥ 10)

∙ Large Population

o If SRS is used, a population with at least 10 times as many members as are in the  sample

∙ Central Limit Theorem (CTL)

o If the trials are random and independent and the sample and population sizes are  large then the sampling distribution of p  is approximately normal and follows: ̂

∙ Checking Conditions for the Central Limit Theorem

o Since simple random sampling is usually impossible to do, other random

sampling techniques are often used instead.

o A large sample size is absolutely necessary.

o Typically, the population of interest is very large, but one should still be aware of  this requirement.

Section 7.4 – Estimating the Population Proportion with Confidence Intervals

∙ Confidence interval

o an interval of values, computed from sample data, that is almost sure to include

the true population proportion

o a range of plausible values for a population parameter.

∙ Margin of error (m)

o tells us how far from the population value our estimate can be

o Margin of error = (z*) (SE)

∙ Confidence level

o expresses our level of confidence that the interval contains the population

parameter

o measures the success rate of the method, not of any one particular interval o tells us how often the estimation is successful

o how confident we are in the process that produces the confidence interval o it is NOT the probability that the population proportion is in the interval

CHAPTER 8

∙ pg. 354

Section 8.1 – The Essential Ingredients of Hypothesis Testing

∙ Hypothesis Testing

o A procedure that enables us to choose between two claims when we have  variability in the outcomes

∙ Null hypothesis

o The neutral, status quo, skeptical statement about a population parameter o Written: Ho

∙ Alternative hypothesis

o The research hypothesis, a statement about the value of a parameter that we intend to demonstrate is true

o Written: Ha

∙ Significance level

o The probability of making the mistake of rejecting the null hypothesis, when it  fact, it is true

o Written as lowercase alpha

∙ p­value

o the number that measures our surprise by reporting the probability that if the null  hypothesis is true, a test statistic will have a value as extreme as or more extreme  than the value we actually observe

o small p­values closer to 0 means we have received a surprise

o large p­values closer to 1 means no surprise

