New User Special Price Expires in

Let's log you in.

Sign in with Facebook


Don't have a StudySoup account? Create one here!


Create a StudySoup account

Be part of our community, it's free to join!

Sign up with Facebook


Create your account
By creating an account you agree to StudySoup's terms and conditions and privacy policy

Already have a StudySoup account? Login here

QTM 100

by: Madelon Morford

QTM 100 QTM 100

Madelon Morford
Emory University
GPA 3.4

Preview These Notes for FREE

Get a free preview of these Notes, just enter your email below.

Unlock Preview
Unlock Preview

Preview these materials now for free

Why put in your email? Get access to more of this material and other relevant free materials for your school

View Preview

About this Document

Qtm 100 full course notes
QTM 100
Study Guide
QTM, 100, QTM 100, full course notes, Math, Quantitative math
50 ?




Popular in QTM 100

Popular in Mathmatics

This 12 page Study Guide was uploaded by Madelon Morford on Saturday February 20, 2016. The Study Guide belongs to QTM 100 at Emory University taught by McGee in Fall 2015. Since its upload, it has received 142 views. For similar materials see QTM 100 in Mathmatics at Emory University.

Similar to QTM 100 at Emory University


Reviews for QTM 100


Report this Material


What is Karma?


Karma is the currency of StudySoup.

You can buy or earn more Karma at anytime and redeem it for class notes, study guides, flashcards, and more!

Date Created: 02/20/16
Research Designs: Experiment and Observation The key to using statistics correctly lies within your study design. Research question ▯ Theory ▯ Falsifiable hypothesis ▯ Consideration of data collection ▯  Determination of statistical test you’ll use ▯ Data collection and analysis.  Steps of a Study  1. Question 2. Research 3. Theory 4. Hypothesis 5. Planned data collection 6. Planned data analysis 7. Actually collect data 8. Actually analyze data 9. Confirm or adjust theory Inferring Causation Variable A causes a change in Variable B Explanatory Variable causes a change in the Response Variable Often have a control group and an experimental/treatment group Prospective: follow individuals or entities over time to record changes in the response variable. Retrospective: use artifacts/data of events that have already occurred Hypothesis: A prediction from a theory. Falsification: The act of disproving a theory or hypothesis. Independent Variable The proposed cause, a predictor variable, or factor. A manipulated variable (in experiments) Dependent Variable The proposed effect, an outcome variable, or response variable Measured not manipulated (in experiments) Operational definitions Identifies one or more specific, observable events or conditions such that any other researcher  can independently measure and/or test for them. Quantitative Methods Testing theories using numbers  Qualitative Methods Testing theories using language ­ex. ­Magazine articles/Interviews ­­Conversations ­­Newspapers Ratio variable: provides information about order, possesses equal intervals, and has a true zero. e.g. a score of 16 on an anxiety scale means that the person is, in reality, twice as anxious as  someone scoring 8. Weight, height, enzyme activity, temperature in Kelvin, currency. Nominal Variable  What is your political party affiliation? 1. 1. Republican, 2. Democrat, 3.Independent Can we add, subtract, multiply, divide? no 1 republican + 1 republican does not = democrat Nominal variable: There are more than two categories  Binary variable­ only 2 categories  numbers are meaningless they are placeholders for words  Ordinal variable: The same as a nominal variable but the categories have a logical order e.g. whether people got a fail, a pass, a merit or a distinction in their exam. Likert scale­ ex. on a scale of 1 to 5 how strongly do you agree with this statement   no true 0, name only, but has order  no agreed on interval or distance between them  PROBLEM: often treated as ‘interval’Interval variable: Equal intervals on the variable represent  equal differences in the property being measured The difference between 0 and 20 is equivalent to the difference between 25 and 45. equal intervals; but the true 0 is missing   Zero is an additional point of measurement and does not represent the absolute lowest value.  Sample or population? Why?  If your population is small, attempts to include all of them should be taken.  ex. college students at oxford; you might as well take all of them  If your population is large, then you must take a sample of that population. • In general, the larger your sample the more likely it is to reflect the whole population.   more representative; more likely to have a representative balance of peoples differences  Rule of thumb: Your sample should not be more than 10% of your population. Samples must be as randomly selected as possible. Truly random: Every person in the population has an equal chance of being picked (Simple Random Sample (SRS)) ­difficult because you have to know who the entire population is  If the sample is randomly selected, then we may infer that the sample represents the population  of interest.  Why? Likely to have drawn from various subsets of the population You can not be 100% sure that the sample represents the population, however. You must leave  room for error.  To increase certainty: Large sample; randomly selected; multiple selections; decreasing extraneous or confounding  influences/variables. N = population,  n = sample  Counts are variables representing frequency of occurrence of an event: Number of students taking this class. Number of people who vote for a particular candidate in an election. Proportions or “bounded counts” are ratios of counts: Number of students taking this class divided by the total number of undergraduate students. Continuous:  Theoretically has an infinite number of measurements depending on the resolution of the  measurement system. There are no limits to the gaps between the measurements. It is data that  can be expressed on an infinitely divisible scale. Charting data  1. Contingency tables summarizes data for two nominal or ordinal variables.Either in counts or  percentages  1. What percentage of teachers think we should provide sex ed? a. 65/100 = 65% b. 12/250 = 4.8% c. 97/250 =  63% 2. Bar charts are good for displaying discrete data, typically nominal and ordinal 3. Histograms are best for displaying groupings of continuous data • frequency of score occurrences in a continuous data set that has been divided into classes, called  bins • Negative skew “Skewed to the left” • Positive skew “Skewed to the right” Descriptive Statistics Because it is more efficient and equally as effective.  take the stats of one and compare it to another stats  Measures of Central Tendency • where the ‘center’ of the distribution lies. ?The expected value Mean­ The arithmetic average.  advantages • uses every value in the data and is a good representative of the data disadvantages  • sensitive to extreme values/outliers Mode­The Most Frequent Score • Rarely used except in the case of nominal and ordinal variables. • Advantages ?Very quick and easy to determine ?Is an actual value of the data ?Not affected by extreme scores • Disadvantages ?Sometimes not very informative ?Can change dramatically from sample to sample Median­ the middle value  • Advantages ?Not much affected by outliers ?Better represents the middle data when your data has a large range or strong skew ?It can be determined for ratio, interval, and ordinal scale. ? • Disadvantages ?Can take a long time to calculate for large samples/data sets ?Not used in more advanced statistical operations Measures of Dispersion ­a real number that is zero if all the data are identical, and increases as the data becomes more  diverse. It cannot be less than zero. Range­ Difference between the Lowest and Highest values Advantage  • Shows the spread of the results Disadvantage  • Does not take into account any 'clustering' of results in a set of data.  • It is affected strongly by outliers  Interquartile Range­ (The Range of the middle 50% of scores) IQR=Q3 – Q1 Q1 is the lower quartile of 25 thercentile. Q3 is the upper quartile of 75  percentile. th 1. find the median  2. find the median of the upper scores (Q3) 3. find the median of the lower scores (Q1) 4. subtract those two numbers (Q3­Q1) box and whisker lower extreme, lower quartile, median, upper quartile, upper extreme  Variance: a measure of how data points differ from the mean  • Data Set 1:   3, 5, 7, 10, 10 • Data Set 2:   7, 7, 7, 7, 7 Data Set 1: mean = 7, median = 7 Data Set 2: mean = 7, median = 7 • But we know that the two data sets are not identical! The variance shows how they are  different. • BUT everything must be squared so you dont have negatives that cancel out  Why (n­1) for sample? • Remember, the sample is intended to be an ESTIMATE of the population.  • If we subtract 1 from the denominator, we have a smaller number.  If you divide by a smaller  number, what happens? ?Ex:  12/4  vs  12/3 • So why would a larger sample variance be a BETTER estimator of the population? ?Unbiased estimator Standard Deviation ­  a measure of variation of scores about the mean  Can think of standard deviation as the average distance to the mean, although that's not  numerically accurate, it's conceptually helpful.   All ways of saying the same thing: higher standard deviation indicates higher spread, less  consistency, and less clustering. Mutually Exclusive: cant happen at the same time Not Mutually Exclusive: can happen at the same time  Disjoint or mutually exclusive outcomes Examples: • Turning left and turning right are Mutually Exclusive • POPULATION VARIANCE  •SAMPLE VARIANCE  • Tossing a coin: Heads and Tails are Mutually Exclusive • Cards: Kings and Aces are Mutually Exclusive What is not Mutually Exclusive: • Turning left and scratching your head  • Kings and hearts Probability of A or B P(A or B) = P(A) + P(B) ­ P(A and B)  Disjoint: events that can't happen together  Independent: two events can both happen together and are unrelated from one another  Conditional (or dependent) Probability: the probability of one event affects the probability of  another event  ex. pulling out 2 green balls  .30 cents but you could win a dollar  3 green, 2 purple 1. P(A first green)= 3/5 2. P(B second green= 2/4  3. 3/5 x 2/4 = 6/20 = .30 or 30% 1. P(A and B)= P(A)xP(B/A) •probability of pulling one green ball times the remaining probability  Z Scores  the number of standard deviation it falls above or below the mean  •z= x­ u /standard deviation A. EX. The average IQ score is 100 with an average deviation of 15. what is the z­ score of someone who has a IQ of 145? •145­100/ 15 •can be any number! Outlier: and data point that is distant from the other observations •may be due to chance variability in the dataset or it might indicate experimental error •some say any z score greater than 2 from the mean is an outlier •some suggest 3 from the mean  •3 is more accurate!!!   Percentile Rank: The percentile rank of a particular score is defined as the percentage of the  scores in a distribution which are at or below the particular score.   So, what is the percentile rank for an IQ score of 95? 1. Step 1: Find the z­score 2. Step. 2: draw a normal curve 3. Step 3: Identify the location of the z­score  • positive scores fall above the mean  • negative, below 1. Step 4: use a probability table for z­score to find %tile rank 2. Step 5: subtract table number from 1  1. ex. 1­ (.6293) = % rank  If you're trying to find X given Z 1. Use the percentile (40%) Find .40 on the z score table  2. Use that value (­.25) 3. ­.25 = x ­ 70 / 3.3 4. Use algebra to solve for x Finding between two x points  1. Find both z scores for each number  2. Subtract accordingly    A Bernoulli random variable has exactly two possibly outcomes.   › Success = 1 › Failure = 0 Binomial distributions­ Describes the probability of having exactly k successes in n independent  Bernoulli trials with probability of success p.  › About 68% of all values lie within ±1  › About 95% of all values lie within ± 2  › About 99.7% of the values lie within ± 3  Rules  1. The trials are independent 2. The number of trials, n, is fixed 3. Each trial outcome can be classified as a successes or failures (Bernoulli) 4. The probability of a success, p, is the same for each trial.  Examining Relationships Between Two Variables  • When we consider the relationship between two variables, there are three possibilities:  • Both variables are categorical.  • We analyze an association through a comparison of conditional probabilities and graphically  represent the data using contingency tables. Examples of categorical variables are gender and  class standing.  • Both variables are quantitative.  • To analyze this situation we consider how one variable, called a response variable, changes in  relation to changes in the other variable called an explanatory variable. Graphically we use  scatterplots to display two quantitative variables. Examples are age, height, weight (i.e. things  that are measured).  • One variable is categorical and the other is quantitative, for instance height and gender.  • These are best compared by using side­by­side boxplots to display any differences or  similarities in the center and variability of the quantitative variable (e.g. height) across the  categories (e.g. Male and Female).  Examining Relationships Between Two Variables  • When we consider the relationship between two variables, there are three possibilities:  • Both variables are categorical.  • We analyze an association through a comparison of conditional probabilities and graphically  represent the data using contingency tables. Examples of categorical variables are gender and  class standing.  • Both variables are quantitative.  • To analyze this situation we consider how one variable, called a response variable, changes in  relation to changes in the other variable called an explanatory variable. Graphically we use  scatterplots to display two quantitative variables. Examples are age, height, weight (i.e. things  that are measured).  • One variable is categorical and the other is quantitative, for instance height and gender.  • These are best compared by using side­by­side boxplots to display any differences or  similarities in the center and variability of the quantitative variable (e.g. height) across the  categories (e.g. Male and Female).  Scatterplot for correlations  • X & Y axes are interchangeable.  • We’re only concerned with direction and strength of a relationship. Scatterplot  Scatter plots can provide answers to the following questions simply by eyeballing:  1. Are variables X and Y related?  2. Are variables X and Y linearly related?  3. Are variables X and Y non­linearly related?  4. Does the variation in Y change depending on X?  5. Are there outliers?  Quantifying the relationship  Correlation describes the strength of the linear association between two variables using data.  It takes values between ­1 (perfect negative) and +1 (perfect positive).  A value of 0 indicates no linear association.    Guessing the correlation  Which of the following is the best guess for the correlation between percent in poverty and  percent HS grad?  (a) 0.6 (b) ­0.75 (c) ­0.1 (d) 0.02 (e) ­1.5 Which of the following is the best guess for the  correlation between percent in poverty and percent HS grad?  (a) 0.6  (b) ­0.75  (c) ­0.1 (d) 0.02 (e) ­1.5  Guessing the correlation  Which of the following is the best guess for the correlation between percent in poverty and  percent female householder?  (a) 0.1 (b) ­0.6 (c) ­0.4 (d) 0.9 (e) 0.5  Guessing the correlation  Which of the following is the best guess for the correlation between percent in poverty and  percent female householder?  (a) 0.1 (b) ­0.6 (c) ­0.4 (d) 0.9 (e) 0.5  Assessing the correlation  Which of the following is has the strongest correlation, i.e. correlation coefficient closest to +1 or ­1?  (b) ? correlation means linear association Using statistics instead of eyeballing relationships  • Correlation: The strength of a linear relationship, R  • The population parameter is denoted by the Greek letter rho (?) (though often R is used) and  the sample statistic is denoted by the roman letter r.  Using statistics instead of eyeballing relationships  • Correlation: The strength of a linear relationship, R•r only measures the strength of a linear  relationship. There are other  kinds of relationships besides linear.  •r is always between ­1 and 1. ­1 means perfect negative linear correlation and +1 means perfect  positive linear correlation  •r has the same sign as the slope of the regression (best fit) line •r does not change if the  independent (x) and dependent (y)  variables are interchanged  •r does not change if the scale on either variable is changed. You may multiply, divide, add, or  subtract a value to/from all the x­values or y­values without changing the value of r.  •r has a Student's t distribution  Let us call the two sets of data "x" and "y"  • Step 1: Find the mean of x, and the mean of y  • Step 2: Subtract the mean of x from every x value (call them "a"), do the same for y (call them  "b")  2  2  • Step 3: Calculate: a × b, a and b for every value  2  2  •Step4:Sumupa×b,sumupa andsumupb 2 2 • Step 5: Divide the sum of a × b by the square root of [(sum of a ) × (sum of b )]    r = 0.886 ? relatively strong positive linear association between x and y  Exam 1 Review accurate statistics can obscure the truth  a theory is a system used to explain facts operational definition is one that makes it clear how the researcher should go about measuring  the process, activity or thing •boys show more affection towards their mothers than fathers levels of measurement  ratio interval ordinal nominal  measures of central tendency  mean median mode measures of dispersion  standard deviation, variance, IQR, range  discrete­ jumps, only specific categories of numbers (age in years and not moths, days, etc. continuous­ can take any value within a range of numbers (age with months days and weeks)   if you cant use the mean you cant use the standard deviation  n­1 : gives us room for error mutually exclusive can not happen at the same time  •cant be independent  If two things are independent then each of their probabilities is separate from one another And, not, or  and: use multiplication rule  independent p(a and b) = p(a)xp(b) dependent p(a and b)= p(a) x p(b/a) or: use addition rule  if the events are dependent  are they mutually exclusive? yes  p(a or b) = p(a)+p(b) no p(a or b) = p(a)+p(b)­p(a and b) if the events are dependent 


Buy Material

Are you sure you want to buy this material for

50 Karma

Buy Material

BOOM! Enjoy Your Free Notes!

We've added these Notes to your profile, click here to view them now.


You're already Subscribed!

Looks like you've already subscribed to StudySoup, you won't need to purchase another subscription to get this material. To access this material simply click 'View Full Document'

Why people love StudySoup

Bentley McCaw University of Florida

"I was shooting for a perfect 4.0 GPA this semester. Having StudySoup as a study aid was critical to helping me achieve my goal...and I nailed it!"

Allison Fischer University of Alabama

"I signed up to be an Elite Notetaker with 2 of my sorority sisters this semester. We just posted our notes weekly and were each making over $600 per month. I LOVE StudySoup!"

Steve Martinelli UC Los Angeles

"There's no way I would have passed my Organic Chemistry class this semester without the notes and study guides I got from StudySoup."

Parker Thompson 500 Startups

"It's a great way for students to improve their educational experience and it seemed like a product that everybody wants, so all the people participating are winning."

Become an Elite Notetaker and start selling your notes online!

Refund Policy


All subscriptions to StudySoup are paid in full at the time of subscribing. To change your credit card information or to cancel your subscription, go to "Edit Settings". All credit card information will be available there. If you should decide to cancel your subscription, it will continue to be valid until the next payment period, as all payments for the current period were made in advance. For special circumstances, please email


StudySoup has more than 1 million course-specific study resources to help students study smarter. If you’re having trouble finding what you’re looking for, our customer support team can help you find what you need! Feel free to contact them here:

Recurring Subscriptions: If you have canceled your recurring subscription on the day of renewal and have not downloaded any documents, you may request a refund by submitting an email to

Satisfaction Guarantee: If you’re not satisfied with your subscription, you can contact us for further help. Contact must be made within 3 business days of your subscription purchase and your refund request will be subject for review.

Please Note: Refunds can never be provided more than 30 days after the initial purchase date regardless of your activity on the site.