Инфоурок Информатика ПрезентацииСтатистическая обработка данных (лекция 2)

Статистическая обработка данных (лекция 2)

Скачать материал
Скачать материал "Статистическая обработка данных (лекция 2)"

Получите профессию

Интернет-маркетолог

за 6 месяцев

Пройти курс

Рабочие листы
к вашим урокам

Скачать

Методические разработки к Вашему уроку:

Получите новую специальность за 3 месяца

Специалист по коллекторской деятельности

Описание презентации по отдельным слайдам:

  • 1 слайд

  • Лекция 2 Статистическая обработка данных
Ростов-на-Дону
2012

    2 слайд

    Лекция 2
    Статистическая обработка данных

    Ростов-на-Дону
    2012

  • Содержание лекции №2
Генеральная совокупность и выборка.
 Статистическое расп...

    3 слайд

    Содержание лекции №2
    Генеральная совокупность и выборка.
    Статистическое распределение. Гистограмма.
    Характеристики положения и рассеяния.
    Оценка параметров генеральной совокупности по выборке.
    Доверительный интервал и доверительная вероятность.
    Сравнение средних.

  • Математическая статистика (МС) – это наука, изучающая методы обработки резуль...

    4 слайд

    Математическая статистика (МС) – это наука, изучающая методы обработки результатов наблюдений массовых случайных явлений, обладающих статистической устойчивостью, закономерностью с целью выявления этой закономерности по исследованию части этого массива данных.
    Возможности МС
    Выявляет
    закономерности
    массовых явлений (т.е.царица в области больших чисел).
    2. Предсказывает
    наличие
    внешних
    влияний.

  • Два основных направления МС:Оценка
неизвестных
параметров.2. Проверка
статист...

    5 слайд

    Два основных направления МС:
    Оценка
    неизвестных
    параметров.
    2. Проверка
    статистических
    гипотез.
    генеральная
    совокупность
    выборка
    Основные понятия МС:
    Задачи математической статистики
    или

  • Генеральная совокупность и выборкаГенеральная совокупность –
это множество вс...

    6 слайд

    Генеральная совокупность и выборка
    Генеральная совокупность –
    это множество всех
    мыслимых значений
    наблюдений, однородных
    относительно некоторого
    признака, которые могли
    быть сделаны.

    Объем генеральной
    совокупности


    N
    Пример: число единиц
    товара, произведенных
    фирмой за год.
    Рост студентов I курса всей Ростовской области

  • Выборка – совокупность случайно отобранных наблюдений.


 
Выборка характериз...

    7 слайд

    Выборка – совокупность случайно отобранных наблюдений.




    Выборка характеризуется:
    - варианта
    - частота
    встречаемости
    Выборка – это множество случаев, с помощью определенной процедуры выбранных из генеральной совокупности для участия в исследовании.
    Зачем используют выборку?
    ВОПРОС:
    Объект исследования очень большой.
    Существует необходимость сбора первичной информации

  • Объем выборки.  Репрезентативность      Объем выборки – это количественная ха...

    8 слайд

    Объем выборки. Репрезентативность
    Объем выборки – это количественная характеристика выборки.
    Это количество вариант в выборке. Это число случаев, включенных в выборочную совокупность.
    n
    А есть качественная характеристика выборки?
    ВОПРОС:
    Да. Кого или Что именно выбирают. Какие способы построения выборки для этого используют.

  • Выборка должна быть репрезентативной, то есть свойства выборки должны отражат...

    9 слайд

    Выборка должна быть репрезентативной, то есть свойства выборки должны отражать свойства генеральной совокупности.

    Репрезентативность ( фр. representation – представление) – это соответствие характеристик выборки характеристикам генеральной совокупности.

    Репрезентативность – это свойство выборки представлять параметры генеральной совокупности.

  • Статистическое распределение
(вариационный ряд)Пример:Рост 175 см встретился...

    10 слайд

    Статистическое распределение
    (вариационный ряд)
    Пример:
    Рост 175 см встретился 5 раз;
    рост 168 см – 7 раз; 180 см – 8 раз.
    Вариационный ряд -
    это та же самая выборка, но
    расположенная в порядке
    возрастания элементов.
    Пример:
    168 см – 7 раз; 175 см – 5 раз;
    180 см – 8 раз.
    Статистическое распределение – это совокупность вариант и соответствующих им частот.


    -варианта
    - частота встречаемости

  • Гистограмма – это ступенчатая фигура, состоящая 
из смежных прямоугольников,...

    11 слайд

    Гистограмма – это ступенчатая фигура, состоящая
    из смежных прямоугольников,
    построенных на одной прямой,
    основания которых одинаковы и
    равны ширине класса, а высоты
    равны относительной частоте.
    Ширина класса
    вариационный размах
    Формула
    Стерджеса
    Гистограмма

  • Гистограмма распределения168; 155; 168; 177; 189; 192; 196; 184; 189; 165вари...

    12 слайд

    Гистограмма распределения
    168; 155; 168; 177; 189; 192; 196; 184; 189; 165
    вариационный размах
    Измеряют рост. Объем выборки n=10

  • Характеристики положения (мода, медиана, выборочное среднее) и рассеяния (выб...

    13 слайд

    Характеристики положения (мода, медиана, выборочное среднее) и рассеяния (выборочная дисперсия и выборочное среднее квадратическое отклонение).

    Мода (Мо) – наиболее часто встречающаяся
    варианта в данной совокупности.
    Пример:
    7
    Характеристики положения:

  • Мода – это такое значение варианты, что предшествующие и следующие за ней зна...

    14 слайд

    Мода – это такое значение варианты, что предшествующие и следующие за ней значения имеют меньшие частоты встречаемости.
    172, 168, 172, 175, 187, 172, 164
    10

  • Медиана (Ме) – это структурная средняя признака, 
относительно которой вариа...

    15 слайд

    Медиана (Ме) – это структурная средняя признака,
    относительно которой вариационный
    ряд делится на две равные части.
    Пример:
    2 4 6 8 10 12 14

    2 4 6 8 10 12 14 16
    25
    30
    35
    40
    45
    50
    Рост, см
    Ме – результат, находящийся в середине последовательности.

  • Выборочная средняя – это среднее
 арифметическое значение вариант статистиче...

    16 слайд

    Выборочная средняя – это среднее
    арифметическое значение вариант статистического ряда.
    Пример: Гемоглобин (He) в крови одной группы мужчин (n1=30) равен 70%, а для другой группы мужчин того же возраста (n2= 20) – 50%. Найти среднюю арифметическую этих двух средних.
    n- объем выборки
    - частота
    встречаемости

    -варианта


  • - отклонениеНо “+” компенсируют “-” ∑=0.
Поэтому возводим в квадрат и 
находи...

    17 слайд

    - отклонение
    Но “+” компенсируют “-” ∑=0.
    Поэтому возводим в квадрат и
    находим среднее.
    Выборочная дисперсия
    Пример:
    Среднее квадратическое отклонение =
    стандартное отклонение

    где
    - объем выборки,
    частота
    встречаемости,
    - варианта,
    - выборочное
    среднее.
    Характеристики рассеяния определяют отклонение каждой варианты от средней арифметической.

  • Пример: Дана выборка

    18 слайд

    Пример: Дана выборка

  • Пример.Дана выборка3, 4, 5

    19 слайд

    Пример.
    Дана выборка
    3, 4, 5

  • Оценка параметров 
генеральной! совокупности 
по характеристикам ее выборки!...

    20 слайд

    Оценка параметров
    генеральной! совокупности
    по характеристикам ее выборки!
    (точечная и интервальная)
    Требования
    Оценка параметра – это любая функция от
    значений выборки.
    несмещенная
    состоятельная
    эффективная
    Генеральная совокупность –это гипотетическое множество элементов, объединенных общей характеристикой.
    Выборка - множество испытуемых из генеральной совокупности.

  • ПАРАМЕТРЫ1. Выборочное среднее2. Выборочная  дисперсияВыборка
 Генеральная 
с...

    21 слайд

    ПАРАМЕТРЫ
    1. Выборочное среднее
    2. Выборочная дисперсия
    Выборка


    Генеральная
    совокупность
    ПАРАМЕТРЫ
    1. Генеральное среднее
    2. Генеральная дисперсия

  • Точечная оценка – это выборочная характеристика, используемая в качестве приб...

    22 слайд

    Точечная оценка – это выборочная характеристика, используемая в качестве приближенного значения неизвестной генеральной характеристики.

    Определяется одним числом (точкой на числовой оси).
    Выборка должна быть большого объема.
    Дает лишь некоторое приближенное значение параметра.
    I. Точечная оценка

  • - это несмещенная
оценка 
математического
ожидания  - это смещенная оценка
ди...

    23 слайд

    - это несмещенная
    оценка
    математического
    ожидания
    - это смещенная оценка
    дисперсии


    Генеральное среднее
    Генеральная дисперсия
    Генеральное среднее равно математическому ожиданию выборочной средней
    Генеральная дисперсия не равна математическому ожиданию выборочной дисперсии

  • Исправленная дисперсия (более точная)Генеральная дисперсия равна математическ...

    24 слайд

    Исправленная дисперсия (более точная)
    Генеральная дисперсия равна математическому ожиданию исправленной дисперсии.
    - средняя ошибка выборочной средней,
    - исправленное среднее квадратическое
    отклонение,
    - объем выборки,
    - коэффициент вариации.
    Характеризует
    изменчивость признака в единых единицах %

  • II. Интервальная оценка
 – это числовой интервал, содержащий неизвестный пара...

    25 слайд

    II. Интервальная оценка
    – это числовой интервал, содержащий неизвестный параметр генеральной совокупности с заданной вероятностью.
    Определяется двумя числами –границами
    интервала.
    Более точная, надежная и информативная, так как дает информацию о степени близости к
    соответствующему теоретическому параметру.
    Используется, если выборка малого объема.

  • Доверительный интервал и
доверительная вероятностьДоверительный интервал – эт...

    26 слайд

    Доверительный интервал и
    доверительная вероятность
    Доверительный интервал – это интервал, в
    котором с той или иной заранее! заданной
    вероятностью! находится генеральный параметр.
    - выборочное среднее,
    - средняя ошибка
    выборочной средней.
    (Р≥0,95)
    - нормированный показатель распределения
    Стьюдента, с (n-1) степенями свободы

  • - нормированный показатель распределения Стьюдента, с (n-1) степенями свободы...

    27 слайд

    - нормированный показатель распределения Стьюдента, с (n-1) степенями свободы, который определяется вероятностью попадания генерального параметра в этот интервал.
    Стьюдент
    (Уильям Д. Госсет)
    1876-1937гг.
    1899г.
    Дублин, Ирландия,
    Пивоваренный завод
    Гиннеса

  • Доверительная вероятность Р – это такая 
вероятность, что событие 1-Р – можно...

    28 слайд

    Доверительная вероятность Р – это такая
    вероятность, что событие 1-Р – можно считать
    невозможным.
    Признана достаточной для уверенного
    суждения о генеральных параметрах на основании
    известных выборочных показателей.
    Обычно в качестве доверительных используют
    вероятности, близкие к 1. Тогда событие, что
    генеральный параметр попадет в этот интервал
    будет практически достоверным.
    Уровень значимости = уровень ошибки ,

  • В жизни: Гипотеза (hypothesis) H– предположение, описывающее возможную вза...

    29 слайд

    В жизни: Гипотеза (hypothesis) H
    – предположение, описывающее
    возможную взаимосвязь между событиями.
    В науке: Гипотеза – предположение,
    вызывающее сомнение!
    В математической статистике:
    Гипотеза – предположение, которое
    вызывает сомнение, и которое мы собираемся
    проверять!
    Статистическая гипотеза – это всякое
    высказывание о генеральной! (всегда!)
    совокупности, проверяемое по выборке!
    Статистическая проверка гипотез.

  • Например: Статистическая гипотеза – это 
предположение о виде неизвестного 
р...

    30 слайд

    Например: Статистическая гипотеза – это
    предположение о виде неизвестного
    распределения или о параметрах
    известного распределения.
    Тест:
    Какая гипотеза, из нижеприведенных,
    является статистической?
    1. Генеральная совокупность распределена
    по нормальному закону.
    2. Зимой на экзамене я, может быть,
    получу “4”.
    3. Генеральные дисперсии равны
    4. Летом, может быть, я поеду на море.
    Ответ: 1, 3.

  • Общая постановка задачи 
проверки гипотезПроверка гипотезы – это процедура со...

    31 слайд

    Общая постановка задачи
    проверки гипотез
    Проверка гипотезы – это процедура сопоставления
    высказанной гипотезы о генеральной совокупности
    с выборочными данными.
    Этапы проверки гипотезы (общая схема)
    1
    Выдвигают нулевую гипотезу H0. Это
    основная гипотеза.



    Сущность H0: разница между сравниваемыми
    генеральными параметрами = 0, и различия,
    наблюдаемые между выборочными данными носят
    случайный! характер.
    2
    Формулируют альтернативную гипотезу H1,
    конкурирующую с H0. Это логическое
    отрицание H0.

  • 3Задаются уровнем значимости критерия α.
Уровень значимости критерия α – это...

    32 слайд

    3
    Задаются уровнем значимости критерия α.
    Уровень значимости критерия α – это
    вероятность ошибки отвергнуть H0, если
    на самом деле она верна.
    Откуда ошибка?
    Решение о справедливости H0 принимается по
    выборочным данным, т.е. по ограниченному ряду
    наблюдений. оно может быть ошибочным.
    α задается заранее! малым числом.
    Почему малым?
    Потому что это вероятность ошибочного заключения.
    Каким малым числом?
    Обычно это стандартное значение
    Но можно выбрать более ограничивающее
    ВОПРОС:
    ВОПРОС:
    ВОПРОС:

  • (из выборочных данных). Для проверки H0 
вычисляют величину критерия К,
отвеч...

    33 слайд

    (из выборочных данных). Для проверки H0
    вычисляют величину критерия К,
    отвечающего H0.
    Статистический критерий – это правило, позволяющее
    основываясь только на
    выборке принять или
    отвергнуть H0.
    Критерий – это случайная величина, которая служит
    для проверки H0. Эти функции распределения
    табулированы и приводятся в специальных таблицах
    для различных степеней свободы f (или объема
    выборки n) и разных α.
    4
    5
    или
    (из таблиц).
    По таблице известного распределения вероятности определяют критическое значение, превышение которого при справедливости H0 маловероятно.

  • 6Сравнение 

и7Интерпретация или ВыводыРазличие
незначимо     Различие
     з...

    34 слайд

    6
    Сравнение


    и
    7
    Интерпретация или Выводы
    Различие
    незначимо
    Различие
    значимо


    Это в случае использования параметрических! критериев.
    Если непараметрический критерий, то наоборот.
    Как понимать термин “параметрический критерий”?
    ВОПРОС:

  • Проверка гипотез относительно среднихОдна серия
экспериментовДругая серия,
на...

    35 слайд

    Проверка гипотез относительно средних
    Одна серия
    экспериментов
    Другая серия,
    например, контроль
    Средний
    результат
    отличается
    это расхождение случайно или оно вызвано
    некоторыми закономерностями?
    Возникает вопрос:

  • 1или234Для проверки      можно
использовать параметрический 
критерий Стьюден...

    36 слайд

    1
    или
    2
    3
    4
    Для проверки можно
    использовать параметрический
    критерий Стьюдента, если
    выполняются следующие
    Требования к критерию
    Стьюдента (t-критерий)



    2
    1
    НЗР
    По выборочным данным
    рассчитываем , отвечающее .
    Общая схема
    проверки гипотезы:
















    1
    Выдвигаем
    2
    3
    Задаем
    4
    Рассчитываем
    (по выборке)
    5
    Находим
    (из таблиц)
    6
    7
    Сравниваем
    и
    Выводы
    Выдвигаем

  • Это отношение имеет t-распределение Стьюдента с
                        степе...

    37 слайд

    Это отношение имеет t-распределение Стьюдента с
    степенями свободы.
    5
    По таблице известного распределения находим
    1908г.
    6
    Сравниваем
    Различие недостоверно.
    Если
    Если
    Различие достоверно
    Различие значимо
    Выводы:

  • t-критерий Стьюдента1876-1937

    38 слайд

    t-критерий Стьюдента
    1876-1937

  • 39 слайд

Получите профессию

Интернет-маркетолог

за 6 месяцев

Пройти курс

Рабочие листы
к вашим урокам

Скачать

Скачать материал

Найдите материал к любому уроку, указав свой предмет (категорию), класс, учебник и тему:

6 651 169 материалов в базе

Скачать материал

Другие материалы

РАБОЧАЯ ПРОГРАММА Учебной дисциплины «ОП.09 Информационные технологии в профессиональной деятельности»
  • Учебник: «Информатика (базовый уровень)», Семакин И.Г., Хеннер Е.К., Шеина Т.Ю.
  • Тема: Глава 1. Информационные системы и базы данных
  • 02.01.2021
  • 593
  • 8
«Информатика (базовый уровень)», Семакин И.Г., Хеннер Е.К., Шеина Т.Ю.

Вам будут интересны эти курсы:

Оставьте свой комментарий

Авторизуйтесь, чтобы задавать вопросы.

  • Скачать материал
    • 28.02.2020 2330
    • PPTX 859.8 кбайт
    • 39 скачиваний
    • Оцените материал:
  • Настоящий материал опубликован пользователем Илюхина Светлана Викторовна. Инфоурок является информационным посредником и предоставляет пользователям возможность размещать на сайте методические материалы. Всю ответственность за опубликованные материалы, содержащиеся в них сведения, а также за соблюдение авторских прав несут пользователи, загрузившие материал на сайт

    Если Вы считаете, что материал нарушает авторские права либо по каким-то другим причинам должен быть удален с сайта, Вы можете оставить жалобу на материал.

    Удалить материал
  • Автор материала

    Илюхина Светлана Викторовна
    Илюхина Светлана Викторовна
    • На сайте: 3 года и 3 месяца
    • Подписчики: 0
    • Всего просмотров: 87586
    • Всего материалов: 228

Ваша скидка на курсы

40%
Скидка для нового слушателя. Войдите на сайт, чтобы применить скидку к любому курсу
Курсы со скидкой

Курс профессиональной переподготовки

Копирайтер

Копирайтер

500/1000 ч.

Подать заявку О курсе

Курс профессиональной переподготовки

Разработка и сопровождение требований и технических заданий на разработку и модернизацию систем и подсистем малого и среднего масштаба и сложности

Системный аналитик

600 ч.

9840 руб. 5900 руб.
Подать заявку О курсе
  • Сейчас обучается 64 человека из 34 регионов
  • Этот курс уже прошли 83 человека

Курс повышения квалификации

Компьютерная грамотность для пенсионеров

36 ч. — 180 ч.

от 1580 руб. от 940 руб.
Подать заявку О курсе
  • Этот курс уже прошли 19 человек

Курс профессиональной переподготовки

Информатика: теория и методика преподавания в профессиональном образовании

Преподаватель информатики

300/600 ч.

от 7900 руб. от 3950 руб.
Подать заявку О курсе
  • Сейчас обучается 48 человек из 21 региона
  • Этот курс уже прошли 148 человек

Мини-курс

Профориентация детей и подростков

4 ч.

780 руб. 390 руб.
Подать заявку О курсе
  • Сейчас обучается 36 человек из 17 регионов
  • Этот курс уже прошли 36 человек

Мини-курс

Психология и педагогика в работе с подростками

5 ч.

780 руб. 390 руб.
Подать заявку О курсе
  • Сейчас обучается 56 человек из 31 региона
  • Этот курс уже прошли 25 человек

Мини-курс

Эффективная самопрезентация

4 ч.

780 руб. 390 руб.
Подать заявку О курсе
  • Сейчас обучается 52 человека из 31 региона
  • Этот курс уже прошли 32 человека