Основные статистические характеристики. Аналитический анализ. Основные статистические характеристики ряда измерений. Числовые характеристики статистического ряда

Основные статистические характеристики. Аналитический анализ. Основные статистические характеристики ряда измерений. Числовые характеристики статистического ряда

Молчанов Сергей

Статистика знает всё»,- утверждали Ильф и Петров в своем знаменитом романе «Двенадцать стульев» и продолжали: «Известно, сколько какой пищи съедает в год средний гражданин республики... Известно, сколько в стране охотников, балерин... станков, велосипедов, памятников, маяков и швейных машинок... Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!..» Зачем нужны эти таблицы, как их составлять и обрабатывать, какие выводы на их основании можно делать – на эти вопросы отвечает статистика (от итальянского stato – государство, латинского status – состояние).Статистика - наука, изучающая, обрабатывающая и анализирующая количественные данные о самых разнообразных массовых явлениях в жизни.

Цели работы:Сформировать представление о статистических исследованиях, обработки данных и интерпретации результатов.

Скачать:

Предварительный просмотр:

«Статистика знает всё»,— утверждали Ильф и Петров в своем знаменитом романе «Двенадцать стульев» и продолжали: «Известно, сколько какой пищи съедает в год средний гражданин республики... Известно, сколько в стране охотников, балерин... станков, велосипедов, памятников, маяков и швейных машинок... Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!..» Зачем нужны эти таблицы, как их составлять и обрабатывать, какие выводы на их основании можно делать - на эти вопросы отвечает статистика (от итальянского stato - государство, латинского status - состояние).

Статистика — наука, изучающая, обрабатывающая и анализирующая количественные данные о самых разнообразных массовых явлениях в жизни.

Цели работы:

Сформировать представление о статистических исследованиях, обработки данных и интерпретации результатов.

Сбор статистической информации, обработка и анализ результатов с точки зрения, что математическое образование- необходимый элемент развития.

Задачи работы:

Составить наглядную картину математического образования в классе.

Сформировать представление о возможности описания и обработки данных с помощью различных статистических характеристик.

Управление и прогнозирование дальнейшего развития математического образования..

Гипотеза. Статистика позволяет выявить проблемы математического образования в нашем классе.

Актуальность: Повышение мотивации при обучении математическим наукам, связь с конкретными жизненными ситуациями. Умение сбора, обработки и анализа статистических данных при приведении исследовательской работы.

План:

I. Введение:

История развития статистики.

Статистические характеристики.

II. Исследовательская работа:

Анкета.

Таблица всех данных.

Диаграммы и выводы (размахи, моды, частоты, полигоны частот, среднее арифметическое).

Общий вывод:.

История статистики .

Статистика имеет многовековую историю. Уже в древний период истории человечества хозяйственные и военные нужды требовали наличия данных о населении, его составе, имущественном положении. С целью налогообложения организовывались переписи населения, производился учет земель.

Первая публикация по статистике - это «Книга Чисел» в Библии, в Ветхом Завете, в которой рассказано о переписи военнообязанных, проведенной под руководством Моисея и Аарона.

Впервые термин «статистика» мы находим в художественной литературе - в «Гамлете» Шекспира (1602 г., акт 5, сцена 2). Смысл этого слова у Шекспира - знать, придворные.

Вначале под статистикой понимали описания экономического и политического состояния государства или его части. Например, к 1792 г. относится определение: «статистика описывая состояния государства в настоящее время или в некоторый известный момент в прошлом». В настоящее время деятельность государственных статистических служб вполне укладывается в это определение.

Однако постепенно термин «статистика» стал использоваться более широко. По Наполеону Бонапарту, «статистика - это бюджет вещей». Согласно формулировке 1833 г. «Цель статистики заключается в представлении фактов в наиболее сжатой форме».

Приведем еще два высказывания.

Статистика состоит в наблюдении явлений, которые смогут быть, подчинены или выражены посредством чисел (1895 г.).

Статистика - это численное представление фактов из любой области исследования в их взаимосвязи.

Со временем собирание данных о массовых общественных явлениях приобрело регулярный характер.

С середины XIX в. благодаря усилиям великого бельгийского ученого-математика, астронома и статистика Адольфа Кетле (1796-1874 гг.) были выработаны правила переписей населения и установлена регулярность их проведения в развитых странах. Для координации развития статистики по инициативе А. Кетле проводились международные статистические конгрессы, а в 1885 г. был основан Международный статистический институт, существующий и сейчас.

Становление государственной статистики в России можно отнести к концу XII - началу XIII в., хотя первые переписи земель и населения с постоянно усложнявшейся программой проводились еще в Киевской Руси (IX - XII вв.). Реформы Петра I (1672-1725), которыми были охвачены все основные направления общественной жизни: экономика страны, административное управление, армия, культура и быт населения, а также войны вызывали потребность в полном и точном учете материальных ресурсов и населения. В этот период высший правительственный орган - Сенат - через систему коллегий не только руководил экономикой страны, но и являлся центром по проведению важнейших статистических работ, там собирались полученные материалы обследований, отчеты подведомственных коллегиям производств и заведений, а также местной администрации.

Петровская реформа налоговой системы связана с появлением новой единицы, ею стала «душа» мужского пола, что потребовало подушной переписи населения - ревизии. Первая ревизия была объявлена 26 ноября 1718 г., ревизию проводила армия.

В начале XIII в. в России зарождался и текущий учет населения. Так, в 1702 г. был издан указ о подаче в Патриарший Духовный приказ приходскими священниками недельных ведомостей о родившихся и умерших. В первой половине XIII в. проводились уже переписи рабочих фабрик и мануфактур.

Первая половина XIX в. связана с новым этапом в развитии отечественной статистики. В сентябре 1802 г. в соответствии с Высочайшим манифестом императора Александра I вводится письменная отчетность министерств. Так началось операционно-структурное оформление государственной статистики в России. Этот год принято считать годом рождения российской государственной статистики.

В 1811 г. впервые был создан официальный центр правительственной статистики - Статистическое отделение при Министерстве внутренних дел; сюда поступала отчетность губерний. Первым руководителем Статистического отделения был К.Ф. Герман.

Российские ученые внесли большой вклад в развитие статистической науки. Большое значение, например, имеет работа Д.П. Журавского «Об источниках и употреблении статистических сведений», изданная в 1846 году. Определив статистику как «счет по категориям», Журавский отмечал, что статистика необходима для «изучения всего, относящегося к человеку». Журавский определил важнейшие разделы социальной статистики:

статистика народонаселения - необходимость его исчисления по классам и занятиям;

изучение народного быта, жилища, питания;

статистика театров, клубов, дворянских собраний, народных увеселений;

статистика учреждений, охраняющих права собственности;

статистика нищеты, бедности, сиротства;

статистика самоубийств с указанием средств, причин, званий, возраста и прочих характеристик лиц, лишивших себя жизни.

Во всех предложениях Д.П. Журавский проводил идею как можно более точного и полного выявления дифференциации людей по условиям их жизни, по состоятельности.

Особое место в истории российской статистики принадлежит земской статистике. При земствах, органах местного самоуправления, с середины 70-х годов XIX века были созданы специальные статистические бюро. Земские статистики собирали и разрабатывали огромный статистический материал, который использовался для глубоких экономических и социальных исследований пореформенной России. Работа земской статистики характеризуется не только сбором и разработкой статистических данных, но и развитием статистической методологии.

Видными земскими статистиками были В.И. Орлов, П.П. Червинский, Ф.А. Щербина, А.П. Шликевич.

В 90-х годах были созданы фабрично-заводские инспекции, которые вели текущую статистику, разрабатывали данные по статистике труда, в том числе о составе рабочей силы, несчастных случаях, стачках и др.

Стала развиваться промышленная статистика. Под руководством В.Е. Варзара в 1900, 1908 и 1912 гг. были проведены первые переписи промышленности.

Начальный этап советской статистики (1917-1930 гг.) отличается исключительной интенсивностью: проводится большое число специально организованных, статистических

переписей и обследований, плодотворно работают различные научные коллективы, строится первый баланс народного хозяйства.

Последующее развитие советской статистики тормозилось созданием в 30-е годы административно-бюрократической системы, массовыми репрессиями, в том числе и лучших экономистов и статистиков (Н.Д. Кондратьева, А.В. Чаянова, В.Г. Громана, О.А. Квитнина и многих других).

В это время формируются отраслевые статистики, складывается система объемных показателей, скрывающая негативные тенденции в развитии народного хозяйства. Активно разрабатываются и качественные статистические показатели (индексы производительности труда, себестоимости и др.). Статистика подчиняется решению оперативных задач, оценке выполнения плана в ущерб ее аналитическим функциям.

В годы Великой Отечественной войны перед советской статистикой стояли задачи по оперативному учету трудовых, материальных ресурсов, перемещение производственных сил страны в восточные районы.

После войны роль и значение статистики возросли: развернулись балансовые работы, углубилась теория индексного метода и расширилась практика его применения, получили распространение экономико-математические модели и методы, развитие прикладной статистики.
Слово «статистика» часто ассоциируется со словом «математика», и это пугает студентов, связывающих это понятие со сложными формулами, требующими высокого уровня абстрагирования.

Однако, как говорит Мак-Коннелл, статистика — это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статистикой. Хотим ли мы спланировать бюджет, рассчитать потребление бензина автомашиной, оценить усилия, которые потребуются для усвоения какого-то курса, с учетом полученных до сих пор отметок, предусмотреть вероятность хорошей и плохой погоды по метеорологической сводке или вообще оценить, как повлияет то или иное событие на наше личное или совместное будущее, — нам постоянно приходится отбирать, классифицировать и упорядочивать информацию, связывать ее с другими данными так, чтобы можно было сделать выводы, позволяющие принять верное решение.

Все эти виды деятельности мало отличаются от тех операций, которые лежат в основе научного исследования и состоят в синтезе данных, полученных на различных группах объектов в том или ином эксперименте, в их сравнении с целью выяснить черты различия между ними, в их сопоставлении с целью выявить показатели, изменяющиеся в одном направлении, и, наконец, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты. Именно в этом заключается цель статистики в науках вообще, особенно в гуманитарных. В последних нет ничего абсолютно достоверного, и без статистики выводы в большинстве случаев были бы чисто интуитивными и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях.

Для того чтобы оценить огромные преимущества, которые может дать статистика, мы попробуем проследить за ходом расшифровки и обработки данных, полученных в эксперименте. Тем самым, исходя из конкретных результатов и тех вопросов, которые они ставят перед исследователем, мы сможем разобраться в различных методиках и несложных способах их применения. Однако, перед тем как приступить к этой работе, нам будет полезно рассмотреть в самых общих чертах три главных раздела статистики.

1. Описательная статистика, как следует из названия, позволяет описывать, подытоживать и воспроизводить в виде таблиц или графиков

2. Задача индуктивной статистики — проверка того, можно ли распространить результаты, полученные на данной выборке, на всю популяцию, из которой взята эта выборка. Иными словами, правила этого раздела статистики позволяют выяснить, до какой степени можно путем индукции обобщить на большее число объектов ту или иную закономерность, обнаруженную при изучении их ограниченной группы в ходе какого-либо наблюдения или эксперимента. Таким образом, при помощи индуктивной статистики делают какие-то выводы и обобщения, исходя из данных, полученных при изучении выборки.

3. Наконец, измерение корреляции позволяет узнать, насколько связаны между собой две переменные, с тем чтобы можно было предсказывать возможные значения одной из них, если мы знаем другую.

Существуют две разновидности статистических методов или тестов, позволяющих делать обобщение или вычислять степень корреляции. Первая разновидность — это наиболее широко применяемые параметрические методы, в которых используются такие параметры, как среднее значение или дисперсия данных. Вторая разновидность — это непараметрические методы, оказывающие неоценимую услугу в том случае, когда исследователь имеет дело с очень малыми выборками или с качественными данными; эти методы очень просты с точки зрения как расчетов, так и применения. Когда мы познакомимся с различными способами описания данных и перейдем к их статистическому анализу, мы рассмотрим обе эти разновидности.

  1. Модой называют число ряда, которое встречается в этом ряду наиболее часто. Можно сказать, что данное число самое «модное» в этом ряду.
  2. Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на их количество. Среднее арифметическое является важной характеристикой ряда чисел но иногда полёзно рассматривать и другие средние
  3. Одним из статистических показателей различия или разброса данных является размах.

Размах — это разность между наибольшим и наименьшим значениями ряда данных.

Медианой ряда, состоящего из нечетного количества чисел, называется число данного ряда, которое окажется посередине, если этот ряд упорядочить. Медианой ряда, состоящего из четного количества чисел, называется среднее арифметическое двух стоящих посередине чисел этого ряда.

Eсть более удобный способ нахождения среднего арифметического, а также других статистических характеристик — составление таблицы частот.

Виды и способы статистического наблюдения .

Статистическое наблюдение различается по видам и по источникам сведений.

Виды статистического наблюдения.

Систематическое наблюдение - текущее: наблюдение проводится на основе первичных документов, содержащих информацию, необходимую для достаточно полной характеристики изучаемого явления.

Статистическое наблюдение - периодическое. Примером может служить перепись населения.

Наблюдение, проводимое время от времени - единовременным.

Виды статистического наблюдения могут быть сплошными и не сплошными.

Сплошным называется наблюдение, учитывающее все без единицы изучаемой совокупности.

Не сплошное наблюдение ориентируется на учет некоторой достаточно массовой части единиц наблюдения.

В статистической практике применяются различные виды не сплошного наблюдения:

выборочное;

способ основного массива;

анкетное;

монографическое.

Качество не сплошного наблюдения уступает результатам сплошного.

Для получения представительной характеристики всей статистической совокупности по некоторой части ее единиц применяют выборочное наблюдение, основанное на научных принципах формирования выборочной совокупности. Случайный характер отбора единиц совокупности гарантирует беспристрастность результатов выборки.

Способы статистического наблюдения .

В зависимости от источников собираемых сведений различают наблюдение:

непосредственное,

документальное

опрос.

Непосредственным называют наблюдение, осуществляемое путем подсчета, измерения значений признаков, снятия показаний приборов специальными лицами, осуществляющими наблюдениями, иначе говоря - регистраторами.

Документальное наблюдение - это такое наблюдение, когда запись ответа на вопросы формуляра наблюдения производится на основании соответствующих документов.

Опрос - это наблюдение, при котором ответы на вопросы формуляра наблюдения записываются со слов опрашиваемого.

Сбор и группировка статистических данных.

Для изучения различных общественных и социально-экономических явлений, а также некоторых процессов, происходящих в природе, проводятся специальные статистические исследования. Всякое статистическое исследование начинается с целенаправленного сбора информации об изучаемом явлении или процессе. Этот этап называется этапом статистического наблюдения.

Для обобщения систематизации данных, полученных в ходе статистического наблюдения, их по какому-либо признаку разбивают на группы, и результаты группировки сводят в таблицы.

Наглядное представление статистической информации.

Для наглядного представления данных, полученных в результате статистического исследования, широко используются различные способы их изображения.

Одним из хорошо известных вам способов наглядного представления ряда данных является построение столбчатой диаграммы.

Столбчатые диаграммы используют тогда, когда хотят проиллюстрировать динамику изменения данных во времени или распределение данных, полученных в результате

Для наглядного изображения соотношения между частями исследуемой совокупности удобно использовать круговые диаграммы.

Для построения круговой диаграммы круг разбивается на секторы, центральные углы которых пропорциональны относительным частотам, определенным для каждой группы данных.

Динамику изменения статистических данных во времени часто иллюстрируют с помощью полигона. Для построения полигона отмечают в координатной плоскости точки, абсциссами которых служат моменты времени, а ординатами - соответствующие им статистические данные. Соединив последовательно эти точки отрезками, получают ломанную, которую называют полигоном.

Одна из основных задач статистики как раз и состоит в надлежащей обработке информации. Конечно, у статистики есть много других задач: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т. д. Ни одна из этих целей не достижима без обработки данных. Поэтому, первое, чем стоит заняться — это статистическими методами обработки информации.

В нашем классе решили выяснить, каков уровень знаний по теме «Решение систем линейных уравнений с двумя переменными», для чего составили специальную контрольную работу из шести заданий

В алфавитном списке учеников возле каждой фамилии проставили число верно решенных задач. Получился следующий ряд чисел:

Ф.И.

Кол-во задач

Агафонова Л

Башаров а

Гуселетов Д

Дармаева К

Коневин В

Коротков В

Криволапова М

Мисюркеев А

Мисюркеев В

Минеева Д

Михайлов А

Молчанова О

Молчанов С

Наумов С

Попов с

Постникова М

Реховская Ю

Сатаева Н

Тереньтьева Т

Ушакова Л

Чагдурова Н

ТОлстихин С

Разуваев А

Ангельский м

На основании этого ряда трудно сделать какие-либо определенные выводы о том, как справились с работой. Чтобы удобнее было анализировать информацию, в подобных случаях числовые данные ранжируют, располагая их в порядке возрастания. В результате ранжирования ряд примет такой вид:

2; 2;

3; 3; 3; 3;

4; 4; 4; 4; 4; 4

5; 5; 5;5;5;5

6; 6; 6; 6;

Мы видим, что ряд разбился на 6 групп. Каждая группа представляет определенный результат эксперимента: решена одна задача, решены две задачи и т. д.

В нашей выборке частота появления события «семиклассник решил одну задачу» равна 1. Относительная частота этого события равна отношению его частоты к объему выборки, т. е. 1:23, или4,3 %. Для события «девятиклассник решил все задачи» частота равна 4, а относительная частота равна 4:23—, или 17,4%, и т. д.

Чтобы результаты легче воспринимались, их представляют в табличном и графическом виде.

………

Составив таблицу, полезно себя проверить: сложив все частоты, мы должны получить объем выборки, т. е. число 50, а сложив все относительные частоты, мы должны получить 100%.

Для графического представления данных на основе этой таблицы построим диаграмму частот.

С помощью ранжирования ряда, таблицы и графических иллюстраций мы уже получили первоначальные сведения о закономерностях интересующего нас ряда данных. Но вам известны такие статистические характеристики ряда данных, которые позволяют сделать более качественный статистический анализ.

Так, например, интересно знать наиболее типичный результат выполнения предложенной работы. Используя представленные в таблице данные, легко видеть, что наиболее часто встречающийся результат — «решены три задачи». Как вы знаете, на языке статистики это означает, что число 4 является модой данного числового ряда.

Также полезно найти среднее арифметическое этого ряда:

(1+2*2+3*4+4*6+5*6+6*4+:23=4.2Значит, можно сказать, что в среднем девятиклассник решает четыре задачи. (В данном случае среднее арифметическое ряда данных совпало с его модой, но, конечно, это происходит совсем не всегда.)

Этапы статистического исследования

К этапам статистического исследования относятся:

Статистическое наблюдение - массовый научно организованный сбор первичной информации об отдельных единицах изучаемого явления.

Группировка и сводка материала - обобщение данных наблюдения для получения абсолютных величин (учетно-оценочных показателей) явления.

Обработка статистических данных и анализ результатов для получения обоснованных выводов о состоянии изучаемого явления и закономерностях его развития.

Все этапы статистического исследования тесно связаны друг с другом и одинаково важны. Недостатки и ошибки, возникающие на каждой стадии, сказываются на все исследовании в целом. Поэтому правильное использование специальных методов статистической науки на каждом этапе позволяет получить достоверную информацию в результате статистического исследования.Методы статистического исследования:

Статистическое наблюдение;

Сводка и группировка данных;

Расчет обобщающих показателей (абсолютные, относительные и средние величины);

Статистические распределения (вариационные ряды);

Выборочный метод;

Корреляционно-регрессионный анализ;

Ряды динамики;

Индексы.

Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности. Можно выделить две основные задачи математической статистики:

Указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате поставленных экспериментов.

Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

М Этапы выполнения исследовательской работы:

I. Сбор данных.

Включает в себя:

Изучение поставленной задачи.

Определение значимых понятий.

Подбор источников информации.

Сбор информации.

II. Группировка данных.

Включает в себя:

Разделение данных в группы по признаку.

Построение таблицы данных.

III. Анализ данных.

Включает в себя:

Нахождение статистических характеристик.

Обобщение полученных результатов.

IV. Отчет.

Мы провели исследование в 7»а»и «б» классах о необходимости изучения математики.

Сбор данных: учащимся школы была предложена для заполнения анкета. /Приложение 1/

Группировка данных: по данным анкетирования была составлена таблица. /Приложение 2/

Анализ данных: результаты приведенные в таблице были представлены в виде диаграмм. /Приложение 3/

……

Обработанные данные можно использовать:

Для работы классных руководителей с семьей.

Для практического применения на уроках математики..

Для руководителей школы.

Литература:

Экономическая статистика. «Учебник», 2-е издание дополненное. Рекомендовано Министерством общего и профессионального образования РФ. Москва. ИНФРА-М. 2006 г. Авторы: Ю. Н. Иванов; С. Е. Казаринова и др. Под редакцией Ю. Н. Иванова, Доктора экономических наук.

Б.С.Э. Компьютерное издание 2006 г.

Республика Коми в России. Госкомстат России. Госкомстат Р.К. 2007 г.

Сыктывкар в цифрах. Госкомстат Р. К. 2007 г.

Типичная оценка (мода): 4 Позиция 2. Досуг учащихся

(Что чаще всего делают дети в свободное от уроков время)

Таблица социологического опроса

Занятия

Английский яз.

Компьютерные игры

Читают книги

Смотрят телевизор

Дзюдо (секция)

Волейбол (секция)

гуляют на улице

Кол-во учащихся

https://accounts.google.com


Подписи к слайдам:

в ыполнил:Молчанов Сергей 7»Б» Руководитель: Телешева Л.А.-учитель математики МОУ «Баргузинская сош» Статистические характеристики и исследования

Статистика знает все « Stato »-государство « Status »-состояние Статистика - наука, изучающая, обрабатывающая и анализирующая количественные данные о самых разнообразных массовых явлениях в жизни.

Сформировать представление о статистических исследованиях, обработки данных и интерпретации результатов. Сбор статистической информации, обработка и анализ результатов с точки зрения математического образования- необходимый элемент развития. цель исследования:

Составить наглядную картину математического образования в классе. Сформировать представление о возможности описания и обработки данных с помощью различных статистических характеристик. Управление и прогнозирование дальнейшего развития математического образования.. Задачи:

Статистика позволяет выявить проблемы математического образования в нашем классе. Гипотеза

: Повышение мотивации при обучении математическим наукам; связь с конкретными жизненными ситуациями: умение сбора, обработки и анализа статистических данных при приведении исследовательской работы. Актуальность

План: История статистики. Статистические характеристики. Исследование на тему: «Необходимость предметов математического цикла». Исследование на тему: «Любимое занятие в свободное время».

Первая публикация по статистике – это «Книга Чисел» в Библии, в Ветхом Завете, в которой рассказано о переписи военнообязанных, проведенной под руководством Моисея и Аарона.

Впервые термин «статистика» мы находим в художественной литературе – в «Гамлете» Шекспира (1602 г., акт 5, сцена 2). Смысл этого слова у Шекспира – знать, придворные.

статистика - это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. Мак-Коннелл

Разделы статистики описательная индуктивная корреляция

Основные статистические характеристики Среднее арифметическое Мода Размах Медиана

Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на их количество. Модой обычно называется число ряда, которое встречается в этом ряду наиболее часто.

Размах – это разность наибольшего и наименьшего значений ряда данных. Медианой – ряда, состоящего из нечётного количества чисел, называется число данного ряда, которое окажется посередине, если этот ряд упорядочить.

Виды статестического наблюдения Систематическое Статестическое(периодическое) Единовременное Сплошное Несплошное

№ Ф.И. Количество верно выполненных заданий 1 Агафонова Люда 3 2 Башаров Анлрей 6 3 Гуселетов Дима 4 4 Дармаева Ксения 4 5 Коневин Виталий 6 6 Коротков Володя 2 7 Криволапова Маша 5 8 Мисюркеев Алеша 3 9 Мисюркеев Володя 3 10 Минеева Даша 5 11 Михайлов А 5 12 Молчанова Оля 5 13 Молчанов С 6 14 Наумов П 6 15 Попов С 4 16 Постникова М 4 17 Реховская Юля 3 18 Сатаева Настя 5 19 Терентьева Таня 5 20 Ушакова Лена 5 21 Чагдурова Наташа 4 22 Толстихин Андрей 1 23 Разуваев Алеша 2 24 Ангельский Миша 4 Результат контрольной работы по теме "Решение систем линейных уравнений с двумя переменными"

Рассмотрим ряд чисел 3 6 4 4 6 2 5 3 3 5 5 5 6 6 4 4 3 5 5 5 4 1 2 4

В результате ранжирования ряд примет вид: 1; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4 5; 5; 5;5;5;5 6; 6; 6; 6;

Относительная частота события Мода 4 Медиана 4 Размах от 1 до 6 Среднее арифметическое (1+2*2+3*4+4*6+5*4+6*4):23=4,3

I. Сбор данных.: Изучение поставленной задачи. Определение значимых понятий. Подбор источников информации. Сбор информации. Анализ данных: результаты приведенные в таблице были представлены в виде диаграмм. II. Группировка данных. Разделение данных в группы по признаку. Построение таблицы данных. III. Анализ данных. Нахождение статистических характеристик. Обобщение полученных результатов. IV. Отчет.

Необходимость изучения математики исследование №1

Какой школьный предмет нравится больше всего? _________________- Какой школьный предмет лёгок в изучении? ______________________ Какой предмет труднее всего дается в изучении? __________________ Сколько часов в день вы тратите на приготовление домашнего задания?_____________________________________________________ Нравится ли вам математика?___________________________________ Нужна ли вам математика в будущем? ____________________________ Нужна ли Вам помощь при выполнении домашних заданий по предметам математического цикла?_______________________________________________________ Как Вы оцениваете свои знания по математике? Имею отметку___________________… Знаю на_______________________….. Могу на…________________________ Что является, на Ваш взгляд, причиной неуспехов или неудач, если они случаются?________________________________________ __________________________________________________________Хотите ли Вы улучшить свои результаты по предметам математического цикла?____________________________________ _________________________________________________________

Вопрос 1 Какой школьный предмет нравится более всего?

Вопрос 2 Какой школьный предмет самый трудный в изучении?

Вопрос 3 Сколько всего времени тратите на выполнение домашнего задания по математике?

Вопрос 4 Нравится ли тебе заниматься изучением математики?

Нужна ли математика в будущей вашей профессии? Да -100%

Нужна ли тебе помощь при выполнении домашнего задания по математике

Кто тебе помогает разобрать трудную тему по математике? Мама -45% Учитель-35 % Учебник -20% Папа-15% Бабушк10% Сестра-10% Друзья-5% Никто-5%

Как ты оцениваешь свои знания по математике?

Хочешь ли заниматься по математике еще лучше

Мотивация учебной деятельности исследование №3

Вид деятельности Ежедневно Несколько раз в неделю В воскресенье 1 Читаю газеты и журналы 2 Читаю художественную литературу 5 Хожу на вечера отдыха 6 Смотрю кино передачи 7 Играю в спортивные игры 8 Занимаюсь общественной работой 9 Занимаюсь охотой, рыбалкой

11 Занимаюсь художественной самодеятельностью 12 Хожу в походы 13 Занимаюсь радиоделом 14 Занимаюсь шитьём, рукоделием 15 Учусь играть на музыкальном инструменте 16 Слушаю музыку, делаю записи 17 Увлекаюсь коллекционированием 18 Увлекаюсь танцами, хожу на дискотеки 19 Люблю что-нибудь изготовить своими руками 20 Вожусь с животными

21 В свободное время помогаю родителям 22 Провожу время безо всякой цели 23 В свободное время работаю 24 (Если занят в свободное время ещё чем-то, допиши здесь!)

Ежедневно

Несколько раз в неделю

В воскресенье

Вывод: Таким образом, ученики нашего класса ежедневно чаще всего слушают музыку, помогают родителям, смотрят телевизор,; несколько раз в неделю - занимаются спортом и делают что-нибудь своими руками,; в воскресенье – читают и играют на компютере, смотрят телевизор

Заключение: И так, на примере моей исследовательской работы вы убедились, что статистические характеристики и исследования играют значительную роль в нашей жизни и используются не только в математике, но и в других отраслях науки.

Спасибо за внимание

Тема 2.1. Основы статистической обработки опытных данных в агрономических исследованиях. Статистические характеристики количественной и качественной изменчивости

План.

  1. Основы статистики
  2. Статистические характеристики количественной изменчивости
  3. Типы статистического распределения
  4. Методы проверки статистических гипотез

1. Основы статистики

Окружающий нас мир насыщен информацией - разнообразные потоки данных окружают нас, захватывая в поле своего действия, лишая правильного восприятия действительности. Не будет преувеличением сказать, что информация становится частью действительности и нашего сознания.

Без адекватных технологий анализа данных человек оказывается беспомощным в жестокой информационной среде и скорее напоминает броуновскую частицу, испытывающую жесткие удары со стороны и не имеющую возможности рационально принять решение.

Статистика позволяет компактно описать данные, понять их структуру, провести классификацию, увидеть закономерности в хаосе случайных явлений. Даже простейшие методы визуального и разведочного анализа данных позволяют существенно прояснить сложную ситуацию, первоначально поражающую нагромождением цифр.

Статистическое описание совокупности объектов занимает промежуточное положение между индивидуальным описанием каждого из объектов совокупности, с одной стороны, и описанием совокупности по её общим свойствам, совсем не требующим её расчленения на отдельные объекты, - с другой. По сравнению с первым способом статистические данные всегда в большей или меньшей степени обезличены и имеют лишь ограниченную ценность в случаях, когда существенны именно индивидуальные данные (например, учитель, знакомясь с классом, получит лишь весьма предварительную ориентировку о положении дела из одной статистики числа выставленных его предшественником отличных, хороших, удовлетворительных и неудовлетворительных оценок). С другой стороны, по сравнению с данными о наблюдаемых извне суммарных свойствах совокупности статистические данные позволяют глубже проникнуть в существо дела. Например, данные гранулометрического анализа породы (то есть данные о распределении образующих породу частиц по размерам) дают ценную дополнительную информацию по сравнению с испытанием нерасчленённых образцов породы, позволяя в некоторой мере объяснить свойства породы, условия её образования и прочее.

Метод исследования, опирающийся на рассмотрение статистических данных о тех или иных совокупностях объектов, называется статистическим. Статистический метод применяется в самых различных областях знания. Однако черты статистического метода в применении к объектам различной природы столь своеобразны, что было бы бессмысленно объединять, например, социально-экономическую статистику, физическую статистику.

Общие черты статистического метода в различных областях знания сводятся к подсчёту числа объектов, входящих в те или иные группы, рассмотрению распределения количеств, признаков, применению выборочного метода (в случаях, когда детальное исследование всех объектов обширной совокупности затруднительно), использованию теории вероятностей при оценке достаточности числа наблюдений для тех или иных выводов и т. п. Эта формальная математическая сторона статистических методов исследования, безразличная к специфической природе изучаемых объектов, и составляет предмет математическая статистика

Связь математической статистики с теорией вероятностей имеет в разных случаях различный характер. Теория вероятностей изучает не любые явления, а явления случайные и именно «вероятностно случайные», то есть такие, для которых имеет смысл говорить о соответствующих им распределениях вероятностей. Тем не менее, теория вероятностей играет определённую роль и при статистическом изучении массовых явлений любой природы, которые могут не относиться к категории вероятностно случайных. Это осуществляется через основанные на теории вероятностей теорию выборочного метода и теорию ошибок измерений. В этих случаях вероятностным закономерностям подчинены не сами изучаемые явления, а приёмы их исследования.

Более важную роль играет теория вероятностей при статистическом исследовании вероятностных явлений. Здесь в полной мере находят применение такие основанные на теории вероятностей разделы математической статистики, как теория статистической проверки вероятностных гипотез, теория статистической оценки распределений вероятностей и входящих в них параметров и так далее. Область же применения этих более глубоких статистических методов значительно уже, так как здесь требуется, чтобы сами изучаемые явления были подчинены достаточно определённым вероятностным закономерностям.

Вероятностные закономерности получают статистическое выражение (вероятности осуществляются приближённо в виде частот, а математические ожидания - в виде средних) в силу больших чисел закона.

Чтобы выявить и оценить лучшие агротехнические приемы и сорта, изучаемые в полевом опыте, применяют статистическую обработку данных опыта, представленных в виде поделяночных числовых показателей урожайности и других свойств и качеств подопытных растений. Эти показатели характеризуют изучаемое явление и отражают результат действия исследуемых факторов, проявившихся в конкретном месте за определенный период времени, со всеми искажениями, отступлениями от истинных данных вследствие различных причин, наблюдавшихся во время проведения опыта.

Статистика в широком понимании может быть определена как наука о количественном анализе массовых явлений природы и общества, служащем для выявления их качественных своеобразий.

Статистикой называется отрасль знаний, объединяющая принципы и методы с числовыми данными, характеризующими массовые явления. В этом смысле статистика включает в себя нескольких самостоятельных дисциплин: общую теорию статистики как вводный курс, теорию вероятностей и математическую статистику как науки об основных категориях и математических свойствах генеральной совокупности и их выборочных оценках.

Слово «статистика» происходит от латинского слова status - состояние, положение вещей. Первоначально оно употребляется в значении «политическое состояние». Отсюда итальянское слово stato – государство и statista – знаток государства. В научный обиход слово «статистика» вошло в 18 веке и первоначально употреблялось как «государствоведение».

В настоящее время статистика может быть определена как собирание массовых данных, их обобщение, представление, анализ и интерпретация. Это особый метод, который используется в различных сферах деятельности, в решении разнообразных задач.

Статистика позволяет выявить и измерить закономерности развития социально-экономических явлений и процессов, взаимосвязи между ними. Познание закономерностей возможно только в том случае, если изучаются не отдельные явления, а совокупности явлений, поскольку закономерности проявляются в полной мере, лишь в массе явлений. В каждом отдельном явлении необходимое – то, что присуще всем явлениям данного вида, проявляется в единстве со случайным, индивидуальным, присущим лишь этому конкретному явлению.

Закономерности, в которых необходимость неразрывно связана в каждом отдельном явлении со случайностью и лишь во множестве явлений проявляет себя закон, называются статистическими.

Соответственно предметом статистического изучения всегда выступают совокупности тех или иных явлений, включающие все множество проявлений исследуемой закономерности. В большой совокупности индивидуальные разнообразия взаимнопогашаются, и на первый план выходят закономерные свойства. Поскольку статистика призвана выявлять закономерное, она, опираясь на данные о каждом отдельном проявлении изучаемой закономерности, обобщает их и таким образом получает количественное выражение этой закономерности.

Каждый шаг исследования завершается интерпретацией полученных результатов: какое заключение можно сделать исходя из проведенного анализа, что говорят цифры – подтверждают ли они исходные предположения или открывают что-то новое? Интерпретация данных ограничена исходным материалом. Если заключения основаны на данных выборки, то она должна быть репрезентативной, чтобы выводы были отнесены к совокупности в целом. Статистика позволяет выяснить все то полезное, что содержится в исходных данных и определить, что и как можно использовать в принятии решений.

Термин вариационная статистика был введен в 1899году Дункером для обозначения методов математической статистики, применяемых при изучении некоторых биологических явлений. Несколько ранее, в 1889 году, Ф. Гальтоном был введен другой термин – биометрия (от греческих слов «биос» - жизнь и «метрейн» - измерять), обозначавший применение некоторых методов математической статистики при изучении наследственности, изменчивости и других биологических явлений. Основываясь на теории вероятностей, вариационная статистика позволяет правильно подойти к анализу количественного выражения изучаемых явлений, дать критическую оценку достоверности полученных количественных показателей, установить характер связи между изучаемыми явлениями, а, следовательно, понять их качественное своеобразие.

Важно помнить, что всякий биологический объект обладает изменчивостью. Т.е. каждый из признаков (высота растений, число зерен в колосе, содержание элементов питания) у различных особей может иметь различную степень выраженности, что свидетельствует о колеблемости или варьировании признака.

При статистическом методе исследования внимание сосредоточено не на отдельном объекте, а на группе однородных объектов, т.е. на некоторой их совокупности, объединенных для совместного изучения. Некоторое количество однородных единиц, расположенных по какому-либо одному или нескольким изменяющимся признакам, называется статистической совокупностью.

Статистические совокупности делятся на:

  1. генеральные
  2. выборочные

Генеральная совокупность объединяет все возможные изучаемые однородные единицы, например, растения на поле, популяции вредителей на поле, возбудители болезней растений. Выборочная совокупность представляет собой некоторую часть единиц, взятых из общей совокупности и попавших на проверку. При изучении, например, урожайности яблонь определенного сорта генеральную совокупность представляют все деревья данного сорта, возраста, произрастающие в определенных однородных условиях. Выборочная совокупность состоит из некоторого количества деревьев яблони, взятых на пробных площадках в изучаемых насаждениях.

Совершенно очевидно, что при статистических исследованиях приходится иметь дело исключительно с выборочными совокупностями. Правильность суждений о свойствах генеральной совокупности на основании анализа выборочной совокупности, прежде всего, зависит от ее типичности. Таким образом, чтобы выборка действительно отражала характерные свойства генеральной совокупности, выборочная совокупность должна объединять достаточное количество однородных единиц, обладающих свойством репрезентативности . Репрезентативность достигается случайным отбором вариант из генеральной совокупности, что обеспечивает равную возможность для всех членов генеральной совокупности попасть в состав выборки.

Статистическое изучение тех или иных явлений в своей основе имеет анализ изменчивости показателей или величин, входящих в состав статистических совокупностей. Статистические величины могут принимать разные значения, обнаруживая при этом в своей изменчивости некоторую закономерность. В связи с этим статистические величины можно определить как величины, принимающие различные значения с определенными вероятностями.

В процессе наблюдений или проведения опытов мы сталкиваемся с различными по своему роду изменчивыми показателями. Одни из них носят ярко выраженный количественный характер и легко поддаются измерениям, другие же не могут быть выражены обычным количественным путем и носят типичный качественный характер.

В связи с этим различают два типа изменчивости или варьирования:

  1. количественная
  2. качественная

2. Статистические характеристики количественной изменчивости

В качестве примера количественной изменчивости следует отнести: изменчивость количества колосков в колосе пшеницы, изменчивость размеров и веса семян, содержания в них жиров, белков и т.д. Примером качественного варьирования служат: изменение окраски или опушенности различных органов растения, гладкий и морщинистый горох, обладающий зеленой или желтой окраской, различная степень пораженности растений болезнями и вредителями.

Количественное варьирование в свою очередь может быть разделено на два рода: варьирование непрерывное и прерывистое .

Непрерывное варьирование объединяет случаи, когда изучаемые совокупности состоят из статистических единиц, определяемых измерениями или вычислением на основе этих измерений. Примером непрерывного варьирования можно выразить: вес и размеры семян, длина междоузлий, урожайность сельскохозяйственных культур. Во всех этих случаях изучаемые количественные показатели теоретически могут принимать все возможные значения, как целые, так и дробные между крайними своими пределами. Переход от крайнего минимального значения к максимальному теоретически является постепенным и может быть представлен сплошной линией.

При прерывистом варьировании отдельные статистические величины представляют собой совокупность отдельных элементов, выражаемую уже не измерением и не вычислением, а счетом. Примером такого варьирования могут служить изменение числа семян в плодах, числа лепестков в цветке, числа деревьев на единице площади, числа початков кукурузы на одном растении. Такого типа прерывистые варьирования называются также иногда целыми, потому, что отдельные статистические величины приобретают вполне определенные целые значения, в то время как при непрерывном варьировании эти величины могут выражаться и целыми, и дробными значениями.

Основными статистическими характеристиками количественной изменчивости являются следующие:

1.Средняя арифметическая;

Показатели изменчивости признака:

2. дисперсия;

3. стандартное отклонение;

4. коэффициент вариации;

5. Стандартная ошибка средней арифметической;

6. Относительная ошибка.

Cреднее арифметическое . При изучении варьирущих количественных показателей основной сводной величиной является их среднее арифметическое значение. Среднее арифметическое служит как для суждения об отдельных изучаемых совокупностях, так и для сравнения соответствующих совокупностей друг с другом. Полученные средние значения являются основой для построения выводов и для разрешения тех или иных практических вопросов.

Для вычисления среднего арифметического используют следующую формулу: если сумму всех вариант (x 1 + x 2 + … + x n) обозначить через Σ x i , число вариантов - через n, то средняя арифметическая определяется:

x ср. =Σ x i / n)

Среднее арифметическое дает первую общую количественную характеристику изучаемой статистической совокупности. При разрешении ряда теоретических и практических вопросов, наряду со знанием среднего значения анализируемого показателя, возникает необходимость в дополнительном установлении характера распределения вариант около этого среднего.

Объктам сельскохозяйственных и биологических исследований свойственна изменчивость признаков и свойств во времени и в пространстве. Причинами ее являются как внутренние, наследственные особенности организмов, так и различная норма их реакции на условия внешней среды.

Выявление характера рассеяния – одна из основных задач статистического анализа опытных данных, который позволяет не только оценить степень разброса наблюдений, но и использовать эту оценку для анализа и интерпретации результатов исследования.

Характер группировки вариант около их среднего значения, называемый также рассеянием, может служить показателем степени изменчивости изучаемого материала. Показатели изменчивости. Лимиты (размах варьирования) – это минимальное и максимальное значения признака в совокупности. Чем больше разность между ними, тем изменчивее признак.

Дисперсия S 2 и стандартное отклонение S . Эти статистические характеристики являются основными мерами вариации (рассеяния) изучаемого признака. Дисперсия (средний квадрат) – это частное от деления суммы квадратов отклонений Σ (x –x) 2 на число всех измерений без единицы:

Σ (x – x) 2 / n -1

Стандартное, или среднее квадратическое, отклонение получают путем извлечения квадратного корня из дисперсии:

S = √ S 2

Стандартное отклонение характеризует собой степень изменчивости изучаемого материала, меру степени влияния на признак различных второстепенных причин его варьирования, выраженных в абсолютных мерах, т.е. в тех же единицах измерения, что и отдельные значения вариант. В связи с этим стандартное отклонение может быть использовано только при сравнении изменчивости статистических совокупностей, варианты которых выражены в одинаковых единицах измерения.

В статистике принято считать, что диапазон изменчивости в совокупностях достаточно большого объема, которые находятся под постоянным влиянием множества разнообразных и разнонаправленных факторов (биологические явления), не выходят за пределы 3S от среднего арифметического значения. О таких совокупностях говорят, что они подчиняются нормальному распределению вариант.

Ввиду того, что диапазон изменчивости для каждой исследуемой биологической совокупности находится в пределах 3S от среднего арифметического, то чем больше величина стандартного отклонения, тем больше изменчивость признака в исследуемых совокупностях. Стандартное отклонение используется как самостоятельный показатель, так и в качестве основы для вычисления других показателей.

При сравнении изменчивости разнородных совокупностей необходимо пользоваться мерой варьирования, представляющей собой отвлеченное число. Для этой цели в статистике введен коэффициент вариации , под которым понимают стандартное отклонение, выраженное в процентах к средней арифметической данной совокупности:

V = S / x × 100%.

Коэффициент вариации позволяет дать объективную оценку степени варьирования при сравнении любых совокупностей. При изучении количественных признаков он позволяет выделить из них наиболее устойчивые. Изменчивость считают незначительной, если коэффициент вариации не превышает 10%, средней – если он от 10% до 20%, и значительной – если он более 20%.

На основании рассмотренных показателей приходим к суждению о качественном своеобразии всей генеральной совокупности. Очевидно, что степень надежности наших суждений о генеральной совокупности будет зависеть, прежде всего, от того, насколько в той или иной части выборочной совокупности ее индивидуальные, а также случайные особенности не мешают проявлению общих закономерностей и свойств изучаемого явления.

В связи с тем, что при проведении опытных работ и научных исследований в большинстве случаев мы не можем оперировать с очень большими по численному составу выборками, то возникает необходимость определения возможных ошибок в наших характеристиках изучаемого материала на основе этих выборок. Необходимо отметить, что под ошибками в данном случае следует понимать не погрешности в вычислениях тех или иных статистических показателей, а пределы возможных колебаний их значений по отношению ко всей совокупности .

Сопоставление отдельных найденных значений статистических показателей с возможными пределами их отклонений и служит, в конечном счете, критерием оценки надежности для полученных выборочных характеристик. Разрешение этого важного как в теоретическом, так и в практическом отношениях вопроса дает теория статистических ошибок.

Подобно тому, как распределяются варианты вариационного ряда около своего среднего, так же будут распределяться и частные значения средних, полученных из отдельных выборок. Т. е., чем сильнее будут варьировать изучаемые объекты, тем сильнее будут варьировать и частные значения. Вместе с тем, чем на большем числе вариант будут получены частные значения средних, тем ближе они будут к истинному значению среднего арифметического всей статистической совокупности. На основании выше изложенного ошибка выборочной средней (стандартная ошибка) является мерой отклонения выборочной средней от средней генеральной совокупности. Ошибки выборки возникают в результате неполной репрезентативности выборочной совокупности, а также при перенесении данных, полученных при изучении выборки, на всю генеральную совокупность. Величина ошибки зависит от степени изменчивости изучаемого признака и объема выборки.

Стандартная ошибка прямо пропорциональна выборочному стандартному отклонению и обратно пропорциональна корню квадратному из числа измерений:

S X = S / √ n

Ошибки выборки выражают в тех же единицах измерения, что и варьирующий признак и показывает те пределы, в которых может заключаться истинное значение среднего арифметического изучаемой генеральной совокупности. Абсолютная ошибка выборочной средней используется для установления доверительных границ в генеральной совокупности, достоверности выборочных показателей и разности, а также для установления объема выборки в научно-исследовательской работе.

Ошибка среднего может быть использована для получения показателя точности исследования - относительной ошибки выборочной средней. Это ошибка выборки, выраженная в процентах от соответствующей средней:

S X , % = S x / x ср × 100

Результаты считаются вполне удовлетворительными, если величина относительной ошибки не превышает 3-5% и соответствует удовлетворительному уровню, при 1-2% - очень высокая точность, 2-3% - высокая точность.

3. Типы статистического распределения

Частота проявления определенных значений признака в совокупности называется распределением. Различают эмпирические и теоретические распределения частот совокупности результатов наблюдений. Эмпирическое распределение – это распределение результатов измерений, полученных при изучении выборки. Теоретическое распределение предполагает распределение измерений на основании теории вероятностей. К их числу относятся: нормальное (Гауссово) распределение, распределение Стьюдента (t – распределение), F – распределение, распределение Пуассона, биноминальное.

Наибольшее значение в биологических исследованиях имеет нормальное или Гауссово распределение – это совокупность измерений, в котором варианты группируются вокруг центра распределения и их частоты равномерно убывают вправо и влево от центра распределения (x). Отдельные варианты отклоняются от средней арифметической симметрично, и размах вариации в обе стороны не превышает 3 σ . Нормальное распределение характерно для совокупностей, на членов которых суммарно влияет бесконечно большое количество разнообразных и разнонаправленных факторов. Каждый фактор вносит определенную часть в общую изменчивость признака. Бесконечные колебания факторов обусловливают изменчивость отдельных членов совокупностей.

Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (а руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в журнале «Биометрика» под псевдонимом «Student» (Студент).

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий. Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

В реальных исследованиях некорректное использование критерия Стьюдента осложняется также и тем, что подавляющее большинство исследователей не только не проверяют гипотезу о равенстве генеральных дисперсий, но не выполняют проверку и первого ограничения: нормальности в обеих сравниваемых группах. В итоге авторы таких публикаций вводят в заблуждение относительно истинных результатов проверки равенства средних как себя, так и своих читателей. Добавим к этому ещё и игнорирование проблемы множественных сравнений, когда авторы проводят попарные сравнения для трёх и большего числа сравниваемых групп. Отметим, что подобной статистической неряшливостью страдают не только начинающие аспиранты и соискатели, но и специалисты облечённые различными академическими и руководящими регалиями: академики, ректоры университетов, доктора и кандидаты наук, и многие другие учёные.

Результатом игнорирования ограничений для t-критерия Стьюдента является заблуждение авторов статей и диссертаций, а далее и читателей этих публикаций, относительно истинного соотношения генеральных средних сравниваемых групп. Так в одном случае принимается вывод о значимом различии средних, когда они на самом деле не различаются, в другом – наоборот, принимается вывод об отсутствии значимого различия средних, когда такое различие имеется.

Почему важно Нормальное распределение? Нормальное распределение важно по многим причинам. Распределение многих статистик является нормальным или может быть получено из нормальных с помощью некоторых преобразований. Рассуждая философски, можно сказать, что нормальное распределение представляет собой одну из эмпирически проверенных истин относительно общей природы действительности и его положение может рассматриваться как один из фундаментальных законов природы. Точная форма нормального распределения (характерная «колоколообразная кривая») определяется только двумя параметрами: средним и стандартным отклонением.

Характерное свойство нормального распределения состоит в том, что 68% всех его наблюдений лежат в диапазоне ± 1 стандартное отклонение от среднего, а диапазон; ± 2 стандартных отклонения содержит 95% значений. Другими словами, при нормальном распределении, стандартизованные наблюдения, меньшие -2 или большие +2, имеют относительную частоту менее 5% (Стандартизованное наблюдение означает, что из исходного значения вычтено среднее и результат поделен на стандартное отклонение (корень из дисперсии)). Если у вас имеется доступ к пакету STATISTICA, Вы можете вычислить точные значения вероятностей, связанных с различными значениями нормального распределения, используя Вероятностный калькулятор; например, если задать z-значение (т.е. значение случайной величины, имеющей стандартное нормальное распределение) равным 4, соответствующий вероятностный уровень, вычисленный STATISTICA будет меньше.0001, поскольку при нормальном распределении практически все наблюдения (т.е. более 99,99%) попадут в диапазон ± 4 стандартных отклонения.

Графическое выражение этого распределения называется Гауссовой кривой, или кривой нормального распределения. Опытным путем установлено, что такая кривая часто повторяет форму гистограмм, получающихся при большом числе наблюдений.

Форма кривой нормального распределения и ее положение определяются двумя величинами: генеральной средней и стандартным отклонением.

В практических исследованиях непосредственно формулой не пользуются, а прибегают к помощи таблиц.

Максимум, или центр, нормального распределения лежит в точке x = μ точка перегиба кривой находится при x1= μ - σ и x2= μ + σ , при n = ± ∞ кривая достигает нулевого значения. Размах колебаний от μ вправо и влево зависит от величины σ и укладывается в пределах трех стандартных отклонений:

1. В области пределов μ + σ находится 68,26% всех наблюдений;

2. Внутри пределов μ + 2 σ находится 95,46% всех значений случайной величины;

3. В интервале μ + 3σ находится 99,73%, практически все значения признака.

Все ли статистики критериев нормально распределены? Не все, но большинство из них либо имеют нормальное распределение, либо имеют распределение, связанное с нормальным и вычисляемое на основе нормального, такое как t, F или хи-квадрат. Обычно эти критериальные статистики требуют, чтобы анализируемые переменные сами были нормально распределены в совокупности. Многие наблюдаемые переменные действительно нормально распределены, что является еще одним аргументом в пользу того, что нормальное распределение представляет "фундаментальный закон". Проблема может возникнуть, когда пытаются применить тесты, основанные на предположении нормальности, к данным, не являющимся нормальными. В этих случаях вы можете выбрать одно из двух. Во-первых, вы можете использовать альтернативные "непараметрические" тесты (так называемые "свободно распределенные критерии", см. раздел Непараметрическая статистика и распределения). Однако это часто неудобно, потому что обычно эти критерии имеют меньшую мощность и обладают меньшей гибкостью. Как альтернативу, во многих случаях вы можете все же использовать тесты, основанные на предположении нормальности, если уверены, что объем выборки достаточно велик. Последняя возможность основана на чрезвычайно важном принципе, позволяющем понять популярность тестов, основанных на нормальности. А именно, при возрастании объема выборки, форма выборочного распределения (т.е. распределение выборочной статистики критерия, этот термин был впервые использован в работе Фишера, Fisher 1928a) приближается к нормальной, даже если распределение исследуемых переменных не является нормальным. Этот принцип иллюстрируется следующим анимационным роликом, показывающим последовательность выборочных распределений (полученных для последовательности выборок возрастающего размера: 2, 5, 10, 15 и 30), соответствующих переменным с явно выраженным отклонением от нормальности, т.е. имеющих заметную асимметричность распределения.

Однако по мере увеличения размера выборки, используемой для получения распределения выборочного среднего, это распределение приближается к нормальному. Отметим, что при размере выборки n=30, выборочное распределение "почти" нормально (см. на близость линии подгонки).

Статистическая надежность, или уровень вероятности – это площадь под кривой, ограниченная от среднего на t стандартных отклонений, выраженная в процентах от всей площади. Иными словами, это вероятность появления значения признака, лежащего в области μ + t σ. Уровень значимости – это вероятность того, что значение изменяющегося признака находится вне пределов μ + t σ, то есть, уровень значимости указывает вероятность отклонения случайной величины от установленных пределов варьирования. Чем больше уровень вероятности, тем меньше уровень значимости.

В практике агрономических исследований считается возможным пользоваться вероятностями 0,95 – 95% и 0,99 – 99%, которым называют доверительными, то есть такие, которым можно доверять и уверенно пользоваться. Так, при вероятности 0,95 – 95% возможность сделать ошибку 0,05 – 5%, или 1 на 20; при вероятности 0,99 – 99% - соответственно 0,01 – 1%, или 1 на 100.

Аналогичный подход применим и к распределению выборочных средних, так как всякое исследование сводится к сравнению средних величин, подчиняющихся закону нормального распределения. Средняя μ, дисперсия σ 2 и стандартное отклонение σ – параметры генеральной совокупности при n > ∞. Выборочные наблюдения позволяют получить оценки этих параметров. Для больших выборок (n>20-30, n>100) закономерности нормального распределения объективны для их оценок, то есть в области x ± S находится 68,26%, x ± 2S - 95,46%, x ± 3S – 99,73% всех наблюдений. Средняя арифметическая и стандартное отклонение причисляют к основным характеристикам, при помощи которых задается эмпирическое распределение измерений.

4. Методы проверки статистических гипотез

Выводы из любого сельскохозяйственного или биологического эксперимента нужно оценить с учетом их значимости, или существенности. Такую оценку проводят путем сравнения вариантов опыта друг с другом, либо с контролем (стандартом), или с теоретически ожидаемым распределением.

Статистическая гипотеза – научное предположение о тех или иных статистических законах распределения рассматриваемых случайных величин, которое может быть проверено на основе выборки. Сравнивают совокупности путем проверки нулевой гипотезы – об отсутствии реального различия между фактическими и теоретическими наблюдениями, пользуясь наиболее подходящим статистическим критерием. Если в результате проверки различия между фактическими и теоретическими показателями близки к нулю или находятся в области допустимых значений, то нулевая гипотеза не опровергается. Если же различия оказываются в критической для данного статистического критерия области, невозможны при нашей гипотезе и поэтому несовместимы с ней, нулевая гипотеза опровергается.

Принятие нулевой гипотезы означает, что данные не противоречат предположению об отсутствии различий между фактическими и теоретическими показателями. Опровержение гипотезы означает, что эмпирические данные несовместимы с нулевой гипотезой и верна другая, альтернативная гипотеза. Справедливость нулевой гипотезы проверяется вычислением статистических критериев проверки для определенного уровня значимости.

Уровень значимости характеризует, в какой мере мы рискуем ошибиться, отвергая нулевую гипотезу, т.е. какова вероятность отклонения от установленных пределов варьирования случайной величины. Поэтому, чем больше уровень вероятности, тем меньше уровень значимости.

Понятие о вероятности неразрывно связано с понятием о случайном событии. В сельскохозяйственных и биологических исследованиях вследствие присущей живым организмам изменчивости под влиянием внешних условий появление события может быть случайным либо неслучайным. Неслучайными будут такие события, которые выходят за пределы возможных случайных колебаний выборочных наблюдений. Это обстоятельство позволяет определить вероятность появления как случайных, так и неслучайных событий.

Таким образом, вероятность – мера объективной возможности события, отношение числа благопрятных случаев к общему числу случаев. Уровень значимости показывает вероятность, с которой проверяемая гипотеза может дать ошибочный результат. В практике сельскохозяйственных исследований считается возможным пользоваться вероятностями 0,95 (95%) и 0.99 (99%), которым соответствуют следующие уровни значимости 0,05 – 5% и 0,01 – 1%. Эти вероятности получили название доверительных вероятностей, т.е. таких, которым можно доверять.

Статистические критерии, используемые для оценки расхождения между статистическими совокупностями, бывают двух видов:

1) параметрические (для оценки совокупностей, имеющих нормальное распределение);

2) непараметрические (применяют к распределениям любой формы).

В практике сельскохозяйственных и биологических исследований встречаются два типа опытов.

В некоторых опытах варианты связаны друг с другом одним или несколькими условиями, контролируемыми исследователем. Вследствие этого опытные данные варьируют не независимо, а сопряженно , так как влияние условий, связывающих варианты, проявляется, как правило, однозначно. К такого типа опытам относятся, например, полевое испытание с повторностями, каждая из которых располагается на участке сравнительно одинакового плодородия. В таком опыте сопоставлять варианты друг с другом можно только в пределах повторения. Другой пример связанных наблюдений – изучение фотосинтеза; здесь объединяющим условием являются особенности каждого подопытного растения.

Наряду с этим часто сравнивают совокупности, варианты которых изменяются независимо друг от друга. Несопряженными, независимыми являются варьирование признаков растений, выращенных в разных условиях; в вегетационных опытах повторностями служат сосуды одноименных вариантов, и любой сосуд одного варианта можно сравнивать с любым сосудом другого.

Статистическая гипотеза - некоторое предположение о законе распределения случайной величины или о параметрах этого закона в рамках данной выборки.

Пример статистической гипотезы: "генеральная совокупность распределена по нормальному закону", "различие между дисперсиями двух выборок незначимо" и т.д.

При аналитических расчетах часто необходимо выдвигать и проверять гипотезы. Проверка статистической гипотезы осуществляется с помощью статистического критерия в соответствии со следующим алгоритмом:

Гипотеза формулируется в терминах различия величин. Например, есть случайная величина x и константа a. Они не равны (арифметически), но нужно установить, значимо ли статистически между ними различие?

Существует два типа критериев:

Необходимо отметить, что знаки ≥, ≤, = здесь используются не в арифметическом, а в «статистическом» смысле. Их необходимо читать «значимо больше», «значимо меньше», «различие незначимо».

Метод по критерию t-Стъюдента

При сравнении средних двух независимых выборок применяют метод по t – критерию Стьюдента , предложенный английским ученым Ф. Госсетом. С помощью данного метода оценивается существенность разности средних (d = x 1 – x 2). Он основан на расчете фактических и табличных значений и их сравнении.

В теории статистики ошибка разности или суммы средних арифметических независимых выборок при одинаковом числе наблюдений (n 1 + n 2) определяется по формуле:

S d = √ S X1 2 + S X2 2 ,

где S d - ошибка разности или суммы;

S X1 2 и S X2 2 - ошибки сравниваемых средних арифметических.

Гарантией надежности вывода о существенности или несущественности различий между средними арифметическими служит отношение разницы к ее ошибке. Это отношение получило название критерия существенности разности:

t = x 1 – x 2 / "√ S X1 2 + S X2 2 = d / S d .

Теоретическое значение критерия t находят по таблице, зная число степеней свободы Y = n 1 + n 2 – 2 и принятый уровень значимости.

Если t факт ≥ t теор, нулевая гипотеза об отсутствии существенности различий между средними опровергается, а если различия находятся в пределах случайных колебаний для принятого уровня значимости – не опровергается.

Метод интервальной оценки

Интервальная оценка характеризуется двумя числами – концами интервала, покрывающего оцениваемый параметр. Для этого следует определить доверительные интервалы для возможных значений средней генеральной совокупности. При этом, x является точечной оценкой генеральной средней, тогда точечную оценку генеральной средней можно записать так: x ± t 0,5 *S X , где t 0,5 *S X предельная ошибка выборочной средней при данном числе степеней свободы и принятом уровне значимости.

Доверительный интервал – это такой интервал, который с заданной вероятностью покрывает оцениваемый параметр. Центр интервала – выборочная оценка точки. Пределы, или доверительные границы, определяются средней ошибкой оценки и уровнем вероятности – x - t 0,5 *S X и x + t 0,5 *S X . Значение критерия Стьюдента для различных уровней значимости и числа степеней свободы приводятся в таблице.

Оценка разности средних сопряженных рядов

Оценку разности средних для сопряженных выборок вычисляют разностым методом. Сущность состоит в том, что оценивается существенность средней разности путем попарного сравнения вариантов опыта. Для нахождения S d разностным методом вычисляют разность между сопряженными парами наблюдений d, определяют значение средней разности (d = Σ d / n) и ошибку средней разности по формуле:

S d = √ Σ (d - d) 2 / n (n – 1)

Критерий существенности вычисляют по формуле: t = d / S d . Число степеней свободы находят по равенству Y= n-1, где n-1 – число сопряженных пар.

Контрольные вопросы

  1. Что такое вариационная статистика (математическая, биологическая статистика, биометрия)?
  2. Что называется совокупностью? Виды совокупностей.
  3. Что называется изменчивостью, вариацией? Виды изменчивости.
  4. Дайте определение вариационного ряда.
  5. Назовите статистические показатели количественной изменчивости.
  6. Расскажите о показателях изменчивости признака.
  7. Как вычисляется дисперсия, ее свойства?
  8. Какие вы знаете теоретические распределения?
  9. Что такое среднее квадратическое отклонение, его свойства?
  10. Какие вы знаете закономерности нормального распределения?
  11. Назовите показатели качественной изменчивости и формулы их вычисления.
  12. Что такое доверительный интервал и статистическая надежность?
  13. Что такое абсолютная и относительная ошибка выборочной средней, как их вычислить?
  14. Коэффициент вариации и его вычисление при количественной и качественной изменчивости.
  15. Назовите статистические методы проверки гипотез.
  16. Дайте определение статистической гипотезы.
  17. Что такое нулевая и альтернативная гипотеза?
  18. Что такое доверительный интервал?
  19. Что такое сопряженные и независимые выборки?
  20. Как вычисляется интервальная оценка параметров генеральной совокупности?

Лабораторная работа №9

Статистический анализ данных

Цель работы: научиться обрабатывать статистические данные в электронных таблицах с помощью встроенных функций; изучить возможности Пакета анализа в MS Excel 2010 и его некоторые инструменты: Генерация случайных чисел, Гистограмма, Описательная статистика.

Теоретическая часть

Очень часто для обработки данных, полученных в результате обследования большого числа объектов или явлений (статистических данных ), используются методы математической статистики.

Современная математическая статистика подразделяется на две обширные области: описательную и аналитическую статистику . Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и пр.

Аналитическая статистика называется также теорией статистических выводов. Ее предметом является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих прикладное значение для самых различных областей человеческой деятельности

Полученный в результате обследования набор чисел называетсястатистической совокупностью.

Выборочной совокупностью (или выборкой ) называется совокупность случайно отобранных объектов. Генеральной совокупностью называется совокупность объектов, из которой производится выборка. Объемом совокупности (генеральной или выборочной) называется число объектов этой совокупности.

Для статистической обработки результаты исследования объектов представляют в виде чисел x 1 , x 2 , …, x k . Если значение x 1 наблюдалось n 1 раз, значение x 2 наблюдалось n 2 раз, и т.д., то наблюдаемые значения x i называются вариантами , а числа их повторений n i называются частотами . Процедура подсчета частот называется группировкой данных.

Объем выборки n равен сумме всех частот n i :

Относительной частотой значения x i называется отношение частоты этого значения n i к объему выборки n :

Статистическим распределением частот (или просто распределением частот ) называется перечень вариант и соответствующих им частот, записанных в виде таблицы:



Распределением относительных частот называется перечень вариант и соответствующих им относительных частот.


Основные статистические характеристики.

Современные электронные таблицы имеют огромный набор средств для анализа статистических данных. Наиболее часто используемые статистические функции встраиваются в основное ядро программы, то есть эти функции доступны с момента запуска программы. Другие более специализированные функции входят в дополнительные подпрограммы. В частности, в Excel, такая подпрограмма называется Пакетом анализа. Команды и функции пакета анализа называют Инструментами анализа. Мы ограничимся изучением нескольких основных встроенных статистических функций и наиболее полезных инструментов анализа из пакета анализа в электронной таблице Excel.

Среднее значение.

Функция СРЗНАЧ вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. Аргументом функции СРЗНАЧ является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201).

Основные статистические характеристики делят на две основные группы: меры центральной тенденции и характеристики вариации.

Центральную тенденцию выборки позволяют оценить такие статистические характеристики, как среднее арифметическое значение, мода, медиана.

Наиболее просто получаемой мерой центральной тенденции является мода. Мода (Мо) – это такое значение в множестве наблюдений, которое встречается наиболее часто. В совокупности значений (2, 6, 6, 8, 7, 33, 9, 9, 9, 10) модой является 9, потому что оно встречается чаще любого другого значения. В случае, когда все значения в группе встречаются одинаково часто, считают, что эта группа не имеет моды.

Когда два соседних значения в ранжированном ряду имеют одинаковую частоту и они больше частоты любого другого значения, мода есть среднее этих двух значений.

Если два несмежных значения в группе имеют равные частоты, и они больше частот любого значения, то существуют две моды (например, в совокупности значений 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами являются 11 и 14); в таком случае группа измерений или оценок является бимодальной .

Наибольшей модой в группе называется единственное значение, которое удовлетворяет определению моды. Однако во всей группе может быть несколько меньших мод. Эти меньшие моды представляют собой локальные вершины распределения частот.

Медиана(Me) – середина ранжированного ряда результатов измерений. Если данные содержат четное число различных значений, то медиана есть точка, лежащая посередине между двумя центральными значениями, когда они упорядочены.

Среднее арифметическое значение для неупорядоченного ряда измерений вычисляют по формуле:

,

где
. Например, для данных 4,1; 4,4; 4,5; 4,7; 4,8 вычислим :

.

Каждая из выше вычисленных мер центра является наиболее пригодной для использования в определенных условиях.

Мода вычисляется наиболее просто – ее можно определить на глаз. Более того, для очень больших групп данных это достаточно стабильная мера центра распределения.

Медиана занимает промежуточное положение между модой и средним с точки зрения ее вычисления. Эта мера получается особенно легко в случае ранжированных данных.

Среднее множество данных предполагает в основном арифметические операции.

На величину среднего влияют значения всех результатов. Медиана и мода не требуют для определения всех значений. Посмотрим, что произойдет со средним, медианой и модой, когда удвоится максимальное значение в следующем множестве:



Множество 1: 1, 3, 3, 5, 6, 7, 8 33/7 5 3

Множество 2: 1, 3, 3, 5, 6, 7, 16 41/7 5 3

На величину среднего особенно влияют результаты, которые называют “выбросами”, т.е. данные, находящиеся далеко от центра группы оценок.

Вычисление моды, медианы или среднего – чисто техническая процедура. Однако выбор из этих трех мер и их интерпретация зачастую требуют определенного размышления. В процессе выбора следует установить следующее:

– в малых группах мода может быть совершенно нестабильной. Например, мода группы: 1, 1, 1, 3, 5, 7, 7, 8 равна 1; но если одна из единиц превратится в нуль, а другая – в два, то мода будет равна 7;

– на медиану не влияют величины “больших” и “малых” значений. Например, в группе из 50 значений медиана не изменится, если наибольшее значение утроится;

– на величину среднего влияет каждое значение. Если одно какое-нибудь значение меняется на c единиц, изменится в том же направлении на c/n единиц;

– некоторые множества данных не имеют центральной тенденции, что часто вводит в заблуждение при вычислении только одной меры центральной тенденции. Особенно это справедливо для групп, имеющих более чем одну моду;

– когда считают, что группа данных является выборкой из большой симметричной группы, среднее выборки, вероятно, ближе к центру большой группы, чем медиана и мода.

Все средние характеристики дают общую характеристику ряда результатов измерений. На практике нас часто интересует, как сильно каждый результат отклоняется от среднего значения. Однако легко можно представить, что две группы результатов измерений имеют одинаковые средние, но различные значения измерений. Например, для ряда 3, 6, 3 – среднее значение = 4; для ряда 5, 2, 5 – также среднее значение = 4, несмотря на существенное различие этих рядов.

Поэтому средние характеристики всегда необходимо дополнять показателями вариации, или колеблемости.



К характеристикам вариации , или колеблемости , результатов измерений относят размах варьирования, дисперсию, среднее квадратическое отклонение, коэффициент вариации, стандартную ошибку средней арифметической.

Самой простой характеристикой вариации является размах варьирования . Его определяют как разность между наибольшим и наименьшим результатами измерений. Однако он улавливает только крайние отклонения, но не отражает отклонений всех результатов.

Чтобы дать обобщающую характеристику, можно вычислить отклонения от среднего результата. Например, для ряда 3, 6, 3 значения будут следующими: 3 – 4 = – 1; 6 – 4 = 2; 3 – 4 = – 1. Сумма этих отклонений (– 1) + 2 + (– 1) всегда равна 0. Чтобы избежать этого, значения каждого отклонения возводят в квадрат: (– 1) 2 + 2 2 + (– 1) 2 = 6.

Значение делает отклонения от средней более явственными: малые отклонения становятся еще меньше (0,5 2 =0,25), а большие – еще больше (5 2 = 25). Получившуюся сумму называют суммой квадратов отклонений . Разделив эту сумму на число измерений, получают средний квадрат отклонений, или дисперсию . Она обозначается s 2 и вычисляется по формуле:

.

Если число измерений не более 30, т.е. n ≤ 30, используется формула:

.

Величина n – 1 = k называется числом степеней свободы , под которым подразумевается число свободно варьирующих членов совокупности. Установлено, что при вычислении показателей вариации один член эмпирической совокупности всегда не имеет степени свободы.

Эти формулы применяются, когда результаты представлены неупорядоченной (обычной) выборкой.

Из характеристик колеблемости наиболее часто используется среднее квадратическое отклонение , которое определяется как положительное значение корня квадратного из значения дисперсии, т.е.:

.

Среднее квадратическое отклонение или стандартное отклонение характеризует степень отклонения результатов от среднего значения в абсолютных единицах и имеет те же единицы измерения, что и результаты измерения.

Однако для сравнения колеблемости двух и более совокупностей, имеющих различные единицы измерения, эта характеристика не пригодна.

Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому, выраженное в процентах. Вычисляется он по формуле:

.

В спортивной практике колеблемость результатов измерений в зависимости от величины коэффициента вариации считают небольшой
(0 – 10 %), средней (11 – 20 %) и большой (V > 20 %).

Коэффициент вариации имеет большое значение в статистической обработке результатов измерений, т. к., будучи величиной относительной (измеряется в процентах), позволяет сравнивать между собой колеблемость результатов измерений, имеющих различные единицы измерения. Коэффициент вариации можно использовать лишь в том случае, если измерения выполнены в шкале отношений.

Одна из основных задач статистики состоит в надлежащей обработке информации. Конечно, у статистики есть много других задач: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т. д. Но ни одна из этих целей не достижима без обработки данных. Поэтому, сперва необходимо выделить основные характеристики статистических данных.

Электронные таблицы Excel имеют огромный набор средств для анализа статистических данных. Наиболее часто используемые статистические функции встроены в основное ядро программы, то есть эти функции доступны с момента запуска программы. Другие более специализированные функции входят в дополнительную подпрограмму, называемую пакетом анализа. Команды и функции пакета анализа называют Инструментами анализа.

Рассмотрим основные характеристики выборочных данных.

Среднее значение.

С помощью среднего значения вычисляют выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. В Excel среднее значение вычисляется так: =СУММ(F4:F60)/СЧЁТ(F4:F60). Также в Excel существует функция для его вычисления: СРЗНАЧ. Аргументом функции является набор чисел, как правило, задаваемый в виде интервала ячеек, например: =СРЗНАЧ (А3:А201).

Выборочная дисперсия и выборочное среднее квадратическое отклонение.

Выборочной дисперсией значений случайной величины Х называется среднее арифметическое квадратов отклонений наблюдаемых значений этой величины от их среднего арифметического:

Дисперсия характеризует отклонение от средней в квадратных единицах измерения признака, поэтому используют такой показатель, как среднее квадратичное отклонение, который измеряется в тех же единицах, что и изучаемый признак.

Выборочное среднее квадратичное отклонение определяется формулой:

Excel имеются функции, отдельно вычисляющие выборочную дисперсию стандартное отклонение в и генеральные дисперсию D г и стандартное отклонение г. Поэтому, прежде чем вычислять дисперсию и стандартное отклонение, следует четко определиться, являются ли ваши данные генеральной совокупностью или выборочной. В зависимости от этого нужно использовать для расчета D г и г, и в .

Вычисление выборочной дисперсии и выборочного стандартного отклонения в производится с помощью функций: = СУММ((4: 60 ? 28)^2)/ (СЧЁТ(4: 60)) и = КОРЕНЬ(29).

В Excel имеются функции ДИСП (или VAR) и СТАНДОТКЛОН (или STDEV).

Аргументом этих функций является набор чисел, как правило, заданный диапазоном ячеек, например, =ДИСП (В1:В48).

Для вычисления генеральной дисперсии D г и генерального стандартного отклонения г имеются функции ДИСПР (или VARP) и СТАНДОТКЛОНП (или STDEVP), соответственно.

Аргументы этих функций такие же, как и для выборочной дисперсии.

Объем совокупности.

Объем совокупности выборочной или генеральной - это число элементов совокупности. Функция СЧЕТ (или COUNT) определяет количество ячеек в заданном диапазоне, которые содержат числовые данные. Пустые ячейки или ячейки, содержащие текст, функция СЧЕТ пропускает. Аргументом функции СЧЕТ является интервал ячеек, например: =СЧЕТ (С2:С16).

Для определения количества непустых ячеек, независимо от их содержимого, используется функция СЧЕТ3. Ее аргументом является интервал ячеек.

Мода и медиана.

Мода (?) - это значение признака, которое чаще других встречается в совокупности данных. Она вычисляется функцией МОДА (или MODE). Ее аргументом является интервал ячеек с данными. Мода не вычисляется при исследовании НСВ.

Медиана (?) - это значение признака, которое разделяет совокупность на две равные по числу элементов части. Для вариационного ряда с нечётным числом членов медиана равна серединному варианту, а для ряда с чётным числом членов - полусумме двух серединных вариантов. Она вычисляется функцией МЕДИАНА (или MEDIAN). Ее аргументом является интервал ячеек.

Размах варьирования. Наибольшее и наименьшее значения.

Размах варьирования R - это разность между наибольшим x max и наименьшим xmin значениями признака совокупности (генеральной или выборочной): R =x max-x min.

Для нахождения наибольшего значения x max имеется функция МАКС (или MAX), а для наименьшего x min - функция МИН (или MIN). Их аргументом является интервал ячеек. Для того, чтобы вычислить размах варьирования данных в интервале ячеек, например, от А1 до А100, следует ввести формулу: =МАКС (А1:А100)-МИН (А1:А100).

Коэффициент вариации. Вычисляется как процентное соотношение выборочного среднего квадратичного отклонения к средней арифметической.

Если коэффициент вариации высок (более 35%), то выборочная совокупность считается неоднородной. Следовательно, использование среднего для её характеристики является неверным. В этом случае используют моду или медиану.

Для оценки отклонения распределения данных эксперимента от нормального распределения используются такие характеристики как асимметрия А и эксцесс Е .

Для нормального распределения А =0 и Е =0.

Асимметрия показывает, на сколько распределение данных несимметрично относительно нормального распределения: если А >0, то большая часть данных имеет значения, превышающие среднее; если А <0, то большая часть данных имеет значения, меньшие среднего. Асимметрия вычисляется функцией СКОС. Ее аргументом является интервал ячеек с данными, например, =СКОС (А1:А100).

Эксцесс оценивает «крутость», т.е. величину большего или меньшего подъема максимума распределения экспериментальных данных по сравнению с максимумом нормального распределения. Если Е >0, то максимум экспериментального распределения выше нормального; если Е <0, то максимум экспериментального распределения ниже нормального. Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС (А1:А100). [см. 5]

Получаем следующие вычисления (рисунок 14).

Рисунок 14 Вычисление основных характеристик

Получили следующие значения (рисунок 15).


Рисунок 15 Значения основных характеристик

Так как значение коэффициента вариации значительно превышает 35%, выборка является неоднородной и в качестве среднего значения используется медиана.