Сведения о вопросе

nikolya

16:03, 1st July, 2020

Теги

statistics   spss    

Как я могу рассчитать эти статистические данные?

Просмотров: 478   Ответов: 6

Я пишу приложение, чтобы помочь облегчить некоторые исследования, и часть этого включает в себя выполнение некоторых статистических расчетов. Прямо сейчас исследователи используют программу под названием SPSS . Часть выходных данных о которых они заботятся выглядит так:

[Part of the SPSS output

На самом деле их волнуют только значения F и Sig. . Моя проблема заключается в том, что у меня нет никакого опыта в статистике, и я не могу понять, как называются тесты, или как их вычислить.

Я думал, что значение F может быть результатом F-теста, но после выполнения шагов, приведенных в Википедии, я получил результат, который отличался от того, что дает SPSS .



  Сведения об ответе

darknet

18:03, 1st July, 2020

Этот сайт может помочь вам немного больше. И еще вот этот .

Я работаю с довольно ржавой памятью о курсе статистики, но здесь ничего не происходит:

Когда вы делаете дисперсионный анализ (ANOVA), вы фактически вычисляете статистику F как отношение между среднеквадратичными дисперсиями "between the groups" и среднеквадратичными дисперсиями "within the groups". Вторая ссылка выше кажется довольно хорошей для этого расчета.

Это делает статистику F точной мерой того, насколько мощна ваша модель, потому что "between the groups" дисперсия является объяснительной силой, а "within the groups" дисперсия-случайной ошибкой. Высокий F подразумевает весьма значимую модель.

Как и во многих статистических операциях, вы определяете Sig в обратном порядке. используя статистику F. Вот где ваша информация Википедии немного пригодится. То, что вы хотите сделать, это - используя степени свободы, данные вам SPSS - найти правильное значение P, при котором таблица F даст вам вычисленную вами статистику F. Значение P, где это происходит [F (таблица) = F(вычислено)], является значением значимости.

Концептуально более низкое значение значимости показывает очень сильную способность отвергнуть гипотезу null (что для этих целей означает, что ваша модель имеет объяснительную силу).

Извините всех математиков, если что-то из этого неправильно. Я буду проверять назад, чтобы внести правки!!!

Желаю Вам удачи. Статистика-это весело, только, может быть, не эта часть. =)


  Сведения об ответе

PROGA

18:03, 1st July, 2020

Я предполагаю из вашего вопроса, что ваши коллеги-исследователи хотят автоматизировать процесс, с помощью которого выполняются определенные статистические анализы (т. е. они хотят пакетной обработки наборов данных). У вас есть два варианта:

1) SPSS теперь можно писать через python (начиная с версии 15) - перейдите к spss.com и найдите python. Вы можете написать сценарии python для автоматизации анализа данных и извлечения ключевых значений из таблиц pivot, а затем обработать ответы любым удобным вам способом. Это имеет то преимущество, что позволяет точно сравнить результаты вашего сценария python и рассчитанные вручную усилия в SPSS ваших сотрудников. Таким образом, вам не нужно будет действительно знать статистику, чтобы сделать эту работу (что является ключевым преимуществом)

2) Вы можете сделать это в R, свободной среде статистики, которая, вероятно, может быть написана по сценарию. Это имеет тот недостаток, что вам придется изучить статистику, чтобы убедиться, что вы делаете это правильно.


  Сведения об ответе

Chhiki

18:03, 1st July, 2020

Статистику сложно :-). После года чтения и перечитывания книг и газет я могу только с уверенностью сказать, что понимаю в ней самые основы.

Возможно, вы захотите изучить готовые библиотеки для любого языка программирования, который вы используете, потому что они являются многими готами в математике вообще и статистике в частности (ошибки округления являются очевидным примером).

В качестве примера вы можете взглянуть на проект R, который является одновременно интерактивной средой и библиотекой, которую можно использовать из вашего кода C++, распространяемого под GPL (т. е. если вы используете его только внутри и публикуете только результаты, вам не нужно открывать свой код).


  Сведения об ответе

PROGA

18:03, 1st July, 2020

Короче говоря: не делайте этого вручную, связывайте/используйте существующее программное обеспечение. И ответ sain_grocen неверен. :(

Это все тесты на значимость оценок параметров, которые обычно используются в многомерных регрессиях множественного ответа. Это было бы непросто сделать вне среды статистического программирования. Я бы предложил либо получить выходные данные из уже существующей статистической программы, либо использовать ту, на которую вы можете ссылаться и использовать этот код.

Я боюсь, что первый ответ (sain_grocen) приведет вас на неверный путь. Его объяснение, скорее всего, является частным случаем того, с чем вы на самом деле имеете дело. Anova объяснил в своих ссылках для одного вариативного ответа, в сбалансированном дизайне. Это не та статистика F, которую вы видите. Имена в вашем выводе (Пиллаи Trace, Хотеллинг Trace,...) приведены некоторые из доступных многомерных версий. Они имеют F-распределения при определенных допущениях. Я не могу объяснить, какие учебники стоят здесь материала, я бы посоветовал вам начать с просмотра "Applied Multivariate Statistical Analysis" by Johnson and Wichern


  Сведения об ответе

Chhiki

18:03, 1st July, 2020

Вот объяснение MANOVA ouptput, от очень хорошего сайта по статистике и на SPSS:

Вывод с пояснением: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Как и зачем делать MANOVA или многовариантный GLM: (тот же путь, что и выше, но заканчивается на '/manova.htm')

Написание программного обеспечения с нуля для расчета этих результатов будет длительным и сложным процессом; есть много численных задач и матричных инверсий, которые нужно сделать.

Как сказал Генри, используйте Python скриптов или R. Я бы посоветовал работать с кем-то, кто знает SPSS, если это сценарий. Кроме того, SPSS сам способен экспортировать выходные таблицы в файлы, используя что-то под названием OMS. Скрипт в пределах SPSS может сделать это.

Выясните, кто в вашей исследовательской группе знает SPSS и работайте с ними.


  Сведения об ответе

PHPH

18:03, 1st July, 2020

Можете ли вы подробнее объяснить, почему SPSS сам по себе не является прекрасным решением проблемы? Может быть, он генерирует pivot таблицы в качестве выходных данных, которыми трудно манипулировать? Это стоимость программы?

F-статистика может возникнуть из любого числа конкретных тестов. F - это просто распределение (слабо: описание "frequencies" групп значений), подобное нормальному (Гауссовскому) или равномерному. В общем случае они возникают из соотношения дисперсий. Мнение: многие статистики (включая меня) считают тесты на основе F нестабильными (жаргон: нестойкие ).

Конкретная статистика выходных данных (Pillai trace и др.) предполагают, что исходный анализ является примером MANOVA, который, как описывают другие плакаты, является сложной и трудной для получения правильной процедурой.

Я также предполагаю, что, основываясь на MANOVA и использовании SPSS, это психологический или социологический проект... если нет, пожалуйста, просветите. Возможно, что другие, более простые модели на самом деле могут быть более понятными и более воспроизводимыми. Проконсультируйтесь с вашей местной университетской статистической консалтинговой группой, если она у вас есть.

Удачи вам!


Ответить на вопрос

Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться