Как зайти в Даркнет?!
25th January, 01:11
8
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
899
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
952
0
Очень долго работает Update запрос Oracle
27th January, 09:58
916
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
907
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
942
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1727
0
период по дням
25th October, 10:44
3957
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3722
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4614
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4382
0
Помогите пожалуйста решить задачи
24th November, 23:53
6087
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4352
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4400
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Как я могу рассчитать эти статистические данные?
Я пишу приложение, чтобы помочь облегчить некоторые исследования, и часть этого включает в себя выполнение некоторых статистических расчетов. Прямо сейчас исследователи используют программу под названием SPSS . Часть выходных данных о которых они заботятся выглядит так:
На самом деле их волнуют только значения F и Sig. . Моя проблема заключается в том, что у меня нет никакого опыта в статистике, и я не могу понять, как называются тесты, или как их вычислить.
Я думал, что значение F может быть результатом F-теста, но после выполнения шагов, приведенных в Википедии, я получил результат, который отличался от того, что дает SPSS .
Этот сайт может помочь вам немного больше. И еще вот этот .
Я работаю с довольно ржавой памятью о курсе статистики, но здесь ничего не происходит:
Когда вы делаете дисперсионный анализ (ANOVA), вы фактически вычисляете статистику F как отношение между среднеквадратичными дисперсиями "between the groups" и среднеквадратичными дисперсиями "within the groups". Вторая ссылка выше кажется довольно хорошей для этого расчета.
Это делает статистику F точной мерой того, насколько мощна ваша модель, потому что "between the groups" дисперсия является объяснительной силой, а "within the groups" дисперсия-случайной ошибкой. Высокий F подразумевает весьма значимую модель.
Как и во многих статистических операциях, вы определяете Sig в обратном порядке. используя статистику F. Вот где ваша информация Википедии немного пригодится. То, что вы хотите сделать, это - используя степени свободы, данные вам SPSS - найти правильное значение P, при котором таблица F даст вам вычисленную вами статистику F. Значение P, где это происходит [F (таблица) = F(вычислено)], является значением значимости.
Концептуально более низкое значение значимости показывает очень сильную способность отвергнуть гипотезу null (что для этих целей означает, что ваша модель имеет объяснительную силу).
Извините всех математиков, если что-то из этого неправильно. Я буду проверять назад, чтобы внести правки!!!
Желаю Вам удачи. Статистика-это весело, только, может быть, не эта часть. =)
Я предполагаю из вашего вопроса, что ваши коллеги-исследователи хотят автоматизировать процесс, с помощью которого выполняются определенные статистические анализы (т. е. они хотят пакетной обработки наборов данных). У вас есть два варианта:
1) SPSS теперь можно писать через python (начиная с версии 15) - перейдите к spss.com и найдите python. Вы можете написать сценарии python для автоматизации анализа данных и извлечения ключевых значений из таблиц pivot, а затем обработать ответы любым удобным вам способом. Это имеет то преимущество, что позволяет точно сравнить результаты вашего сценария python и рассчитанные вручную усилия в SPSS ваших сотрудников. Таким образом, вам не нужно будет действительно знать статистику, чтобы сделать эту работу (что является ключевым преимуществом)
2) Вы можете сделать это в R, свободной среде статистики, которая, вероятно, может быть написана по сценарию. Это имеет тот недостаток, что вам придется изучить статистику, чтобы убедиться, что вы делаете это правильно.
Статистику сложно :-). После года чтения и перечитывания книг и газет я могу только с уверенностью сказать, что понимаю в ней самые основы.
Возможно, вы захотите изучить готовые библиотеки для любого языка программирования, который вы используете, потому что они являются многими готами в математике вообще и статистике в частности (ошибки округления являются очевидным примером).
В качестве примера вы можете взглянуть на проект R, который является одновременно интерактивной средой и библиотекой, которую можно использовать из вашего кода C++, распространяемого под GPL (т. е. если вы используете его только внутри и публикуете только результаты, вам не нужно открывать свой код).
Короче говоря: не делайте этого вручную, связывайте/используйте существующее программное обеспечение. И ответ sain_grocen неверен. :(
Это все тесты на значимость оценок параметров, которые обычно используются в многомерных регрессиях множественного ответа. Это было бы непросто сделать вне среды статистического программирования. Я бы предложил либо получить выходные данные из уже существующей статистической программы, либо использовать ту, на которую вы можете ссылаться и использовать этот код.
Я боюсь, что первый ответ (sain_grocen) приведет вас на неверный путь. Его объяснение, скорее всего, является частным случаем того, с чем вы на самом деле имеете дело. Anova объяснил в своих ссылках для одного вариативного ответа, в сбалансированном дизайне. Это не та статистика F, которую вы видите. Имена в вашем выводе (Пиллаи Trace, Хотеллинг Trace,...) приведены некоторые из доступных многомерных версий. Они имеют F-распределения при определенных допущениях. Я не могу объяснить, какие учебники стоят здесь материала, я бы посоветовал вам начать с просмотра "Applied Multivariate Statistical Analysis" by Johnson and Wichern
Вот объяснение MANOVA ouptput, от очень хорошего сайта по статистике и на SPSS:
Вывод с пояснением: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm
Как и зачем делать MANOVA или многовариантный GLM: (тот же путь, что и выше, но заканчивается на '/manova.htm')
Написание программного обеспечения с нуля для расчета этих результатов будет длительным и сложным процессом; есть много численных задач и матричных инверсий, которые нужно сделать.
Как сказал Генри, используйте Python скриптов или R. Я бы посоветовал работать с кем-то, кто знает SPSS, если это сценарий. Кроме того, SPSS сам способен экспортировать выходные таблицы в файлы, используя что-то под названием OMS. Скрипт в пределах SPSS может сделать это.
Выясните, кто в вашей исследовательской группе знает SPSS и работайте с ними.
Можете ли вы подробнее объяснить, почему SPSS сам по себе не является прекрасным решением проблемы? Может быть, он генерирует pivot таблицы в качестве выходных данных, которыми трудно манипулировать? Это стоимость программы?
F-статистика может возникнуть из любого числа конкретных тестов. F - это просто распределение (слабо: описание "frequencies" групп значений), подобное нормальному (Гауссовскому) или равномерному. В общем случае они возникают из соотношения дисперсий. Мнение: многие статистики (включая меня) считают тесты на основе F нестабильными (жаргон: нестойкие ).
Конкретная статистика выходных данных (Pillai trace и др.) предполагают, что исходный анализ является примером MANOVA, который, как описывают другие плакаты, является сложной и трудной для получения правильной процедурой.
Я также предполагаю, что, основываясь на MANOVA и использовании SPSS, это психологический или социологический проект... если нет, пожалуйста, просветите. Возможно, что другие, более простые модели на самом деле могут быть более понятными и более воспроизводимыми. Проконсультируйтесь с вашей местной университетской статистической консалтинговой группой, если она у вас есть.
Удачи вам!