Представление результатов психологических исследований:
рекомендации APA и визуализация данных
Андрей Четвериков,
аспирант ф-та психологии СПбГУ, м.н.с
Рекомендации APA: о чем это вообще?
Вообще это Publication Manual – руководство по подготовке текста к публикации:
Специфика текстов в социальных науках и науках о поведении
Структура текста
Стиль текста
Представление результатов
Оформление текста
Процесс публикации
5ое издание – 2001 год, 439 страниц
6ое издание – 2009 год, 272 страницы
Рекомендации APA: выбор формата представления результатов
Общая рекомендация:
Если у вас 3 или меньше чисел, просто напишите их.
Если у вас 4 – 20 чисел, используйте таблицы.
Если чисел более 20, скорее всего, стоит использовать график.
Но, пример APA: Means (with standard deviations in parentheses) for Trials 1 through 4 were 2.43 (0.501), 2.59 (1.2 1), 2.68(0.39), and 2.86 (0.121), respectively.
Вообще, меньше 4х чисел бывает редко.
Рекомендации APA: выбор формата представления результатов
Более логично:
Если данные нужны только для доказательства значимости результата – укажите их в тексте.
Если предполагается сравнение более, чем трех точек (data points): используйте таблицу или график.
Точка – data point – то, что, собственно, сравнивается. Не «среднее», а, например, среднее вместе с доверительными интервалами.
Рекомендации APA: необходимый минимум представления результатов
Описательные статистики: M (CI – доверительные интервалы), Mdn (Q - квартили), частоты (%), …
Использованный критерий, его значение и необходимы для расчета значимости параметры (например, df, N).
Уровень значимости – с точность до .001 или до .01, если меньше .001, то просто < .001. Принцип округления < .10 , < .05, < .01, < .001 имеет смысл только для таблиц и графиков.
Сила эффекта.
Рекомендации APA: пример описания результатов теста Хи-квадрат
Вероятность ошибки во второй пробе была выше при условии, что в первой пробе также был дан ошибочный ответ: 56%, n = 633, против 32%, n = 876,χ2(1) = 84.80, p < .001, V = .24.
Рекомендации APA: пример описания результатов теста Хи-квадрат
Вероятность ошибки во второй пробе была выше при условии, что в первой пробе также был дан ошибочный ответ: 56%, n = 633, против 32%, n = 876, χ2(1) = 84.80, p < .001, V = .24.
Проценты округляем до
целого.
Стараемся обходиться без скобок
Указываем силу эффекта
Стандартные статистики округляются до 0.01. Неудачная конвенция.
Если число не может быть больше 1, ноль опускается.
Рекомендации APA: пример описания результатов теста Хи-квадрат
Вероятность ошибки во второй пробе была выше при условии, что в первой пробе также был дан ошибочный ответ: 56%, n = 633, против 32%, n = 876, χ2(1) = 84.80, p < .001, V = .24.
Разделяем слова и знаки пробелами
Статистические обозначения (кроме греческих)
выделяются курсивом
Рекомендации APA: таблицы
Подробнее: http://web.psych.washington.edu/writingcenter/writingguides/pdf/tables.pdf
Визуализация данных
Принципы Эдварда Тафти (Tufte): Минимум лишнего.
Минимум лжи.
Проводите сравнения.
Раскрывайте причинно-следственные связи.
…
Книги: 1983. The Visual Display of Quantitative Information.
1990. Envisioning Information.
1997. Visual Explanations: Images and Quantities, Evidence and Narrative
2003. The Cognitive Style of PowerPoint.
2006. Beautiful Evidence.
Визуализация данных: ложь
Источник: E.Tufte, The Visual Display of Quantitative Information
Визуализация данных: ложь
Источник: E.Tufte, The Visual Display of Quantitative Information
Визуализация данных: ложь
Источник: E.Tufte, The Visual Display of Quantitative Information
Визуализация данных: мусор
Источник: E.Tufte, The Visual Display of Quantitative Information
Визуализация данных: мусор
Визуализация данных: удаление мусора
Пример с http://www.artlebedev.ru/everything/backstage/artstat/
Визуализация данных: удаление мусора
Пример с http://www.artlebedev.ru/everything/backstage/artstat/
PIE CHARTS = DON’T DO IT!
Визуализация данных: соответствие данных и формы представления
Всегда отражайте на графике изменчивость данных.
Используйте графики, отражающие те статистические методы, которые вы применяли.
Выбирайте график в соответствии с типом данных.
Визуализация данных: всегда отражайте на графике изменчивость данных
Cumming & Finch, 2005
Проблема: внутригрупповые планы
Loftus & Masson, 1994
Вся дисперсия
Дисперсия, связанная с экспериментальным
условием
Решение проблемы внутригрупповых планов
Использование доверительных интервалов, основанных на результатах ANOVA:
Нормализация данных для вычисления CI: http://drsmorey.org/bibtex/upload/Morey:2008.pdf
Смешанные регрессионные модели + бутстреп
Пакет ez в R
см. Loftus & Masson, 1994
BAD: не надо соединять линиями категориальные значения переменных
GOOD: для средних лучше использовать точки с разбросом (pointrange), чем столбики
BEST
WORSTSo - so
Использование медиан
J. Tukey“Box and whiskers plot”
E. Tufte“Quartile plot”
Гистограммы
Оптимально для счетных данных
Шкала Y начинается с 0
Общие принципы представления данных
• Представление результатов позволяет их понять и проверить
Репрезентативность
• Данные рассказывают историю, форма представления соответствует содержанию
Направленность
• Различные формы представления и части истории дополняют друг друга
Цельность
• Соответствие внешним требованиям и традициям
Конвенциональность
Ссылки
http://vk.com/thinkcog
http://avaxhome.ws
http://owl.english.purdue.edu/owl/section/2/10/
http://infographer.ru
http://www.edwardtufte.com/
http://chetvericov.ru/tag/vizualizaciya/