Метод представления данных «Лица Чернова» и их развитие с помощью асимметрии. Лица Чернова: многофакторный анализ простым наглядным способом

Проиллюстрируем графические возможности пакета . Будем использовать следующую базу данных: в первом столбце содержится дата (информация фиксировалась по 2 раза в месяц в течении месяца), во втором - цены на газ Газпрома на Лондонской товарной бирже на текущий день (данные взяты с сайта http://www.lme.com), во второй - курс евро (http://www.audito.ru/rateofexchange).

Таблица 1. Исходные данные

Остальные столбцы содержат вымышленную информацию. Мы предполагаем, что имеется некоторая номинальная переменная, принимающая только два значения -1 и 0 (показывающая, например, наличие/отсутствие некоторого фактора, влияющего на результаты торгов) и некоторая категориальная переменная с натуральными значениями 5, 6, 7, 8, 9 и 10 (означающая, например, рейтинг Газпрома). Столбцы 6-8 показывают минимальный, средний и максимальный курсы евро в течении дня, а столбцы 9-11 - вероятности увеличения, уменьшения курса и того, что курс останется неизменным. Естественно, что сумма значений в трёх последних столбцах равна 1 для каждого наблюдения.

Таблица содержит 25 наблюдений.

Круговые диаграммы

Начнём с простейших графиков.

Круговая диаграмма является одним из наиболее часто используемых графических форматов для представления пропорций или значений переменных

Пусть, например, Вам нужно включить в доклад диаграмму, показывающую, какое относительное количество времени значение курса евро находилось в промежутках, по величине равных восьмой части всего диапазона изменения курса. Зайдём в модуль Графика/2M Графики/Круговые диаграммы .

На вкладке Дополнительно укажем переменную - Курс евро и количество категорий - 8. Можно указать тип диаграммы (2M,3M) и форму (окружность, эллипс).

Задание параметров графика Круговые диаграммы

Нажмём OK .

Круговая диаграмма переменной Курс евро

Линейные графики

На линейных графиках отдельные точки данных соединены линией. Эти графики являются простым способом представления и исследования последовательностей значений. Графики трассировочного типа можно использовать для воспроизведения следа (а не последовательности). Также линейные графики применяются для изображения непрерывных функций, теоретических распределений и т.п.

В нашем случае данные во втором и третьем столбцах вполне естественно интерпретировать как временные ряды, поэтому линейные графики являются очень эффективным средством визуализации.

К примеру, пусть мы хотим визуально проанализировать различия в динамиках изменений результатов торгов и курса евро. Для этого запустим Графика/2M Графики/Линейный график (для переменных) .

На вкладке Быстрый укажем интересующие нас переменные и тип графика - Составной .

Построенный график окажется несодержательным:

Линейный график переменных Цены на газ и Курс евро

Причина понятна - колебания курса евро незначительны по сравнению с колебанием результатов торгов. Поэтому укажем другой тип графика - с двойной осью Y (вкладка Дополнительно ).

Вкладка Дополнительно окна 2M линейные графики

Сделаем ещё одно изменение. На вкладке Параметры1 укажем в группе Параметры отображения в качестве метки наблюдений Переменная , а в качестве переменной - Дата .

Нажмём OK .

График с двойной осью Y переменных Цены на газ и Курс евро.

Диаграмма Вороного

Частным случаем диаграмм рассеяния является диаграмма Вороного

Эта особая диаграмма рассеяния одной переменной является в большей степени аналитическим средством, нежели просто методом графического представления данных. Предлагаемые ею решения помогают моделировать множество явлений в естественных и социальных науках (см. Coombs, 1964 г.; Ripley, 1981 г.). Программа разделяет пространство между точками данных, представленными координатами X, Y в двумерном пространстве. Пространство между отдельными точками данных делится границами на такие области, каждая точка которых находится ближе к заключенной внутри точке данных, чем к любой другой соседней точке данных. Использование этого метода сильно зависит от области исследования; однако во многих случаях к этой диаграмме полезно добавлять дополнительные измерения, используя категоризацию и выбор сложных подгрупп.

Диаграмма Вороного категориальной переменной и курса евро

Трассировочный график

Трассировочный график является частным случаем линейного графика.

На трассировочных графиках сначала строится диаграмма рассеяния двух переменных, а затем отдельные точки данных соединяются линией (в порядке их считывания из файла данных). В этом смысле трассировочные графики визуализируют "путь" последовательного процесса (движение, изменение явления во времени и т.п.).

Трассировочный график переменных Цены на газ Газпрома и Курс евро

График вероятность - вероятность

На графике вероятность-вероятность строится зависимость между наблюдаемой функцией распределения (доля непропущенных значений ≤ x) и теоретической функцией распределения для оценки подгонки теоретического распределения к наблюдаемым данным. Если все точки графика попадают на диагональную линию (со сдвигом 0 и наклоном 1), то можно сделать вывод, что теоретическое распределение точно приближает наблюдаемое распределение. Если точки данных не попадают на диагональную линию, то этот график можно использовать для наглядной проверки, подходит ли распределение к данным (например, если точки располагаются в форме буквы S относительно диагональной линии, то может потребоваться преобразование данных для того, чтобы привести их распределение к нужному виду).

Пусть, например, мы хотим визуально проверить, является ли распределение величины Курс евро нормальным. Для этого укажем на вкладке Дополнительно тип распределения - нормальное, а также поставим галочку в поле Вычислить по данным .

Задание параметров построения графиков вероятность-вероятность.

Нажмём ОК .

График вероятность - вероятность для переменной Курс евро

Последовательные / наложенные графики

Все типы графиков из этой группы используются для представления последовательностей значений. Наложенный вид этих графиков специально разработан для представления большой категории множеств данных, в которых последовательные переменные представляют части ("порции") целого.

Например, построим наложеннный график типа Зонный для переменных Вероятность уменьшения курса евро , Вероятность того, что курс евро не изменится и Вероятность увеличения курса евро .

Наложенный (зонный) график для переменных, обозначающих вероятности колебания курса евро

Диаграмма размаха

На диаграммах размаха диапазоны значений выбранной переменной (или переменных) строятся отдельно для групп наблюдений, определяемых значениями категоризующей (группирующей) переменной. Центральная тенденция (например, медиана или среднее) и статистики диапазонов или вариации (например, квантили, стандартные ошибки или стандартные отклонения) вычисляются для каждой группы наблюдений, а выбранные переменные представляются в стиле, указанном в списке Тип графика (на вкладке Быстрый или Дополнительно диалогового окна 2М диаграммы размаха ). Здесь можно указать и точки выбросов.

Пусть нам нужно узнать, какие значения цен на газ наиболее вероятны при различных значениях категориальной переменной.

Диаграмма размаха цен на газ в зависимости от значения категориальной переменной.

Диаграмма диапазонов

На диаграммах диапазонов системы представлены диапазоны значений или столбцы ошибок, относящиеся к определенным точкам данных, в форме прямоугольников или отрезков. В отличие от стандартных диаграмм размаха диапазоны или столбцы ошибок не вычисляются по данным, а определяются исходными значениями выбранных переменных. Для каждого наблюдения строится один диапазон или столбец ошибок. В простейшем случае нужно выбрать три переменные, одна из которых будет представлять средние точки, другая - верхние границы, а третья - нижние границы.

Например, построим графики для переменных Минимальный , Средний и Максимальный курс.

Диаграмма диапазонов для переменных Минимальный, Средний и Максимальный курс.

Тернарные графики

Тернарные (или "трехлинейные") графики используются для исследования связей между несколькими переменными, когда три из них представляют собой, например, компоненты смеси (это означает, что сумма их остается постоянной для всех наблюдений). Обычное такие графики применяются при экспериментальном исследовании зависимости отклика от относительного содержания трех компонент (например, трех химических соединений), при этом соотношение компонент изменяется с целью определения его оптимального значения (например, при составлении смеси). На тернарных графиках для построения зависимости четырех (или более) переменных (компонент X, Y и Z и откликов V1, V2 и т.д.) используется треугольная система координат на плоскости (тернарные диаграммы рассеяния или линии уровня) или в пространстве (тернарные трехмерные диаграммы рассеяния или поверхности). При построении тернарного графика относительная доля каждой компоненты (для каждого наблюдения) ограничена их общей постоянной суммой (например, 1). При создании графика масштаб долей по умолчанию изменяется таким образом, чтобы эта сумма была равна 1 для каждого наблюдения

В нашем случае вполне естественно построить тернарный график для переменных, обозначающим измененение курса евро.

Двумерный тернарный график переменных, обозначающих вероятности изменения курса.

Лица Чернова

Лица Чернова это один из наиболее искусно разработанных типов пиктографиков. Для каждого наблюдения рисуется отдельное лицо . Переменные представлены как формы и размеры отдельных черт лица (например, длина носа, угол между бровями, ширина лица). Соответствие представленных на графике переменных конкретным чертам лица могут быть установлены в диалоговом окне

Покажем на нашем примере, как можно применять опцию включить подгруппы .

На вкладке Дополнительно нажмём кнопку Выделить пиктограммы и в появившемся окне укажем условие выбора: v3>34,5 (то есть мы хотим выделить пиктограммы, которые соответствуют дням, в которых курс евро был более 34,5).

Окно Задать подгруппы

На вкладке Дополнительно окна Пиктографики укажем переменные: Категориальная и Номинальная

Пиктограмма Лица Чернова

Ширина лица соответствует номинальной переменной, а уровень уха - категориальной. Пунктирной рамкой обведены лица, построенные по наблюдениям, удовлетворяющие указанному условию.

Лица Чернова (Chernoff Faces) - это схема визуального представления мультивариативных данных в виде человеческого лица. Каждая часть лица: нос, глаза, рот - представляет собой значение определенной переменной, назначенной для этой части (всего 18).

Основная идея в том, что для человека очень естесственно смотреть на лица, ведь все люди делают это каждый день. Поэтому анализ данных получается эдаким «натуралистичным». Легко делать сравнения и легко выявлять отклонения. Даже блондинки смогут производить мультивариативный анализ значительного количества данных.

В 1981 году Бернард Флури и Ганс Ридвил (Bernhard Flury and Hans Riedwyl) улучшили концепцию и добавили лицам Чернова асимметрию. Таким образом количество переменных увеличилось вдвое - до 36.

Итак, каждое лицо - это массив из 18 элементов, каждый из которых принимает значение от 0 до 1. Значению соответствует внешний вид соответствующей части лица. Параметры исследуемых объектов приводятся к этим значениям. Экстремумы реальных данных будут приняты как 0 и 1. Все остальное - лежащим в этом промежутке. По полученному массиву конструируется лицо.

Или под катом


Вот какие параметры задаются у лица:

1. Размер глаза
2. Размер зрачка
3. Позиция зрачка
4. Наклон глаза
5. Горизонтальная позиция глаза
6. Вертикальная позиция глаза
7. Изгиб брови
8. Плотность брови
9. Горизонтальная позиция брови
10. Вертикальная позиция брови
11. Верхняя граница волос
12. Нижняя граница волос
13. Обвод лица
14. Темнота волос
15. Наклон штриховки волос
16. Нос
17. Размер рта
18. Изгиб рта

Сложность заключается в правильном сопоставлении исследуемых переменных с частями лица. При ошибке важные закономерности могут остаться незамеченными.

Флури приводит пример удачного анализа с помощью лиц. Он проанализировал 100 реальных и 100 поддельных банкнот по параметрам размера границ, отступов и диагоналей. Вот что получилось:

Поддельные банкноты четко выделились в отдельную группу. Таким образом анализ позволил выявить различающиеся группы объектов.

Асимметрия позволяет рассматривать объекты в прогрессе. Второй пример показывает различные параметры у пациентов, к которым применялось лечение. Левая сторона лица показывает значения параметров до, а правая - после лечения.

Посмотрите как изменилось состояние параметров. Легко можно понять кому и насколько стало лучше, даже не вникая в сущность исследуемых параметров.

Статью Graphical Representation of Multivariate Data by Means of Asymmetrical Faces (by Bernard Flury and Hans Riedwyl) можно почитать на JSTOR

Если у вас нет доступа, я могу вам ее прислать в обмен на интересую ссылку, о которой я еще не знаю.

Рис.: Смайлы трех типов выражения лица

Эмоциями называют более или менее устойчивые психические состояния, выражающие отношение человека к другим людям, к самому себе, к окружающей жизни. У человека выявлено шесть универсальных эмоций: грусть, гнев, радость, страх, отвращение и удивление. Центр распознавания эмоций находится в правом полушарии головного мозга. Каждая эмоция отображается на лице, поэтому выражения лица являются надежным индикатором эмоционального состояния человека. Брови, глаза и рот являются главными элементами на лице, посредством которых выражаются и опознаются эмоциональные состоянии я человека.
Информация из окружающей среды, которую воспринимает человек, вызывает у него определенные эмоции. Информация и эмоции служат основой для принятия решения и осуществления действий. Однако кроме объективной информации человек нуждается и в получении субъективной информации, т.е. эмоций. Она может исходить от людей, с которыми человек контактирует, либо синтезированных эмоций, которые вырабатываются индикаторами эмоций в технической системе, а также через «лица Чернова» – гаджеты. Гаджет (англ. gadget - приспособление) - оригинальное, нестандартное техническое приспособление.

I. Коммуникаторы - индикаторы с анимированными эмоциями

Автомобильный коммуникатор DriveMotion (индикатор эмоций) предназначен для неформального общения водителей. Транслирует на дисплей заранее запрограммированные символы-смайлы, выражающие эмоции. Дисплей крепится на заднее стекло автомобиля и позволяет сообщить водителю машины, которая находится сзади, различные эмоциональные смайлы и тексты. Коммуникаторы DriveMotion разработаны в Англии. Их выпускают несколько типов:

2. Запрограммированные на 5 символов, обозначающие различные эмоции: грусть, радость, злость, удивление, благодарность

3. "Русская версия" - запрограммирована на смайлики: улыбка, злость. Слова: "спасибо", "извини", "догони"

4. "Русская версия-2" - запрограммирована на смайлики: улыбка, флирт, злость. Слова: "спасибо", "извини"

5. "Настоящий мужчина" - специально разработанная версия для мужчин. Выводит следующие предложения: "спасибо" + улыбка, "привет" + "милая", "извини" + "братан", "идиот" + гнев, "не тронь" + "я псих"

6. "Гламурная девушка" - версия для девушек. Оформлена в стиле "гламур". Выводит на дисплей предложения: "догони" + язык, "упс" + извини, "не надо" + "биби", "сам такой" + грусть, "спасибо" + анимированный поцелуй

7. "Конструктор" Drivemotion c 500 вариантами эмоций.

II. Коммуникатор эмоций для производства

Управление сложной системой в экстремальных условиях требует от оператора высокого профессионализма и эмоциональной устойчивости. В процессе восприятия информации с пульта ей необходимо дать и эмоциональную оценку. В условиях дефицита времени индикатор эмоций (синоним: эмоциональный индикатор), который установлен на пульте управления, может ускорить принятие решения и предотвратить возникновение ошибки из-за стресса.
В 1971 году на щите управления установки для производства формалина, с использованием серебряного катализатора, (Сланцехимический комбинат «Кивиыли», Эстония) был установлен дисплей, на котором высвечивались смайлы (см. рисунок). Если температура в реакторе была в норме, то выражение лица на смайле было нейтральное. При оптимальной температуре смайл был позитивный.(Оптимальное значение параметров расчитывалось на ЭВМ с использованием математической модели синтеза формалина, поскольку серебряный катализатор постепенно терял свою активность). При выходе температуры за пределы нормы «лицо» имело негативное выражение. Экспериментальная проверка такого пиктографического индикатора эмоций показала, что операторы вели режим более успешно, чем только по прибору КИП, на котором показывалась температура в реакторе. На это новшество была оформлена заявка на изобретение (автор инженер-технолог В. М. Лившиц). Заявка не была принята. По-видимому, в те далекие годы необходимость использовать пиктографические эмоциальные индикаторы в технике еще не была осознана.

III. Лица Чернова

В 1973 году известный американский математик Герман Чернов (Herman Chernoff) предложил метод визуализации для иллюстрации тенденций в многомерных данных путем изображения их в виде пиктографики серии лиц (Лица Чернова – Chernoff Faces). Лица Чернова были особенно эффективны, поскольку они связали элементы лица (ширина лица уровня ушей, радиус ушей, длина или искривления рта, длина носа и т.д.) с характеристиками изучаемой системы.
Метод Германа Чернова позволяет оценивать состояние многофакторных систем, используя врожденную способность человека быстро оценивать изменения в лице человека по многим параметрам. Этим способом можно отображать 10-20-мерные множества в двухмерной и трехмерной графике(3-D). Этот метод широко используют для быстрой оценки методов лечения, массива статистических данных, нахождения фальшивых денег, оценки режима на атомных электростанциях, в авиации, спорте и т.д. Коммуникатор эмоций для управления производством формалина можно рассматривать также как одну из форм пиктографики лица.

Индикаторы эмоций и Лица Чернова - характерный пример проникновения методов психологии для изучения и управления сложными системами. Отметим также, что в нашу креативную эру эмоциональный интеллект (EQ) стремительно развивается, а пиктограммы индикатора эмоций и пиктографика Чернова наглядно демонстрируют эффективность и важность такого подхода.

Литература:
* Herman Chernoff (1973). "The Use of Faces to Represent Points in K-Dimensional Space Graphically". Journal of the American Statistical Association 68 (342): 361–368 (http://www.jstor.org/pss/2284077)
* Литвиненко Д. Метод анализа данных "Лица Чернова" и их развитие с помощью асимметрии (http://nordisk.pp.ru/design/?page=13)

Легко распознают лица и без затруднения воспринимают небольшие изменения в нём.

Для каждого наблюдения рисуется отдельное «лицо», где относительные значения выбранных переменных представлены как формы и размеры отдельных черт лица (например, длина носа, угол между бровями, ширина лица). Таким образом, наблюдатель может идентифицировать уникальные для каждой конфигурации значений наглядные характеристики объектов.

Параметры лица

Может использоваться, например, 18 параметров: размер глаза, размер зрачка, позиция зрачка, наклон глаза, горизонтальная позиция глаза, вертикальная позиция глаза, изгиб брови, плотность брови, горизонтальная позиция брови, вертикальная позиция брови, верхняя граница волос, нижняя граница волос, обвод лица, темнота волос, наклон штриховки волос, нос, размер рта, изгиб рта.

Напишите отзыв о статье "Лица Чернова"

Примечания

Литература

Ссылки

Отрывок, характеризующий Лица Чернова

– Вы к графу Кириллу Владимировичу, ma chere? – сказал граф из столовой, выходя тоже в переднюю. – Коли ему лучше, зовите Пьера ко мне обедать. Ведь он у меня бывал, с детьми танцовал. Зовите непременно, ma chere. Ну, посмотрим, как то отличится нынче Тарас. Говорит, что у графа Орлова такого обеда не бывало, какой у нас будет.

– Mon cher Boris, [Дорогой Борис,] – сказала княгиня Анна Михайловна сыну, когда карета графини Ростовой, в которой они сидели, проехала по устланной соломой улице и въехала на широкий двор графа Кирилла Владимировича Безухого. – Mon cher Boris, – сказала мать, выпрастывая руку из под старого салопа и робким и ласковым движением кладя ее на руку сына, – будь ласков, будь внимателен. Граф Кирилл Владимирович всё таки тебе крестный отец, и от него зависит твоя будущая судьба. Помни это, mon cher, будь мил, как ты умеешь быть…
– Ежели бы я знал, что из этого выйдет что нибудь, кроме унижения… – отвечал сын холодно. – Но я обещал вам и делаю это для вас.
Несмотря на то, что чья то карета стояла у подъезда, швейцар, оглядев мать с сыном (которые, не приказывая докладывать о себе, прямо вошли в стеклянные сени между двумя рядами статуй в нишах), значительно посмотрев на старенький салоп, спросил, кого им угодно, княжен или графа, и, узнав, что графа, сказал, что их сиятельству нынче хуже и их сиятельство никого не принимают.
– Мы можем уехать, – сказал сын по французски.
– Mon ami! [Друг мой!] – сказала мать умоляющим голосом, опять дотрогиваясь до руки сына, как будто это прикосновение могло успокоивать или возбуждать его.
Борис замолчал и, не снимая шинели, вопросительно смотрел на мать.
– Голубчик, – нежным голоском сказала Анна Михайловна, обращаясь к швейцару, – я знаю, что граф Кирилл Владимирович очень болен… я затем и приехала… я родственница… Я не буду беспокоить, голубчик… А мне бы только надо увидать князя Василия Сергеевича: ведь он здесь стоит. Доложи, пожалуйста.
Швейцар угрюмо дернул снурок наверх и отвернулся.
– Княгиня Друбецкая к князю Василию Сергеевичу, – крикнул он сбежавшему сверху и из под выступа лестницы выглядывавшему официанту в чулках, башмаках и фраке.
Мать расправила складки своего крашеного шелкового платья, посмотрелась в цельное венецианское зеркало в стене и бодро в своих стоптанных башмаках пошла вверх по ковру лестницы.
– Mon cher, voue m"avez promis, [Мой друг, ты мне обещал,] – обратилась она опять к Сыну, прикосновением руки возбуждая его.
Сын, опустив глаза, спокойно шел за нею.
Они вошли в залу, из которой одна дверь вела в покои, отведенные князю Василью.
В то время как мать с сыном, выйдя на середину комнаты, намеревались спросить дорогу у вскочившего при их входе старого официанта, у одной из дверей повернулась бронзовая ручка и князь Василий в бархатной шубке, с одною звездой, по домашнему, вышел, провожая красивого черноволосого мужчину. Мужчина этот был знаменитый петербургский доктор Lorrain.
– C"est donc positif? [Итак, это верно?] – говорил князь.
– Mon prince, «errare humanum est», mais… [Князь, человеку ошибаться свойственно.] – отвечал доктор, грассируя и произнося латинские слова французским выговором.
– C"est bien, c"est bien… [Хорошо, хорошо…]
Заметив Анну Михайловну с сыном, князь Василий поклоном отпустил доктора и молча, но с вопросительным видом, подошел к ним. Сын заметил, как вдруг глубокая горесть выразилась в глазах его матери, и слегка улыбнулся.

Похожие публикации