Файл: Руководство для профессиональных аналитиков москва 2009 rv удк 001. 51 Ббк72 с 40.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 05.12.2023
Просмотров: 540
Скачиваний: 4
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
I
измерениях числа обеспечивают некоторую экономию при передаче информации. Вместо сообщения о том, что «D» признан наименее интеллектуально развитым,
С — следующим за ним, А — вторым после самого интеллектуально развитого, а В - самым интеллектуально развитым», мы можем оформить следующую таблицу 2:
Таблица 2
Имя менеджера
А
В
С
D
Отметка на шкале
3
4
2
1
Не существует закона, запрещающего кому-либо складывать, вычитать, умножать и производить другие операции над числами, которые присвоены предметам в ходе порядкового измерения. Однако результаты этих операций могут и ничего не говорить о количествах анализируемого свойства, которым обладают предметы, соответствующие этим числам.
Результаты арифметических действий здесь нельзя интерпретировать таким образом, будто они говорят нам что-либо о количествах свойства, которым фактически обладают предметы. Вы можете делать с числами, которые вы получаете, все, что угодно, но вы всегда столкнетесь с вопросом: «Имеют ли какое-нибудь значение результаты этих операций?»
Интервальное
измерение
возможно, когда измеритель способен определить не только количества свойства в предметах (характеристика порядкового измерения), но также фиксировать равные различия между предметами. Для интервального измерения устанавливается единица измерения (градус, доллар, сантиметр, грамм и т.д.). Предмету присваивается число, равное количеству единиц измерения, которое эквивалентно количеству имеющегося свойства.
Например, температура некоторого металлического бруска составляет 86" по Цельсию. Важная особенность, отличающая интервальное измерение от измерения отношения (которое будет рассмотрено ниже), состоит в том, что оцениваемое свой- ство предмета вовсе не пропадает, когда результат измерения равен нулю. Так, вода при О" С имеет все же некоторую температуру. Точка нуль на интервальной шкале произвольна. Числа, приписываемые в процессе интервального измерения, имеют свойства однозначности и упорядоченности. Кроме того, в данном случае существенна и разница между числами.
Число, присвоенное предмету, представляет собой количество единиц измерения, которое он имеет.
Исчисление лет - типичная интервальная шкала. Год первый был выбран произвольно как «год рождения»
Христа. Единица измерения - период в 365 дней.
Интервальное измерение - это такое присвоение чисел предметам, когда равные разности чисел соответствуют равным разностям значений измеряемого признака или свойства предметов.
Измерение отношений отличается от интервального только тем, что нулевая точка не произвольна, а указывает на полное отсутствие измеряемого свойства.
Измеритель может заметить отсутствие свойства и имеет единицу измерения, позволяющую регистрировать различающиеся значения признака. Равные значения чисел, присвоенных при измерении, отражают равные предметы. Кроме того, раз нулевая точка не произвольна, а абсолютна, то не лишено смысла утверждение, что у объекта М в два, три или четыре раза больше свойства, чем у объекта N. Рост и вес являются примерами шкал измерения отношений. Нулевого роста вообще не существует, а мужчина ростом 183 см в два раза выше мальчика, имеющего рост 91,5 см. Шкала отношений называется так потому, что отношения чисел для нее существенны. Эти отношения можно интерпретировать как отношения значений свойств измеряемых объектов.
Установление отношения применительно к точной интервальной шкале в терминах количества свойства в объектах не имеет смысла. Например, если 3 июня максимальная температура была 32° С, а 17 марта - 8° С, то неправильно говорить, что 3 июня была температура в четыре раза выше, чем 17 марта.
218 219
В системной аналитике, кадровом менеджменте большинство измерений относится к номинальному, порядковому и интервальному уровням (например, предвыборные рейтинги кандидатов). Лишь наименее важные переменные в этих областях допускают пока измерение отношений: в действительности шкалы, удовлетворяющие условиям интервальной шкалы, молено найти с трудом. Иногда переменные шкалы отношений, такие как время (решения задачи или заучивания списка слов), рост, вес или расстояние, могут представлять интерес, но это бывает нечасто
(например, в страховом деле).
7.2. Предмет социальной статистики
Понятие и термин статистика происходит от латинского слова «статус», которое в переводе означает положение, состояние явлений. В настоящее время этот термин употребляется в различных значениях, а именно:
1. Под статистикой понимают итоговые показате ли, характеризующие различные стороны общественной жизни, население, стратификацию общества, производ ство, распределение, обмен, потребление и т.д.
2. Статистикой называют практическую деятель ность по сбору и обобщению соответствующих данных.
3. И, наконец, статистикой называют обществен ную науку, занимающуюся разработкой методологии сбора и теоретического обобщения цифровых данных об обществе.
Вся статистика, поскольку она изучает общество, может быть названа социальной в широком смысле слова.
В процессе ее развития выделилась экономическая статистика и статистика в узком смысле слова, изучающая явления политики, культуры, демографии. Этой статистике в узком смысле слова и будет посвящена эта часть книги. Собственно в социальной статистике властвуют вероятностные законы. В ней приходится иметь дело с большими числовыми массивами. И, переходя от измерительного акта к статистическому обобщению, мы восходим от индивидуальных показателей к обобщенным.
Без знания фундаментальных законов статистики это таинство возникновения обобщенных показателей вызывает затруднения у исследователя. Выделяются две главные функции статистики.
Статистика является инструментом упорядочивания огромных массивов собранной информации.
Американцы, мастера образных выражений, используют термин «boiling down», т.е. «выпаривание информационного массива». Описательная статистика особенно важна в ситуациях, когда необходимо установить взаимосвязь между более чем двумя переменными. Огромное количество «сырых» данных с помощью методов описательной статистики может быть сведено к нескольким показателям, которые характеризуют всю совокупность опрошенных людей или учтенных материальных объектов. В зависимости от задачи это могут быть мода, медиана, средняя, коэффициент корреляции и т.д.
Индуктивная статистика используется для формулирования общих законов по данным наблюдений повторяющихся закономерностей. Логические выводы на основе обработки статистических данных также относятся к индуктивной функции статистики. К категориям или наиболее общим понятиям статистики относятся:
• статистическая совокупность;
• закон больших чисел;
• обобщающий показатель.
Рассмотрим каждое из этих понятий по отдельности, потому что именно с ними чаще всего приходится сталкиваться системным аналитикам в их практической деятельности.
Массовые общественные явления выступают в форме особых групп явлений и процессов, называемых
статистическими совокупностями, поскольку они объединяются на основании наличия некоторых общих признаков или свойств. Статистическая совокупность состоит из отдельных элементов, явлений или единиц - первичных неделимых элементов изучаемого процесса.
Например, в совокупности экспертов финансового рынка
220 221
Так, несмотря на то, что смерть отдельного наугад взятого человека является непредсказуемым явлением и итоговый возраст является случайной величиной, средняя продолжительность жизни в масштабах одной страны из года в год меняется мало.
Обобщающие социальные показатели могут быть разделены на две большие группы: экстенсивные
(объемные) и интенсивные показатели. Экстенсивные
социальные показатели характеризуют объем, массу социально-экономических и политических явлений.
Они получаются как итог непосредственного подсчета или суммирования статистических данных. К ним относятся: число научных учреждений и численность научных работников, численность избирателей, отдающих голоса той или иной партии и т.д.
Экстенсивные показатели представляют собой абсолютные величины. Они всегда именованы, т.е. имеют какую-либо единицу измерения. Книжная продукция измеряется числом выпущенных книг, преступность - числом преступлений и т.д.
Экстенсивные статистические показатели могут быть выражены с различной степенью точности в зависимости от размеров совокупности. Если число жителей крупного города показывать с точностью до одного человека, то результат на первый взгляд покажется убедительным, каким всегда выглядит число без нулей, а на самом деле как минимум три последние цифры окажутся недостоверными.
Интенсивные
показатели
образуются через отношения.
Иными словами, они являются производными от показателей первого вида.
Интенсивные показатели являются важнейшим инструментом сравнительного анализа в социально- экономической статистике. Например, показатель в медицинской статистике - число больничных коек на
1000 человек населения - образован из двух экстенсивных: общего числа коек и общего числа населения. С помощью подобных показателей можно сравнить уровень медицинского обслуживания, уровень жизни, доходы различных слоев населения в больших и малых странах.
224
Аналитику важно уметь оперировать относительными интенсивными показателями. Эти показатели часто используются при анализе динамики экономического развития. Показатели какого-то года принимают, как говорят, за базовые, а показатели всех последующих лет относят к этой величине. Правильно выстроенные показатели раскрывают статистические закономерности. Значение, важность и даже сверхъестественная сила обобщающих показателей была усвоена еще древними. Широкому внедрению методов анализа данных в 60-70-е годы немало способствовало появление компьютеров, а начиная с 80- х годов - персональных компьютеров. Статистические программные пакеты сделали методы анализа данных более доступными и наглядными: теперь уже не требовалось вручную выполнять трудоемкие расчеты по сложным формулам, строить таблицы и графики - всю эту черновую работу взял на себя компьютер, а человеку осталась главным образом творческая работа: постановка задач, выбор методов их решения и интерпретация результатов.
Результатом появления мощных и удобных пакетов для анализа данных на персональных компьютерах стало резкое расширение и изменение круга потребителей методов анализа данных. Если раньше эти методы рассматривались главным образом как инструмент научных исследований, то, начиная с середины 80-х годов, основными покупателями статистических пакетов (которые продаются в сотнях тысяч копий ежегодно) стали уже не научные, а коммерческие организации, а также государственные и иные учреждения. Таким образом, методы анализа данных и статистические пакеты для компьютеров стали в развитых странах типичным и общеупотребительным инструментом плановых, аналитических, маркетинговых отделов производственных и торговых корпораций, банков и страховых компаний, правительственных, медицинских, образовательных, проектных и иных учреждений. И даже представители мелкого бизнеса часто употребляют методы анализа
225
измерениях числа обеспечивают некоторую экономию при передаче информации. Вместо сообщения о том, что «D» признан наименее интеллектуально развитым,
С — следующим за ним, А — вторым после самого интеллектуально развитого, а В - самым интеллектуально развитым», мы можем оформить следующую таблицу 2:
Таблица 2
Имя менеджера
А
В
С
D
Отметка на шкале
3
4
2
1
Не существует закона, запрещающего кому-либо складывать, вычитать, умножать и производить другие операции над числами, которые присвоены предметам в ходе порядкового измерения. Однако результаты этих операций могут и ничего не говорить о количествах анализируемого свойства, которым обладают предметы, соответствующие этим числам.
Результаты арифметических действий здесь нельзя интерпретировать таким образом, будто они говорят нам что-либо о количествах свойства, которым фактически обладают предметы. Вы можете делать с числами, которые вы получаете, все, что угодно, но вы всегда столкнетесь с вопросом: «Имеют ли какое-нибудь значение результаты этих операций?»
Интервальное
измерение
возможно, когда измеритель способен определить не только количества свойства в предметах (характеристика порядкового измерения), но также фиксировать равные различия между предметами. Для интервального измерения устанавливается единица измерения (градус, доллар, сантиметр, грамм и т.д.). Предмету присваивается число, равное количеству единиц измерения, которое эквивалентно количеству имеющегося свойства.
Например, температура некоторого металлического бруска составляет 86" по Цельсию. Важная особенность, отличающая интервальное измерение от измерения отношения (которое будет рассмотрено ниже), состоит в том, что оцениваемое свой- ство предмета вовсе не пропадает, когда результат измерения равен нулю. Так, вода при О" С имеет все же некоторую температуру. Точка нуль на интервальной шкале произвольна. Числа, приписываемые в процессе интервального измерения, имеют свойства однозначности и упорядоченности. Кроме того, в данном случае существенна и разница между числами.
Число, присвоенное предмету, представляет собой количество единиц измерения, которое он имеет.
Исчисление лет - типичная интервальная шкала. Год первый был выбран произвольно как «год рождения»
Христа. Единица измерения - период в 365 дней.
Интервальное измерение - это такое присвоение чисел предметам, когда равные разности чисел соответствуют равным разностям значений измеряемого признака или свойства предметов.
Измерение отношений отличается от интервального только тем, что нулевая точка не произвольна, а указывает на полное отсутствие измеряемого свойства.
Измеритель может заметить отсутствие свойства и имеет единицу измерения, позволяющую регистрировать различающиеся значения признака. Равные значения чисел, присвоенных при измерении, отражают равные предметы. Кроме того, раз нулевая точка не произвольна, а абсолютна, то не лишено смысла утверждение, что у объекта М в два, три или четыре раза больше свойства, чем у объекта N. Рост и вес являются примерами шкал измерения отношений. Нулевого роста вообще не существует, а мужчина ростом 183 см в два раза выше мальчика, имеющего рост 91,5 см. Шкала отношений называется так потому, что отношения чисел для нее существенны. Эти отношения можно интерпретировать как отношения значений свойств измеряемых объектов.
Установление отношения применительно к точной интервальной шкале в терминах количества свойства в объектах не имеет смысла. Например, если 3 июня максимальная температура была 32° С, а 17 марта - 8° С, то неправильно говорить, что 3 июня была температура в четыре раза выше, чем 17 марта.
218 219
В системной аналитике, кадровом менеджменте большинство измерений относится к номинальному, порядковому и интервальному уровням (например, предвыборные рейтинги кандидатов). Лишь наименее важные переменные в этих областях допускают пока измерение отношений: в действительности шкалы, удовлетворяющие условиям интервальной шкалы, молено найти с трудом. Иногда переменные шкалы отношений, такие как время (решения задачи или заучивания списка слов), рост, вес или расстояние, могут представлять интерес, но это бывает нечасто
(например, в страховом деле).
7.2. Предмет социальной статистики
Понятие и термин статистика происходит от латинского слова «статус», которое в переводе означает положение, состояние явлений. В настоящее время этот термин употребляется в различных значениях, а именно:
1. Под статистикой понимают итоговые показате ли, характеризующие различные стороны общественной жизни, население, стратификацию общества, производ ство, распределение, обмен, потребление и т.д.
2. Статистикой называют практическую деятель ность по сбору и обобщению соответствующих данных.
3. И, наконец, статистикой называют обществен ную науку, занимающуюся разработкой методологии сбора и теоретического обобщения цифровых данных об обществе.
Вся статистика, поскольку она изучает общество, может быть названа социальной в широком смысле слова.
В процессе ее развития выделилась экономическая статистика и статистика в узком смысле слова, изучающая явления политики, культуры, демографии. Этой статистике в узком смысле слова и будет посвящена эта часть книги. Собственно в социальной статистике властвуют вероятностные законы. В ней приходится иметь дело с большими числовыми массивами. И, переходя от измерительного акта к статистическому обобщению, мы восходим от индивидуальных показателей к обобщенным.
Без знания фундаментальных законов статистики это таинство возникновения обобщенных показателей вызывает затруднения у исследователя. Выделяются две главные функции статистики.
Статистика является инструментом упорядочивания огромных массивов собранной информации.
Американцы, мастера образных выражений, используют термин «boiling down», т.е. «выпаривание информационного массива». Описательная статистика особенно важна в ситуациях, когда необходимо установить взаимосвязь между более чем двумя переменными. Огромное количество «сырых» данных с помощью методов описательной статистики может быть сведено к нескольким показателям, которые характеризуют всю совокупность опрошенных людей или учтенных материальных объектов. В зависимости от задачи это могут быть мода, медиана, средняя, коэффициент корреляции и т.д.
Индуктивная статистика используется для формулирования общих законов по данным наблюдений повторяющихся закономерностей. Логические выводы на основе обработки статистических данных также относятся к индуктивной функции статистики. К категориям или наиболее общим понятиям статистики относятся:
• статистическая совокупность;
• закон больших чисел;
• обобщающий показатель.
Рассмотрим каждое из этих понятий по отдельности, потому что именно с ними чаще всего приходится сталкиваться системным аналитикам в их практической деятельности.
Массовые общественные явления выступают в форме особых групп явлений и процессов, называемых
статистическими совокупностями, поскольку они объединяются на основании наличия некоторых общих признаков или свойств. Статистическая совокупность состоит из отдельных элементов, явлений или единиц - первичных неделимых элементов изучаемого процесса.
Например, в совокупности экспертов финансового рынка
220 221
единицей выступает эксперт. Признаки бывают атрибутивные
(описательные), порядковые и количественные.
Соответственно измеряемым признакам подбираются шкалы измерений. Признак также может быть факторным и результативным.
Факторный признак обладает влиянием на признак результативный.
Число, показывающее, как часто встречается данное значение признака в совокупности, называется частотой. Частота, отнесенная к общему объему совокупности, называется «частостью» или объемом признака.
Закон больших чисел - весьма широкий принцип взаимопогашения
(уравновешивания) случайных отклонений. Действие закона состоит в том, что на достаточно большой совокупности проявляются внутренние закономерные связи явлений. Это особенно валено для аналитиков, которые р'аботают в компаниях, управляющих пифами, в больших финансовых корпорациях и т.д. О глубоком содержании и большой практической ценности закона больших чисел хорошо говорится в книге Б.В. Г
НВДЕНКО и А.Я. Х
ИНЧИНА
:
Глубокое содержание закона больших чисел, открытого в середине прошлого столетия великим русским математиком
Ч
ЕБЫШЁВЫМ
,
СОСТОИТ В ТОМ
,
ЧТО
,
В ТО время как отдельная случайная величина может (как мы знаем) часто принимать значения, далекие от ее среднего значения (иметь значительное рассеяние), среднее арифметическое большого числа случайных величин ведет себя в этом отношении совершенно иначе: такая величина очень мало рассеяна, с подавляющей вероятностью она принимает лишь значения, очень близкие к ее среднему значению. Происходит это, конечно, потому, что при взятии среднего арифметического случайные отклонения в ту и другую сторону взаимно уничтожаются, вследствие чего суммарное отклонение в большинстве случаев оказывается малым.
Важное и часто встречающееся в практике использование результатов теоремы Чебышѐва состоит в том, что по сравнительно небольшой пробе (выборке) судят о качестве большого количества однородного материала. Так, например, о качестве хлопка, находящегося в кипе, судят по нескольким его пучочкам (штапелям), выхваченным случайно из разных мест кипы. Или о качестве большой партии зерна судят по нескольким небольшим меркам, наполненным случайно захваченными в мерку зернами из разных мест оцениваемой партии. Суж-
222
(описательные), порядковые и количественные.
Соответственно измеряемым признакам подбираются шкалы измерений. Признак также может быть факторным и результативным.
Факторный признак обладает влиянием на признак результативный.
Число, показывающее, как часто встречается данное значение признака в совокупности, называется частотой. Частота, отнесенная к общему объему совокупности, называется «частостью» или объемом признака.
Закон больших чисел - весьма широкий принцип взаимопогашения
(уравновешивания) случайных отклонений. Действие закона состоит в том, что на достаточно большой совокупности проявляются внутренние закономерные связи явлений. Это особенно валено для аналитиков, которые р'аботают в компаниях, управляющих пифами, в больших финансовых корпорациях и т.д. О глубоком содержании и большой практической ценности закона больших чисел хорошо говорится в книге Б.В. Г
НВДЕНКО и А.Я. Х
ИНЧИНА
:
Глубокое содержание закона больших чисел, открытого в середине прошлого столетия великим русским математиком
Ч
ЕБЫШЁВЫМ
,
СОСТОИТ В ТОМ
,
ЧТО
,
В ТО время как отдельная случайная величина может (как мы знаем) часто принимать значения, далекие от ее среднего значения (иметь значительное рассеяние), среднее арифметическое большого числа случайных величин ведет себя в этом отношении совершенно иначе: такая величина очень мало рассеяна, с подавляющей вероятностью она принимает лишь значения, очень близкие к ее среднему значению. Происходит это, конечно, потому, что при взятии среднего арифметического случайные отклонения в ту и другую сторону взаимно уничтожаются, вследствие чего суммарное отклонение в большинстве случаев оказывается малым.
Важное и часто встречающееся в практике использование результатов теоремы Чебышѐва состоит в том, что по сравнительно небольшой пробе (выборке) судят о качестве большого количества однородного материала. Так, например, о качестве хлопка, находящегося в кипе, судят по нескольким его пучочкам (штапелям), выхваченным случайно из разных мест кипы. Или о качестве большой партии зерна судят по нескольким небольшим меркам, наполненным случайно захваченными в мерку зернами из разных мест оцениваемой партии. Суж-
222
дения о качестве продукции, сделанные на основании такой выборки, обладают большой точностью. Число зерен, захваченных в мерку, хотя и мало по сравнению со всей партией зерна, но само по себе велико и позволяет, согласно закону больших чисел, достаточно точно судить о среднем весе одного зерна и, значит, о качестве всей партии зерна.
Точно так же о двадцатипудовой кипе хлопка судят по маленькому штапелю, содержащему несколько сотен волокон, весящих всего-навсего какую-нибудь десятую долю грамма
46
Из приведенных слов следует, что современному практическому аналитику, имеющему возможность молниеносной обработки больших массивов чисел с помощью быстродействующих компьютеров, все же необходимо понимать значение закона больших чисел.
В период многократных изменений котировок ценных бумаг на фондовой бирже аналитик должен уметь на основании правильно сделанных выборок давать мгновенные рекомендации дилерам и биржевым брокерам, от решения которых зависят миллионные убытки или прибыли клиентов.
Эти две категории, статистическая совокупность и закон больших чисел, находят числовое выражение в важнейшем инструменте статистики - т.н. обобщающем показателе социальной статистики.
Обобщающий показатель социальной статистики
-число, характеризующее одну из особенностей совокупности социальных и экономических явлений
47
В качестве примеров назовем среднюю продолжительность жизни, уровень образования, численность учащихся в области. Обобщающие показатели составляются из индивидуальных. Так, численность обучающихся в одном отдельно взятом вузе (например, в Высшей школе экономики) является единицей статистической совокупности и кирпичиком для подготовки обобщающих показателей. Важнейшая черта обобщающего показателя - его устойчивость по отношению к случайным факторам, которым подвержены индивидуальные показатели.
46 Г
НВДЕНКО
Б.В., Хинчин А.Я. Элементарное введение в теорию вероятностей -М.: Изд-во физико-математической литературы, 1961 47. Социальный показатель здесь понимается в широком смысле слова, т.е. включает все факторы общественной жизни, в том числе и экономику.
223
Точно так же о двадцатипудовой кипе хлопка судят по маленькому штапелю, содержащему несколько сотен волокон, весящих всего-навсего какую-нибудь десятую долю грамма
46
Из приведенных слов следует, что современному практическому аналитику, имеющему возможность молниеносной обработки больших массивов чисел с помощью быстродействующих компьютеров, все же необходимо понимать значение закона больших чисел.
В период многократных изменений котировок ценных бумаг на фондовой бирже аналитик должен уметь на основании правильно сделанных выборок давать мгновенные рекомендации дилерам и биржевым брокерам, от решения которых зависят миллионные убытки или прибыли клиентов.
Эти две категории, статистическая совокупность и закон больших чисел, находят числовое выражение в важнейшем инструменте статистики - т.н. обобщающем показателе социальной статистики.
Обобщающий показатель социальной статистики
-число, характеризующее одну из особенностей совокупности социальных и экономических явлений
47
В качестве примеров назовем среднюю продолжительность жизни, уровень образования, численность учащихся в области. Обобщающие показатели составляются из индивидуальных. Так, численность обучающихся в одном отдельно взятом вузе (например, в Высшей школе экономики) является единицей статистической совокупности и кирпичиком для подготовки обобщающих показателей. Важнейшая черта обобщающего показателя - его устойчивость по отношению к случайным факторам, которым подвержены индивидуальные показатели.
46 Г
НВДЕНКО
Б.В., Хинчин А.Я. Элементарное введение в теорию вероятностей -М.: Изд-во физико-математической литературы, 1961 47. Социальный показатель здесь понимается в широком смысле слова, т.е. включает все факторы общественной жизни, в том числе и экономику.
223
Так, несмотря на то, что смерть отдельного наугад взятого человека является непредсказуемым явлением и итоговый возраст является случайной величиной, средняя продолжительность жизни в масштабах одной страны из года в год меняется мало.
Обобщающие социальные показатели могут быть разделены на две большие группы: экстенсивные
(объемные) и интенсивные показатели. Экстенсивные
социальные показатели характеризуют объем, массу социально-экономических и политических явлений.
Они получаются как итог непосредственного подсчета или суммирования статистических данных. К ним относятся: число научных учреждений и численность научных работников, численность избирателей, отдающих голоса той или иной партии и т.д.
Экстенсивные показатели представляют собой абсолютные величины. Они всегда именованы, т.е. имеют какую-либо единицу измерения. Книжная продукция измеряется числом выпущенных книг, преступность - числом преступлений и т.д.
Экстенсивные статистические показатели могут быть выражены с различной степенью точности в зависимости от размеров совокупности. Если число жителей крупного города показывать с точностью до одного человека, то результат на первый взгляд покажется убедительным, каким всегда выглядит число без нулей, а на самом деле как минимум три последние цифры окажутся недостоверными.
Интенсивные
показатели
образуются через отношения.
Иными словами, они являются производными от показателей первого вида.
Интенсивные показатели являются важнейшим инструментом сравнительного анализа в социально- экономической статистике. Например, показатель в медицинской статистике - число больничных коек на
1000 человек населения - образован из двух экстенсивных: общего числа коек и общего числа населения. С помощью подобных показателей можно сравнить уровень медицинского обслуживания, уровень жизни, доходы различных слоев населения в больших и малых странах.
224
Аналитику важно уметь оперировать относительными интенсивными показателями. Эти показатели часто используются при анализе динамики экономического развития. Показатели какого-то года принимают, как говорят, за базовые, а показатели всех последующих лет относят к этой величине. Правильно выстроенные показатели раскрывают статистические закономерности. Значение, важность и даже сверхъестественная сила обобщающих показателей была усвоена еще древними. Широкому внедрению методов анализа данных в 60-70-е годы немало способствовало появление компьютеров, а начиная с 80- х годов - персональных компьютеров. Статистические программные пакеты сделали методы анализа данных более доступными и наглядными: теперь уже не требовалось вручную выполнять трудоемкие расчеты по сложным формулам, строить таблицы и графики - всю эту черновую работу взял на себя компьютер, а человеку осталась главным образом творческая работа: постановка задач, выбор методов их решения и интерпретация результатов.
Результатом появления мощных и удобных пакетов для анализа данных на персональных компьютерах стало резкое расширение и изменение круга потребителей методов анализа данных. Если раньше эти методы рассматривались главным образом как инструмент научных исследований, то, начиная с середины 80-х годов, основными покупателями статистических пакетов (которые продаются в сотнях тысяч копий ежегодно) стали уже не научные, а коммерческие организации, а также государственные и иные учреждения. Таким образом, методы анализа данных и статистические пакеты для компьютеров стали в развитых странах типичным и общеупотребительным инструментом плановых, аналитических, маркетинговых отделов производственных и торговых корпораций, банков и страховых компаний, правительственных, медицинских, образовательных, проектных и иных учреждений. И даже представители мелкого бизнеса часто употребляют методы анализа
225
данных либо самостоятельно, либо обращаясь к услугам консультационных компаний.
Приведем несколько примеров применения компьютерных методов статистического анализа данных в практических задачах.
1. Предположим, что Вы ввели важное нововведе ние: изменили систему оплаты труда, перешли на вы пуск новой продукции, использовали новую технологию и т.п. Вам кажется, что это дало положительный эффект, но действительно ли это так? А может быть, этот кажу щийся эффект определен вовсе не вашим нововведени ем, а естественной случайностью, и уже завтра Вы полу чите прямо противоположный, столь же случайный эф фект? Для решения этой задачи надо сформировать два набора чисел, каждый из которых содержит значения интересующего Вас показателя эффективности (до и по сле нововведения). Статистические критерии сравнения двух выборок покажут Вам, случайны или неслучайны различия этих двух рядов чисел.
2. Другая важная задача - прогнозирование будуще го поведения некоторого временного ряда: изменения курса доллара, цен и спроса на продукцию или сырье и т.д. Для такого временного ряда с помощью статисти ческого пакета программ подбирают некоторое аналити ческое уравнение - строят регрессионную прямую. Если мы предполагаем, что на интересующий нас показа тель влияют некоторые другие факторы, их тоже можно включить в модель, предварительно (с помощью того же статистического пакета) проверив существенность (зна чимость) этого влияния. Затем на основе построенной модели можно сделать прогноз и указать его точность.
3. Во многих технологических процессах необходи мо систематически контролировать состояние процесса, чтобы вовремя вмешаться при его отклонениях от нор мального режима и предотвратить тем самым потери от выпуска некачественной продукции. Для этого ис пользуются статистические методы контроля качества, повсеместное и неукоснительное применение которых во многом определило поразительные успехи японской
226 промышленности. Здесь мы наблюдаем замечательный пример внедрения статистических методов в широкую практику. Японскими специалистами были отобраны наиболее простые правила для оценивания динамики изменения качества продукции и его наглядного представления. Эти правила выражены самыми простейшими словами, и японские рабочие выучивают их наизусть как молитву, после чего каждый простой рабочий знает, при каких обстоятельствах производственный процесс в порядке, когда надо быть настороже, а когда срочно вызывать бригаду наладчиков.
4. Еще одна интересная и часто встречающаяся за дача связана с классификацией объектов. Пусть, напри мер, Вы являетесь начальником кредитного отдела бан ка. Столкнувшись с невозвратом кредитов, Вы решаете впредь выдавать кредиты лишь фирмам, которые «схо жи» с теми, которые себя хорошо зарекомендовали, и не выдавать тем, которые «схожи» с неплательщиками или мошенниками. Для классификации фирм можно собрать показатели их деятельности (например, размер основ ных фондов, валюту баланса, вид деятельности, объем реализации и т.д.) и провести кластерный анализ (в бо лее сложных случаях - многомерное шкалирование) этих данных. Во многих случаях имеющиеся объекты удастся сгруппировать в несколько групп (кластеров), и Вы смо жете увидеть, не принадлежит ли запрашивающая кре дит фирма к группе неплательщиков.
5. Аналогичный пример: пусть у Вас имеются дан ные о различных сортах пива, каждый из которых ха рактеризуется множеством переменных: цвет, содержа ние алкоголя, других веществ, калорийность и т.п. Вы хотите закупать и продавать наиболее дешевое пиво, но близкое по совокупности свойств к очень престижному и дорогому сорту. С помощью тех же методов Вы сможе те решить и эту задачу.
Методы статистического анализа являются универсальными и могут применяться в самых разных областях человеческой деятельности.
Скажем, предсказание курса доллара и прогноз спроса на автомобили делаются с по-
227
Приведем несколько примеров применения компьютерных методов статистического анализа данных в практических задачах.
1. Предположим, что Вы ввели важное нововведе ние: изменили систему оплаты труда, перешли на вы пуск новой продукции, использовали новую технологию и т.п. Вам кажется, что это дало положительный эффект, но действительно ли это так? А может быть, этот кажу щийся эффект определен вовсе не вашим нововведени ем, а естественной случайностью, и уже завтра Вы полу чите прямо противоположный, столь же случайный эф фект? Для решения этой задачи надо сформировать два набора чисел, каждый из которых содержит значения интересующего Вас показателя эффективности (до и по сле нововведения). Статистические критерии сравнения двух выборок покажут Вам, случайны или неслучайны различия этих двух рядов чисел.
2. Другая важная задача - прогнозирование будуще го поведения некоторого временного ряда: изменения курса доллара, цен и спроса на продукцию или сырье и т.д. Для такого временного ряда с помощью статисти ческого пакета программ подбирают некоторое аналити ческое уравнение - строят регрессионную прямую. Если мы предполагаем, что на интересующий нас показа тель влияют некоторые другие факторы, их тоже можно включить в модель, предварительно (с помощью того же статистического пакета) проверив существенность (зна чимость) этого влияния. Затем на основе построенной модели можно сделать прогноз и указать его точность.
3. Во многих технологических процессах необходи мо систематически контролировать состояние процесса, чтобы вовремя вмешаться при его отклонениях от нор мального режима и предотвратить тем самым потери от выпуска некачественной продукции. Для этого ис пользуются статистические методы контроля качества, повсеместное и неукоснительное применение которых во многом определило поразительные успехи японской
226 промышленности. Здесь мы наблюдаем замечательный пример внедрения статистических методов в широкую практику. Японскими специалистами были отобраны наиболее простые правила для оценивания динамики изменения качества продукции и его наглядного представления. Эти правила выражены самыми простейшими словами, и японские рабочие выучивают их наизусть как молитву, после чего каждый простой рабочий знает, при каких обстоятельствах производственный процесс в порядке, когда надо быть настороже, а когда срочно вызывать бригаду наладчиков.
4. Еще одна интересная и часто встречающаяся за дача связана с классификацией объектов. Пусть, напри мер, Вы являетесь начальником кредитного отдела бан ка. Столкнувшись с невозвратом кредитов, Вы решаете впредь выдавать кредиты лишь фирмам, которые «схо жи» с теми, которые себя хорошо зарекомендовали, и не выдавать тем, которые «схожи» с неплательщиками или мошенниками. Для классификации фирм можно собрать показатели их деятельности (например, размер основ ных фондов, валюту баланса, вид деятельности, объем реализации и т.д.) и провести кластерный анализ (в бо лее сложных случаях - многомерное шкалирование) этих данных. Во многих случаях имеющиеся объекты удастся сгруппировать в несколько групп (кластеров), и Вы смо жете увидеть, не принадлежит ли запрашивающая кре дит фирма к группе неплательщиков.
5. Аналогичный пример: пусть у Вас имеются дан ные о различных сортах пива, каждый из которых ха рактеризуется множеством переменных: цвет, содержа ние алкоголя, других веществ, калорийность и т.п. Вы хотите закупать и продавать наиболее дешевое пиво, но близкое по совокупности свойств к очень престижному и дорогому сорту. С помощью тех же методов Вы сможе те решить и эту задачу.
Методы статистического анализа являются универсальными и могут применяться в самых разных областях человеческой деятельности.
Скажем, предсказание курса доллара и прогноз спроса на автомобили делаются с по-
227