Первая страница
Наша команда
Контакты
О нас

    Головна сторінка



Звіт про науково-дослідну роботу (ндр) «Багатовимірне моделювання людського розвитку» Керівник ндр заст директора з наукової роботи, д-р екон наук, стар наук співроб

Скачати 118.34 Kb.

Звіт про науково-дослідну роботу (ндр) «Багатовимірне моделювання людського розвитку» Керівник ндр заст директора з наукової роботи, д-р екон наук, стар наук співроб




Скачати 118.34 Kb.
Дата конвертації15.05.2017
Розмір118.34 Kb.
ТипЗвіт


НАЦІОНАЛЬНА АКАДЕМІЯ НАУК УКРАЇНИ

ІНСТИТУТ ДЕМОГРАФІЇ ТА СОЦІАЛЬНИХ

ДОСЛІДЖЕНЬ імені М.В.

Нан (фр. Nans) - муніципалітет у Франції, у регіоні Франш-Конте, департамент Ду. Населення - 90 осіб (2011).

ПТУХи (ІДСД НАН УКРАЇНИ)

01032, м. Київ, бульв. Т.Шевченка, 60

тел./факс: (044) 486-62-37

Анотований Звіт

ПРО НАУКОВО-ДОСЛІДНУ РОБОТУ (НДР)

«Багатовимірне моделювання людського розвитку»


Керівник НДР

заст. директора з наукової роботи,

д-р. екон. наук, стар. наук. співроб.


_____________________ О.М.Гладун


_________________________ 2012 р.


Київ – 2012
Мета роботи: встановлення та дослідження закономірностей людського розвитку на базі використання багатовимірних моделей.

Методи дослідження: системний підхід;

Систе́мний підхі́д (англ. Systems thinking - системне мислення) - напрям методології досліджень, який полягає в дослідженні об'єкта як цілісної множини елементів в сукупності відношень і зв'язків між ними, тобто розгляд об'єкта як модель системи.

багатовимірне моделювання (кластерний, дискримінантний та факторний аналіз), аналіз взаємозв’язків.

Відповідно до напрямів дослідження, визначених технічним завданням, отримано такі наукові результати.

Фа́кторний ана́ліз - статистичний метод аналізу впливу окремих факторів (чинників) на результативний показник.

Техні́чне завдання́ (ТЗ) (англ. scope statements та англ. statement of work; SOW) - документ, що встановлює основне призначення, показники якості, техніко- економічні та спеціальні вимоги до виробу, обсягу, стадії розроблення та складу конструкторської документації.

1. Сформульовані методологічні положення використання багатовимірного моделювання для дослідження людського розвитку на базі мікроданих (даних вибіркових обстежень). У методологічних положеннях виокремлено два аспекти: загальний та конкретний, який залежить від методів багатовимірного аналізу.

2. У рамках загального аспекту обґрунтовано можливість використання якісних змінних у моделях багатовимірної класифікації шляхом їх перетворення у структурні змінні. При цьому з метою забезпечення методологічної єдності рекомендується кількісні змінні також перетворювати у структурні шляхом виділення певних груп.

Також досліджені різні методи нормування значень показників: з використанням середньоквадратичного відхилення, розмаху варіації, середнього значення, максимального значення, логарифму та гіперболічного тангенсу. Обґрунтовано, що найбільш прийнятним для застосування у багатовимірному моделюванні є нормування на конкретне числове значення показника (стандарт) без проведення додаткових розрахунків, що забезпечує невикривленість ознакового простору. Як стандарт доцільно використовувати середнє, мінімальне тощо значення або інше змістовне значення показника.

3. Розроблено методику розрахунку загального індексу та індексів по блоках показників (які за своєю суттю є багатовимірними) як складову Методики вимірювання регіонального людського розвитку. При цьому розрахунок індексів проводився з використанням нормованих значень показників. При нормуванні як стандартні значення використовувались спеціально обґрунтовані значення показників.

4. Інформаційною базою для проведення моделювання слугували масиви даних обстеження умов життя домогосподарств за період 1999-2010 рр.

Даніел Мігел Алвеш Гомеш (порт. Daniel Miguel Alves Gomes, * 7 серпня 1983, Каракас), насамперед відомий за прізвиськом Данні, - португальський футболіст, атакувальний півзахисник клубу «Зеніт».

, на базі яких були створені спеціальні масиви, придатні для безпосереднього використання у моделях. Для цього було проведено комплексний аналіз вихідної інформації та здійснено додаткові розрахунки (обробка пропущених даних, додавання у масиви по домогосподарствах інформації з масивів по особах, побудова структурних змінних).

5. Досліджені основні методи кластерного аналізу, умови та підходи щодо їх застосування для вирішення поставленої задачі з урахуванням специфіки даних (велика кількість об’єктів та ознак;

Компле́ксний ана́ліз, або тео́рія фу́нкції компле́ксної змі́нної (ТФКЗ) - розділ математики, що вивчає функції, які залежать від комплексної змінної. Використовується у багатьох розділах математики, зокрема у теорії чисел, прикладній математиці та фізиці.

Кластерний аналіз (англ. Data clustering) - задача розбиття заданої вибірки об'єктів (ситуацій) на підмножини, що називаються кластерами, так, щоб кожен кластер складався з схожих об'єктів, а об'єкти різних кластерів істотно відрізнялися.

ознаки виміряні у різних шкалах; відсутні припущення про можливу кількість класів у сукупності). Обґрунтовано доцільність використання для багатовимірної класифікації (кластеризації) методу -середніх. Розглянуті особливості застосування цього методу (модифікації методу, вимоги до даних, форми представлення результатів класифікації).

6. За результатами досліджень з двох модифікацій методу-середніх – з обчисленням центрів кластерів після кожної зміни складу кластеру і без обчислення – за умови використання мінімальної сумарної внутрішньокластерної дисперсії як фунціонала якості рекомендується використовувати модифікацію з обчисленням центрів кластерів у разі кожної зміни їх складу. Враховуючи, що метод -середніх потребує апріорного визначення кількості кластерів, було проведене дослідження, за результатами якого обґрунтовано, що найбільшу стійкість розбиття забезпечує розбиття на три кластери.

7. Проведено аналіз, за результатами якого визначені змінні (тип населеного пункту;

Населений пункт - населене місце (оселище, селище, поселення), первинна одиниця розселення людей у межах однієї забудованої земельної межі (городище (град), місто, містечко, селище міського типу, село, хутір, станиця та ін.).

кількість осіб у домогосподарстві; кількість дітей у домогосподарстві; кількість осіб у непрацездатному віці; кількість працюючих осіб; загальний середньомісячний дохід на одного члена домогосподарства; частка осіб у домогосподарстві з вищою освітою), які розкривають сутність об’єкту, виявляють ті його якісні властивості, які і визначають даний об’єкт, відрізняють його від інших. Включення їх до моделі забезпечує найкращу якість кластеризації.

8. З використанням розроблених методологічних підходів були сформовані типологічні групи населення за 1999-2010 рр. При цьому оцінка якості розбиття проводилась за -критерієм Стьюдента (порівняння середніх значень ознак в окремих кластерах з середніми значеннями в цілому по всій сукупності об’єктів та між кластерами). Стійкість розбиття перевірялась шляхом поділу вихідного набору даних на дві частини і застосуванням для них одного і того ж методу кластеризації.

9. Для змістовної інтерпретації результатів кластеризації (для змінних, за якими відбувалась класифікація) були обрані такі характеристики: розподілення номерів об’єктів по кластерах; відстані від об’єктів до центрів кластерів; середні значення, середньоквадратичні відхилення, розмахи варіації всіх ознак у класі; відхилення середніх значень ознак у класах від загальної середньої і між собою. На підставі аналізу зроблені детальні висновки про структуру сукупності. Класи порівнювались за різноманітними параметрами попарно, або з еталоном для всієї сукупності (середнім або типовим значенням показника).

10. За весь період (1999-2010 рр.) досліджена динаміка характеристик, які визначають кластери (розподіли ознак у кластерах – кількість домогосподарств, відсоток домогосподарств та середні значення ознак у відповідних кластерах, відносні розміри кластерів – та розподіл кластерів по регіонах). Підготовлені аналітичні матеріали щодо динаміки характеристик типологічних груп населення (аналіз динаміки окремих показників у розрізі визначених типологічних груп та аналіз динаміки параметрів моделі кластерного аналізу).

11. На базі результатів кластеризації методами дискримінантного аналізу з використанням структурних змінних був проведений додатковий аналіз якості розбиття та проаналізований вплив різних змінних на результати кластерізації.

Дискриміна́нтний ана́ліз - різновид багатовимірного аналізу, призначеного для вирішення задач розпізнавання образів. Використовується для прийняття рішення про те, які змінні розділюють (тобто «дискримінують») певні масиви даних (так звані «групи»).

12. Результатом теоретичних досліджень методів факторного аналізу є узагальнення особливостей кожного з методів факторного аналізу. Жоден метод не має вагомих переваг щодо іншого, тому і немає і не може бути загальних рекомендації щодо використання того чи іншого методу. Вибір конкретного методу, головним чином, обумовлений метою, з якою застосовується факторний аналіз. Метод головних компонент дає найбільш грубий розв’язок, а метод максимальної правдоподібності дозволяє статистично оцінити мінімально можливу кількість факторів для даного набору ознак.

Теорети́чні дослі́дження - висунення і розвиток наукових гіпотез і теорій, формулювання законів та виведення з них логічних наслідків, зіставлення різних гіпотез і теорій.

Метод максимальної вірогідності (також метод найбільшої вірогідності) у математичній статистиці - це метод оцінювання невідомого параметра шляхом максимізації функції вірогідності. Він ґрунтується на припущенні про те, що вся інформація про статистичну вибірку міститься у функції вірогідності.

13. Як критерій вибору методу факторизації для аналізу даних щодо людського розвитку було використано можливість отримати найбільш просту і доступну для інтерпретації факторну структуру.

Аналіз даних - розділ математики, що займається розробкою методів обробки даних незалежно від їх природи.

Аналіз результатів застосування різних методів дав змогу визначити метод головних компонент, як такий, що найбільше відповідає зазначеному критерію.

14. Факторний аналіз масивів даних обстеження умов життя домогосподарств проводився за сформованим найбільш повним переліком ознак, які стосуються усіх можливих статей сукупних витрат домогосподарства (продукти харчування, одяг, взуття, побутові товари, енергоносії, послуги). Проведений факторний аналіз вказаних ознак для масивів даних по Україні за роки спостереження від 2003 до 2010 показав, що процент поясненої сумарної дисперсії факторами, відібраними за критерієм “піщаного осипу”, не перевищує 60%, що не можна вважати задовільним. При цьому слід зазначити, що перший фактор пояснює від 18% до 30% сумарної дисперсії, а другий – від 8% до 13% у залежності від року спостереження, вибраного методу факторизації та процедури обертання.

15. З метою покращення показника поясненої дисперсії було проведено факторний аналіз для більш однорідних сукупностей об’єктів спостереження, а саме по кожному типу місцевості та кожному регіону окремо. Аналіз по регіонах дозволив підвищити процент поясненої дисперсії в найкращому випадку до 72%. Як засвідчили результати факторного аналізу, стабільно виділявся тільки перший фактор, який відповідав витратам на продукти харчування.

Ї́жа - все, що споживає людина й інші живі істоти для підтримки життя; харчі. Речовини, що їх організм отримує з навколишнього середовища, є для нього будівельним матеріалом і джерелом енергії.

Деякі інші фактори, такі як “турбота про здоров’я”, чи “витрати більш забезпечених людей”, теж проявлялись у більшості випадків. Однак за змістом виділені фактори не характеризували приховані причини, а більш відносились до характеристик певних груп населення. Для перевірки даного припущення було побудовано таблиці спряженості для кожної з виділених факторних ознак та однієї з ознак “тип населеного пункту”, або “тип домогосподарства” (з дітьми чи без дітей). Результати показали наявність кореляційного зв’язку між факторами і вказаними ознаками майже у всіх випадках. На підставі цього зроблено висновок, що методи факторного аналізу можна застосовувати для формування гіпотез щодо споживчої поведінки населення та перевірки цих гіпотез.

16. Проведений аналіз літературних джерел та результатів моделювання процедури факторного аналізу щодо неоднозначності факторного розв’язку дав змогу зробити висновок про неможливість використання отриманих значень факторної ознаки до окремих об’єктів спостереження, оскільки цей метод дає тільки статистично значимий розв’язок (тобто з певною імовірністю попадання в інтервал), однак є надзвичайно корисним для формулювання гіпотез.


Наукову новизну результатів НДР характеризують наступні положення:

вперше:

- отримані типологічні групи населення, що дає змогу досліджувати його структуру за різними ознаками;

- досліджено характеристики, які визначають кластери, описано типологічні групи населення (узагальнені характеристики, які «визначають» кластери) та розглянуто змістовну різницю між кластерами, що проявляється в середніх значеннях показників, за якими проводилось групування, що є підґрунтям для поглибленого дослідження людського розвитку;

- досліджено динаміку характеристик, які визначають кластери, та зміни у розподілі кластерів по регіонах;

- проведено факторний аналіз даних обстеження умов життя домогосподарств за тривалий період (з 2003 по 2010 роки) і досліджено динаміку результатів факторизації. Показано, що результати факторного аналізу є більш якісними для груп домогосподарств, зокрема для груп, які відповідають областям, а не типам місцевості, тобто сукупності за областями є більш однорідними ніж за типами місцевості;

- визначено, що на основі даних обстеження умов життя домогосподарств за допомогою факторного аналізу неможливо побудувати модель структури сукупних витрат домогосподарств для цілей прогнозування через неможливість чітко виразити фактори впливу на ці витрати;

- визначено подальший розвиток методології застосування факторного аналізу щодо критеріїв оцінювання кількості компонент, які підлягають інтерпретації, за методом ентропії Шеннона;

удосконалено:

- методику розрахунку загального індексу людського розвитку та індексів по блоках показників, яка є складовою Методики вимірювання регіонального людського розвитку;

Індекс людського розвитку (ІЛР) (до 2013 року «Індекс розвитку людського потенціалу» (ІРЛП), англ. Human Development Index, HDI)) - інтегральний показник, що розраховується щорічно для міждержавного порівняння і вимірювання рівня життя, грамотності, освіченості і довголіття, як основних характеристик людського потенціалу досліджуваної території.



одержали подальший розвиток:

- використання структурних змінних, які застосовані у моделях кластерного та дискримінантного аналізу;

– методологічні засади дослідження структури даних на базі даних вибіркових обстежень методом -середніх;

В програмуванні та комп'ютерних науках структу́ри да́них - це способи організації даних в комп'ютерах. Часто разом зі структурою даних пов'язується і специфічний перелік операцій, що можуть бути виконаними над даними, організованими в таку структуру.

- застосування кластерного аналізу у виявленні територіальних змін соціально-демографічного процесу з позицій дослідження кластерів, як елементів характеристики соціально-демографічної структури суспільства;

- положення щодо використання результатів факторного аналізу для мікроданих типу обстежень умов життя домогосподарств, а саме щодо неможливості висновків за результатами факторизації по окремих об’єктах і корисності висновків для сукупності об’єктів з метою формулювання гіпотез і їх подальшої перевірки.
Впровадження

1. Методика вимірювання регіонального людського розвитку затверджена на спільному засіданні Президії НАН України та Колегії Державної служби статистики України 13 червня 2012 року


Практичні висновки та рекомендації по застосуванню

1. За результатами дослідження доведено можливість застосування методів багатовимірного моделювання на базі даних вибіркових обстежень (мікроданих), особливістю яких є наявність ознак, виміряних за різними шкалами.



2. Метод -середніх забезпечує якісні і стійки результати класифікації на зазначеному типі даних.

3. Застосування факторного аналізу на зазначеному типі даних не дало надійних результатів, але дало змогу зробити висновок про його надзвичайну корисність для формулювання гіпотез.



4. За необхідності включення у моделі якісних змінних рекомендується їх перетворення у структурні змінні.

5. При проведенні нормування слід використовувати конкретні числові значення самої змінної.
За результатами дослідження підготовлені такі публікації:

1. Гладун О.М., Лущик Л.В. Нормування як складова аналізу даних / Прикладна статистика: проблеми теорії та практики : Збірник наукових праць // – К., Держкомстат України, Національна академія статистики обліку та аудиту. – 2010.

Державна служба статистики України (Держстат України, колишній Держа́вний коміте́т стати́стики Украї́ни, Держкомстат України) - національний орган статистики України, центральний орган виконавчої влади із спеціальним статусом, діяльність якого спрямовується і координується Кабінетом Міністрів України через віце-прем'єр-міністра України.

– Вип. 6. – С. 36–46.

2. Гладун О.М. Використання структурних змінних у дискримінантному аналізі / Система державної статистики в Україні: сучасний стан, проблеми, перспективи : Збірник тез виступів на VІІІ Міжнародній науково-практичній конференції з нагоди Дня працівників статистики, Київ, 3–4 грудня 2010 р. // – К., Держкомстат України, Національна академія статистики обліку та аудиту. – 2010. – С. 48–49.

3. Гладун О.М. Щодо можливості використання номінальних і рангових ознак у дискримінантному аналізі // Прикладна статистика: проблеми теорії та практики : Збірник наукових праць. – К., Держкомстат України, Національна академія статистики обліку та аудиту. – 2010. – Вип. 7. – С. 78–85.

4. Гладун О.М., Хвалинська В.В. Використання некількісних даних у багатовимірній класифікації / Статистика ХХІ століття: нові виклики, нові можливості : Збірник матеріалів Міжнародної науково-практичної конференції, м. Київ, 19–20 травня 2011 р. // К.: Київський національний університет імені Тараса Шевченка. – 2011. – С. 7–8.

Київський національний університет імені Тараса Шевченка - державний вищий навчальний заклад України, розташований у місті Києві, самоврядний (автономний) дослідницький національний університет.

5. Гладун О.М., Хвалинська В.В. Застосування у кластерному та дискримінантному аналізі некількісних змінних // Вісник Київського національного університету імені Тараса Шевченка (економіка). – К.: Київський національний університет імені Тараса Шевченка. – 2011. – С. 11–14.

6. Гладун О.М., Хвалинська В.В. Проблема якості класифікації у багатовимірному статистичному аналізі / Система державної статистики в Україні: сучасний стан, проблеми, перспективи : тези виступу на ІХ Міжнародній науково-практичній конференції з нагоди Дня працівників статистики. // К.: Національна академія статистики обліку та аудиту. – 2011. – С. 24–25.

7. Гладун О.М., Хвалинська В.В. Підходи до оцінки якості класифікації у кластерному аналалізі / Прикладна статистика: проблеми теорії та практики : Збірник наукових праць // – К.: Національна академія статистики обліку та аудиту. – 2011. – Вип. 9. – С. 68–77.

8. Макарова О.В., Гладун О.М. Регіональний індекс людського розвитку: причини та напрями удосконалення методики // Статистика України. – 2012, №1. – С. 10–15.

9. Лущик Л. В. Проблеми вимірювання суспільного здоров’я / Система державної статистики в Україні: сучасний стан, проблеми, перспективи : Збірник тез виступів на VІІІ Міжнародній науково-практичній конференції з нагоди Дня працівників статистики, Київ, 3–4 грудня 2010 р. // – К., Держкомстат України, Національна академія статистики обліку та аудиту. – 2010. – С. 161-163.

10. Лущик Л. В. Вимірювання рівнів здоров’я населення територій України // Прикладна статистика: проблеми теорії та практики : Зб. наук. праць. Вип. 7 / Держ. ком. статистики України, Держ. акад. статистики, обліку та аудиту; Ред. кол.: І. І. Пилипенко (голов. ред.) та ін. – К.: ДП "Інформаційно-аналітичне агенство", 2010. – С. 465–472.

11. Лущик Л. В. Неоднозначність розв'язку у процедурі факторного аналізу // Прикладна статистика: проблеми теорії та практики : Зб. наук. праць. Вип. 9 / Держ. ком. статистики України, Держ. акад. статистики, обліку та аудиту; Ред. кол.: І. І. Пилипенко (голов. ред.) та ін. – К.: ТОВ "Видавничо-поліграфічний дім "Формат", 2011. – С. 429–435.

12. Лущик Л. В. Проблема неоднозначності розв'язку у процедурі факторного аналізу // Система державної статистики в Україні: сучасний стан, проблеми, перспективи : ІХ Міжнар. науково-практична конференція з нагоди Дня працівників статистики.

Наукова конференція - форма організації наукової діяльності, при якій дослідники (не обов'язково вчені чи студенти) представляють і обговорюють свої роботи. Зазвичай заздалегідь (в інформаційному листі або стендовій оголошенні) повідомляється про тему, час і місце проведення конференції.

Київ, 1–2 грудня 2010 р. – К.: ТОВ "Видавничо-поліграфічний дім "Формат", 2011. – С. 141-142.

13. Хвалинська В.В. Вплив способів нормування на результати кластерного аналізу // Прикладна статистика: проблеми теорії та практики. Збірник наукових праць. Вип. 7. / Держкомстат України, Державна академія статистики, обліку та аудиту. – К.: ДП «Інформаційно-аналітичне агентство». – 2010. –– С. 473–479.



14. Хвалинська В.В. Застосування кластерного аналізу для визначення типологічних груп населення України. // Вісник Хмельницького національного університету (економічні науки).

За оцінкою Державної служби статистики України, станом на 1 лютого 2017 року чисельність наявного населення України становила 42 558 328 осіб(без врахування тимчасово окупованої території Автономної Республіки Крим і м. Севастополя)

Хмельницький національний університет - вищий навчальний заклад України у місті Хмельницькому.

Вип.190. – Хм.: Хмельницький національний університет. – 2012. – С. 79–81.



Скачати 118.34 Kb.

  • « Багатовимірне моделювання людського розвитку »
  • Київ – 2012 Мета роботи
  • Наукову новизну результатів НДР
  • Практичні висновки та рекомендації по застосуванню
  • За результатами дослідження підготовлені такі публікації
  • Київський національний університет