Первая страница
Наша команда
Контакты
О нас

    Головна сторінка



Курс «Сучасні технології аналізу даних в природничих науках»

Скачати 22.43 Kb.

Курс «Сучасні технології аналізу даних в природничих науках»




Скачати 22.43 Kb.
Сторінка1/2
Дата конвертації21.05.2017
Розмір22.43 Kb.
  1   2

Курс «Сучасні технології аналізу даних в природничих науках»

Теми курсу:



  1. Планування експерименту, вибір моделі. Верифікація даних. Похибка, помилка, проблема шуму в експериментальних даних. (Верифікація даних. Пропущені дані, обробка викидів, повторних спостережень, некоректних значень та ін. Вітрини даних, куби даних, багатовимірна модель даних)

  2. Характеристики статистичного аналізу даних.
    Аналіз даних - розділ математики, що займається розробкою методів обробки даних незалежно від їх природи.
    Моде́ль да́них (англ. Data model) - абстрактне представлення реального світу, що відображає тільки ті об'єкти, що безпосередньо стосуються програми. Це, як правило, визначає специфічну групу об'єктів, їх атрибутивне значення і відношення між ними.
    Оцінка даних. Інтерполяція, сплайн-інтерполяція. (Основні характеристики статистичного оцінювання. Ефективні та незміщені оцінки. Згладжування і інтерполяція експериментальних даних. Методи змінного середнього та поліноміальне згладжування. Методи інтерполяції: Лагранжа, Ньютона-Грегорі, Сплайн-інтерполяція.)

  3. Статистичні характеристики, оцінка ймовірності та довірчий інтервал (Виявлення тренда статистичних характеристик.
    Незміщена оцінка в математичній статистиці - це точкова оцінка, математичне сподівання якої рівне параметру, що оцінюється.
    Довірчий інтервал - термін, який використовується в математичній статистиці при інтервальній оцінці статистичних параметрів, більш кращою при невеликому обсязі вибірки, ніж точкова. Довірчим називають інтервал, який покриває невідомий параметр із заданою надійністю.
    Критерії Стьюдента, Фішера, Фостера-Стюарта. Довірчі інтервали оцінювання вибіркового середнього та вибіркової дисперсії. Оцінювання ймовірності події та довірчого інтервалу для ймовірності)

  4. Щільність розподілу. Стохастичні залежності. Кореляційний аналіз.
    Кореляційний аналіз - це статистичне дослідження (стохастичної) залежності між випадковими величинами (англ. correlation - взаємозв'язок). У найпростішому випадку досліджують дві вибірки (набори даних), у загальному - їх багатовимірні комплекси (групи).
    (Критерії узгодження густини розподілу: χ - квадрат, Колмогорова. Емпірична щільність розподілу, гістограма. Квазіоптимальна кількість інтервалів. Стохастична залежність. Кореляційний аналіз, коефіцієнт кореляції, довірчий інтервал для коефіцієнта кореляції.)

  5. Аналіз задачі класифікації (Ключові поняття і визначення. Дерева прийняття рішень. Дерева класифікації і регресії (С & RT). CHAID (Chi-squared Automatic Interaction Detection). Дерева що ростуть (Boosted trees). Випадкові ліси (Random forests). Методи машинного навчання (machine learning). Метод опорних векторів. Байєсовські методи. Дискримінантний аналіз. Регресійні моделі. Логістична регресія. Узагальнені адитивні моделі.)

  6. Регресійний аналіз. Лінійна та нелінійна регресія (Регресійний аналіз. Регресійні моделі. Метод найменших квадратів.
    Машинне навчання Машинне навчання (англ. machine learning) - це підгалузь інформатики (зокрема, м'яких[en] та гранульованих обчислень[en]), яка еволюціювала з дослідження розпізнавання образів та теорії обчислювального навчання[en] в галузі штучного інтелекту.
    Класифіка́ція (фр. , англ. classification походить від лат. classis - клас і facio - роблю) - система розподілення об'єктів (процесів, явищ) за класами (групами тощо) відповідно до визначених ознак. Інколи вживають термін категоризація у значенні «розподілення об'єктів на категорії».
    Дерево ухвалення рішень (також можуть називатися деревами класифікацій або регресійними деревами) - використовується в галузі статистики та аналізу даних для прогнозних моделей. Структура дерева містить такі елементи: «листя» і «гілки».
    В машинному навчанні ме́тод опо́рних векторі́в (рос. метод опорных векторов) - це метод аналізу даних для класифікації та регресійного аналізу за допомогою моделей з керованим навчанням з пов'язаними алгоритмами навчання, які називаються опо́рно-ве́кторними маши́нами (ОВМ, англ. support vector machines, SVM, також опо́рно-ве́кторними мере́жами, англ. support vector networks)
    Метод найменших квадратів Метод найменших квадратів - метод знаходження наближеного розв'язку надлишково-визначеної системи. Часто застосовується в регресійному аналізі. На практиці найчастіше використовується лінійний метод найменших квадратів, що використовується у випадку системи лінійних рівнянь.
    Система нормальних рівнянь. Визначення ступеня полінома за невідомого класу функцій. Розрахунок з використанням поліномів Чебишева. Лінійна регресія: розрахунок коефіцієнтів. Довірча область для лінії істинної регресії. Нелінійна регресія. Способи переходу до лінійної регресії)

  7. Аналіз часових рядів (Ключові поняття і визначення. Класична модель ARIMA (АРПСС) Експоненційне згладжування з сезонними компонентами Спектральне розкладання Фур'є. Сезонна декомпозиція. Поліноміальний і регресійний аналіз лагів)

  8. Дисперсійний аналіз (Дисперсійний аналіз: однофакторний, двофакторний, Критерії Кохрана, Бартлет. Багатофакторний
  1   2


Скачати 22.43 Kb.

  • Кореляційний аналіз
  • Метод найменших квадратів