Аналітик великих даних зі статистикою

Безкоштовно для вас

через просування

Курс починається зі знань статистики, які дозволять вам розпізнавати кореляції, перевіряти спостереження та правильно класифікувати дані вимірювань. Ви також дізнаєтесь про сфери аналізу даних та інженерії даних, використання штучного інтелекту (ШІ) в цій галузі та управління аналізом даних у великих даних.
  • Тип ступеня: Сертифікат "Статистика
    Сертифікат "Аналітик великих даних"
  • Додаткові кваліфікації: Сертифікат "Інженер з обробки даних
    Сертифікат "Аналітика даних
    Сертифікат "Спеціаліст з великих даних"
  • Підсумковий іспит: Практична робота над проектами з фінальними презентаціями
  • Час занять: Повна зайнятість
    З понеділка по п'ятницю з 8:30 до 15:35 (у святкові дні з 8:30 до 17:10)
  • Мова викладання: Німецька
  • Тривалість: 16 Тижні

Статистика

Основи статистики (близько 6 днів)

Основи теорії вимірювання (генеральна сукупність та вибірка, типи вибірок, рівні вимірювання та шкали)

Одновимірна описова статистика (частотні розподіли, центральні міри, міри дисперсії, стандартне значення, гістограми, стовпчикові діаграми, кругові діаграми, лінійні діаграми та блок-діаграми)

Двовимірна описова статистика (міри кореляції, коефіцієнти кореляції, перехресні таблиці, діаграми розсіювання та згруповані гістограми)

Основи індуктивної вивідної статистики (розподіл ймовірностей, нормальний розподіл, розподіл середніх значень, тест на значущість, перевірка нульової гіпотези Фішера, розмір ефекту, оцінка параметрів, довірчі інтервали, гістограми помилок, аналіз потужності та визначення оптимального розміру вибірки)


Штучний інтелект (ШІ) в робочому процесі

Презентація конкретних технологій ШІ

та можливих застосувань у професійному середовищі


Методи для порівняння двох груп (приблизно 5 днів)

z- і t-тест для вибірки (відхилення від заданого значення)

t-тест для середньої різниці між двома незалежними/зв'язаними вибірками

Перевірка ефективності дій, заходів, втручань та інших змін за допомогою t-тестів (претест-посттест з двома групами)

допоміжні тести значущості (тест Андерсона-Дарлінга, тест Райана-Джойнера, тест Левена, тест Боннета, тест значущості для кореляцій)

Непараметричні методи (критерій Вілкоксона, критерій знаків, критерій Манна-Уітні)

Аналіз непередбачуваності (біноміальний тест, точний тест Фішера, тест хі-квадрат, перехресні таблиці з мірами асоціації)


Методи порівняння середніх значень декількох груп (приблизно 5 днів)

Одно- та двофакторний дисперсійний аналіз (простий та збалансований ANOVA)

Багатофакторний дисперсійний аналіз (загальна лінійна модель)

Фіксовані, випадкові, перехресні та вкладені фактори

Методи множинних порівнянь (Tukey-HSD, Dunnett, Hsu-MCB, Games-Howell)

Аналіз взаємодії (аналіз ефектів взаємодії)

Аналіз вибірковості та потужності для дисперсійного аналізу


Вступ до планування експерименту (ПЕ) (приблизно 1 день)

Повні та часткові факторні експериментальні плани


Робота над проектом (близько 3 днів)

Закріплення вивченого матеріалу

Презентація результатів проекту

Інженер з обробки даних

Основи бізнес-аналітики (близько 2 днів)

Сфери застосування, виміри архітектури BI

Основи бізнес-аналітики, OLAP, OLTP, завдання інженерів даних

Сховища даних (DWH): обробка структурованих, напівструктурованих та неструктурованих даних


Управління вимогами (приблизно 2 дні)

Завдання, цілі та процедури в аналізі вимог

Моделювання даних, введення/моделювання за допомогою ERM

Введення / моделювання в UML

- Діаграми класів

- Аналіз варіантів використання

- Діаграми діяльності


Штучний інтелект (ШІ) в робочому процесі

Презентація конкретних технологій ШІ

та можливих застосувань у професійному середовищі


Бази даних (близько 3 днів)

Основи систем управління базами даних

Архітектура систем управління базами даних

Застосування СКБД

Реалізація моделі даних в СКБД, нормальні форми

Практичний та теоретичний вступ до SQL

Обмеження реляційних баз даних, csv, json


Сховище даних (приблизно 4 дні)

Зіркова схема

Моделювання даних

Створення зоряної схеми в СКБД

Схема "сніжинка", основи, моделювання даних

Створення схеми "сніжинка" в СКБД

Схема галактики: основи, моделювання даних

Повільно змінні розмірності типів 1-5 - переформулювання, укладання, реорганізація, міні-розмірність та тип 5

Вступ до нормальних, причинно-наслідкових, міні- та монстр-вимірів, гетерогенних та під-вимірів

Порівняння орієнтованих на стан і на транзакцію

Таблиці фактів DWH, щільність та зберігання


ETL (близько 4 днів)

Очищення даних

- Нульові значення

- Підготовка даних

- Гармонізація даних

- Застосування регулярних виразів

Розуміння даних

- Перевірка даних

- Статистичний аналіз даних

Захист даних, безпека даних

Практична структура ETL маршрутів

Data Vault 2.0, основи, хаби, лінки, сателіти, хеш-ключ, хеш-диф.

Моделювання даних у Data Vault

Практична структура моделі Data Vault - Raw Vault, практична реалізація хеш-процедур


Робота над проектом (близько 5 днів)

Закріплення вивченого матеріалу

Презентація результатів проекту

Аналітика даних

Вступ до аналізу даних (приблизно 1 день)

Еталонна модель CRISP-DM

Робочі процеси аналізу даних

Визначення штучного інтелекту, машинного навчання, глибокого навчання

Вимоги та роль в компанії інженерів даних, науковців даних та аналітиків даних


Огляд основ Python (приблизно 1 день)

типи даних

Функції


Аналіз даних (близько 3 днів)

Модулі Central Python в контексті аналізу даних (NumPy, Pandas)

Процес підготовки даних

Алгоритми інтелектуального аналізу даних на Python


Штучний інтелект (ШІ) в робочому процесі

Презентація конкретних технологій ШІ

та можливих застосувань у професійному середовищі


Візуалізація даних (близько 3 днів)

Розвідувальний аналіз даних

інсайти

Якість даних

Аналіз переваг

Візуалізація за допомогою Python: Matplotlib, Seaborn, Plotly Express

Сторітелінг даних


Управління даними (близько 2 днів)

Архітектури великих даних

Реляційні бази даних з SQL

Порівняння SQL та NoSQL баз даних

Бізнес-аналітика

Захист даних в контексті аналізу даних


Аналіз даних в контексті великих даних (приблизно 1 день)

Підхід MapReduce

Spark

NoSQL


Дашборди (приблизно 3 дні)

Бібліотека: Dash

Структура дашбордів - Компоненти Dash

Налаштування дашбордів

Зворотні дзвінки


Text Mining (близько 1 дня)

Попередня обробка даних

Візуалізація

Бібліотека: SpaCy


Робота над проектом (близько 5 днів)

Закріплення вивченого матеріалу

Презентація результатів проекту

Спеціаліст з великих даних

Що таке великі дані? (приблизно 1 день)

Обсяг, швидкість, різноманітність, цінність, достовірність

Можливості та ризики великих обсягів даних

Диференціація: бізнес-аналітика, аналітика даних, наука про дані

Що таке інтелектуальний аналіз даних?


Вступ до фреймворків Apache (приблизно 2 дні)

Рішення для великих даних у хмарі

Моделі доступу до даних

Зберігання даних


MapReduce (приблизно 3 дні)

Філософія MapReduce

Кластер Hadoop

Ланцюжок завдань MapReduce


Штучний інтелект (ШІ) в робочому процесі

Презентація конкретних технологій ШІ

та можливих застосувань у професійному середовищі


Компоненти (приблизно 3 дні)

Коротка презентація різних інструментів

Передача даних

YARN додатки

Hadoop JAVA API

Apache Spark


NoSQL та HBase (близько 3 днів)

CAP теорема

КИСЛОТА і БАЗА

Типи баз даних

HBase


Візуалізаціявеликих даних (близько 3 днів)

Теорії візуалізації

Вибір діаграм

Нові типи діаграм

Інструменти для візуалізації даних


Робота над проектом (близько 5 днів)

Закріплення вивченого матеріалу

Презентація результатів проекту



Можливі зміни. Зміст курсу регулярно оновлюється.

Обов'язковими є навички програмування (в ідеалі Python) та досвід роботи з базами даних (SQL).

Ви опанували процеси, пов'язані з об'єднанням, підготовкою, збагаченням та пересиланням даних, і розумієте, як аналізувати великі дані, використовуючи базові концепції програмування Python, SQL та NoSQL баз даних. Знання галузевого програмного забезпечення для обробки та структурування великих неструктурованих даних і їх візуалізації доповнюють ваші знання.

Після цього курсу ви зрозумієте основи статистики, зможете обробляти та оцінювати дані, а також представляти, пояснювати та інтерпретувати статистичний аналіз даних і результати за допомогою графіків.

Курс орієнтований на осіб з вищою освітою в галузі комп'ютерних наук, бізнес-інформатики, бізнес-адміністрування, математики або аналогічною кваліфікацією.

Систематична оцінка обсягів даних необхідна компаніям для отримання інформації про власну продукцію та поведінку клієнтів. У зв'язку з цим аналітики великих даних стають все більш затребуваними в усіх галузях.

Знання статистики є цінною додатковою кваліфікацією, яка користується великим попитом у промислових дослідженнях і розробках, розробці ліків, нагляді за медичними дослідженнями, фінансах і страхуванні, інформаційних технологіях або державному управлінні.

Ваш змістовний сертифікат дає детальне уявлення про отриману кваліфікацію та покращує ваші кар'єрні перспективи.

Дидактична концепція

Ваші викладачі мають високу професійну та дидактичну кваліфікацію і навчатимуть вас від першого до останнього дня (без системи самонавчання).

Ви будете навчатися в ефективних малих групах. Курси зазвичай складаються з 6-25 учасників. Загальні заняття доповнюються численними практичними вправами з усіх модулів курсу. Практичний етап є важливою частиною курсу, оскільки саме в цей час ви опрацьовуєте вивчене, набуваєте впевненості та рутинності в його застосуванні. Заключний розділ курсу передбачає виконання проекту, кейс-стаді або підсумковий іспит.

 

Віртуальний клас alfaview®

BildungszentrumЗаняття проходять з використанням сучасної відеотехнології alfaview® - або з комфорту вашого власного будинку, або в нашому приміщенні за адресою . Весь курс може бачити один одного віч-на-віч через alfaview®, спілкуватися один з одним в якості голосу, синхронізованого по губах, і працювати над спільними проектами. Звичайно, ви також можете бачитись і спілкуватись зі своїми тренерами наживо в будь-який час, і протягом усього курсу викладачі навчатимуть вас у режимі реального часу. Уроки не є електронним навчанням, а справжнім живим викладанням віч-на-віч за допомогою відеотехнологій.

 

alfatraining Agentur für Arbeit Навчальні курси субсидуються та сертифікуються відповідно до положення про затвердження AZAV. Bildungsgutschein Aktivierungs- und VermittlungsgutscheinЯкщо ви подаєте заявку на або , всі витрати на курс, як правило, покриває організація, яка його фінансує.
Europäischen Sozialfonds Deutsche Rentenversicherung Фінансування також можливе через (ESF), (DRV) або регіональні програми фінансування. Berufsförderungsdienst Як військовослужбовець строкової служби, ви можете відвідувати курси підвищення кваліфікації через (BFD). Agentur für Arbeit (Qualifizierungschancengesetz) Компанії також можуть підвищити кваліфікацію своїх працівників за допомогою програми фінансування від .

Ми будемо раді проконсультувати вас безкоштовно. 0800 3456-500 Пн - Пт з 8:00 до 17:00
безкоштовно з усіх німецьких мереж.
Зв'яжіться з нами
Ми будемо раді проконсультувати вас безкоштовно. 0800 3456-500 Пн - Пт з 8:00 до 17:00 безкоштовно з усіх німецьких мереж.