Python для аналитиков
Курс программирования на языке Python для тех, чья деятельность связана со сбором, обработкой и анализом больших объемов информации.
 
Курс предназначен для аналитиков в любой сфере деятельности, а также всем, кто хочет изучить язык Python для профессионального использования. В основу курса положены стандарты Института открытых программ дополнительного образования Высшей школы экономики.

О курсе
Курс создан в 2022 году.

Ментор курса: Дмитрий Румянцев, автор фундаментального учебника по программированию «Путь программиста» и ряда учебных пособий, автор online-курсов «Алхимия программиста» и «Алхимия Python».

Курс создан с упором на анализ данных, в связи с чем иллюстрирован большим количеством учебных примеров, написанных автором специально под тематику курса.

Курс «Python для аналитиков» состоит из двух частей.

Первая часть
Интенсивное изучение языка Python, как основного инструментария аналитика данных. Полное освоение тем первой части сделает учащегося уверенным программистом на языке Python начального профессионального уровня.

Вторя часть
В рамках обучения второй части предполагается, что учащийся в достаточной степени овладел основными языковыми конструкциями и технологиями Python, поэтому не разъясняет синтаксических особенностей примеров, кроме отдельных специфических моментов.

В ходе обучения тем второй части учащийся изучает, как получать и обрабатывать данные из всех доступных источников (особенно в сети Интернет), а также визуализировать результаты обработки, используя специализированные библиотеки, разработанные для языка Python.

Тематика курса
Часть 1
1. Введение в язык Python. Знакомство со средой программирования (интерпретатор Python и IDE PyCharm). Работа с командной строкой и утилитой PIP.

2. Концепция переменной. Простые типы данных. Базовые операции над ними. Интерпретация ошибок.

3. Знакомство с PyCharm. Понятие алгоритма. Понятие управляющих конструкций. Условные операторы. Циклы for и while. Функции в Python. Лямбда-выражения и лямбда-функции. Рекурсия.

4. Объектно-ориентированное программирование. Классы и объекты Python. Иерархия и наследование. Строки как экземпляры класса str. Понятие библиотеки. Библиотечные модуль. Выборочное импортирование. Пакеты.

5. Составные типы данных в Python (строки, списки, множества и словари). Итераторы, генераторы, генераторы списков.

6. Регулярные выражения: синтаксис, сложные выражения, получение данных из веб-документа.

7. Защита программы от ошибок. Исключительные ситуации. Обработка исключений. Поиск ошибок в коде и отладка.

8. Файлы и работа с ними. Продвинутая работа со словарями.
Часть 2
9. VCS Git. Работа с Git через командную строку (Git Bash). Работа с Git средствами PyCharm (в том числе работа с удаленным репозиторием в GitHub).

10. O-нотация и понятие о сложности вычислений. Ускорение работы кода на Python.

11. Введение в DOM. Сбор данных: парсинг веб-контента при помощи библиотеки BeautifulSoup.

12. Работа с SQL и базами данных с помощью Python. Работа с Excel-файлами.

13. Сбор данных: Selenium, работа с сервисами через API.

14. Введение в numpy. Работа с векторами и матрицами

15. Введение в pandas и разведочный анализ данных

16. Работа с пропущенными значениями в данных

17. Визуализация для презентации данных: matplotlib. Основные виды графиков. Основные ошибки при создании визуализаций.

18. Создание интерактивных визуализаций: plotly.

19. Разведывательный анализ данных. Особенности исследования текста. Наивный байесовский классификатор. Признаковое описание текстов.
Требуемые навыки
От учащегося не требуется знаний в области программирования. Все необходимые навыки он получит в процессе обучения. От учащегося требуется только уверенное владение компьютером как для локальной работы (с диском), так и в сети Интернет.

Длительность обучения

Курс рассчитан на 12 недель самостоятельной работы.
Made on
Tilda