Описание
Практическое руководство по анализу данных, раскрывающее полный цикл ра-боты с информацией: от сбора и обработки до построения моделей машинногообучения. Рассмотрена работа с инструментами pandas и SQL, методы выявлениязакономерностей и очистки данных. Описаны различные источники информа-ции, включая текстовые, бинарные и веб-данные. Подробно изложены статисти-ческие методы: доверительные интервалы, проверка гипотез, конструированиепризнаков. Приведены практические примеры на языке Python из разных облас-тей: анализ транспортных систем, экологические исследования, ветеринарнаяаналитика. Заключительные разделы посвящены логистической регрессии и оп-тимизации моделей с применением к задачам классификации текстов.













