Books.pro: наша постоянная рубрика. Список книг для саморазвития и прокачки профессиональных навыков.
«Data Science at the Command Line», Жерон Янссенс
Книга полезна тем, кто увлекся основами программирования и анализом данных. Вы научитесь получать, преобразовывать и анализировать данные. Узнаете, как с помощью инструментов командной строки быстро получить, очистить и исследовать данные. Автор представляет простую в установке виртуальную среду Data Science Toolbox, которая содержит более 80 инструментов командной строки.
«Doing Data Science», Кэти О’Нил, Рэйчел Шатт
Авторы доступным языком рассказывают о байесовском методе, статистических алгоритмах, визуализации данных, финансовом моделировании и рекомендательных движках. Все примеры объясняются на языках Python и R.
Книга посвящена изучению фильтрации спама, регрессионных моделей, основам Big Data. Рекомендуется к прочтению тем специалистам, которые освоили базовые понятия Data Science и хотят систематизировать знания.
«Machine Learning», Tom Mitchell
Том Митчелл – американский ученый и профессор. Он основал первую в мире кафедру машинного обучения и выпустил учебник по этому предмету. Автор более 130 работ по искусственному интеллекту и робототехнике.
Первую публикацию книги «Machine Learning» Том Митчелл выпустил в 1997 году. Его труд подойдет новичкам, которые знают английский язык на продвинутом уровне, но только начинают разбираться в машинном обучении. В книге описаны алгоритмы: байесовского обучения, обучения с подкреплением, нейронных сетей.
«Python Machine Learning», Sebastian Raschka
Книга рекомендуется к прочтению инженерам любого уровня. Вы узнаете о возможностях Python в аналитических моделях, об улучшении веб-приложений, открытии скрытых паттернов и структуры в данных с помощью кластеризации. Также вы изучите, как построить нейронные сети, используя Keras и Theano, как писать чистый код Python для оптимизации алгоритмов. Научитесь применять регрессионный анализ и проводить предварительную обработку данных.
«Основы Data Science и Big Data. Python и наука о данных», Дэви Силен, Арно Мейсман, Мохамед Али
Книга посвящена аспектам анализа и обработки данных. В работе авторов представлены как теоретические основы, так и алгоритмы машинного обучения, работа с NoSQL, потоковыми данными, визуализация информации.