Большая часть курсов и учебников по Data Science описывает базовые алгоритмы и навыки, которые нужны для успешного выполнения различных задач. Но когда дело доходит до настоящих проектов, оказывается, что эти знания далеки от рабочих реалий.
Как получить максимум практического опыта и подготовиться к работе Data Scientist’ом? Вот несколько рекомендаций:
- Используйте стандартные библиотеки с открытым исходным кодом. Прикладная область Data Science опирается на библиотеки, которые хорошо задокументированы, протестированы и имеют грамотный API. Использование альтернативных или кастомных библиотек неизменно ведёт к проблемам и багам — они отвлекают от данных и контекста, в котором будет применяться модель.
- Тратьте больше времени на изучение данных и приведение их в нужный формат. В ряде проектов потребуется множество манипуляций с данными, а на настройку модели уйдёт сравнительно немного времени. Начинающие Data Science специалисты в состоянии описать структуру алгоритмов, но им не хватает навыков работы с pandas и другими библиотеками, важными для реальных кейсов.
- Изучайте различные техники на практике. Если вы не можете описать практическую пользу того, что изучаете, вероятно, вы пока не готовы применять эти знания в работе.
- Узнайте, как интерпретировать вывод модели. Научитесь извлекать понятные умозаключения из любой модели машинного обучения с помощью техник Machine Learning Explainability.
- Создавайте проекты в той области, которая вам интересна. Это может быть кино, новости, спорт, еда и так далее. Вы научитесь формулировать вопросы о мире таким образом, чтобы понять, как можно их решить с помощью технических инструментов. Это один из важных навыков для Data Scientist.
- Но, пожалуй, самый важный навык — делиться своей работой, чтобы научиться интерпретировать и обсуждать результаты.
- Но можно ли пропустить теорию алгоритмов и заниматься только практикой, чтобы быстрее стать дата саентистом? Нет.
Вы можете узнать много полезного о манипулировании данными, их интерпретации и применении моделей в реальной жизни. Попробуйте уделить больше времени практическим навыкам и не зацикливаться лишь на абстрактных теориях: такой подход поможет лучше подготовиться к серьёзным проектам.
Перевод статьи «What 70% of Data Science Learners Do Wrong»
Автор перевода Мария Багулина
Комментарии
Легко давать советы и репостить, правда? А вот рискну и дам ещё один совет: прежде чем программить, поищите аналитическое решение. Например, найдите множество шестизначных натуральных числел, равных сумме факториалов их цифр.
:)