Машинное обучение, исследовательский анализ данных
Однострочный магический код для выполнения EDA!
Одна строчка решает все ваши проблемы!
«Данные - это новое масло» ~ Клайв Хамби.
Данные - неотъемлемая часть нашей жизни, и в отличие от других ресурсов они неисчерпаемы, но здесь есть одна загвоздка: они полезны для вашей организации только в том случае, если вы знаете, как их исправить и понять суть.
Наука о данных - это процесс, который включает: Сбор, хранение, обработку, описание и моделирование.
Обработка, описание / EDA (исследовательский анализ данных) можно назвать жизненным циклом для ознакомления с данными путем поиска взаимосвязей между каждой переменной и их визуализации для поиска скрытых тенденций.
EDA требует много времени и усилий для очистки и изучения наших данных. Хотя в области обработки данных мы все еще ожидаем некоторых достижений в области исследования данных, произошли поразительные улучшения. Несколько библиотек с открытым исходным кодом предложили метод без кода или low-code, чтобы облегчить изучение.
D-Tale - одна из таких библиотек, это комбинация серверной части Flask и интерфейса React Front-end, которая обеспечивает интерактивный способ визуализации и изучения фрейма данных pandas.
D-Tale позаботится о том, чтобы вам не надоело рекурсивно выполнять df.head ()!
Внедрение D-Tale
- Установка D-Tale: Как и любую другую библиотеку Python, вы можете легко установить D-Tale, используя команду «pip install dtale» в командной строке.
2. Импорт соответствующих библиотек: используйте Seaborn для загрузки набора данных и D-сказки для визуализации и изучения.
3. Выберите набор данных: из предварительно определенного набора данных в Seaborn выберите любой.
4. Получите базовое представление о данных: используйте для этого метод describe ().
5. Используйте D-Tale: загружайте данные с помощью библиотеки D-Tale и получайте интерактивные сведения.
Нажмите на кнопку воспроизведения и выберите «Открыть в новой вкладке»:
Особенности D-Tale
Все ваши данные в чистом и элегантном виде!
Найдите статистические свойства набора данных с помощью кнопки «Описать».
Обобщите данные соответствующих строк и столбцов.
Удалить повторяющиеся значения
Проверьте корреляцию в своих данных, чтобы упростить создание диаграмм.
Библиотека поможет вам с независимой оценкой, которая помогает определять линейные и нелинейные отношения.
Самая ожидаемая особенность D-Tale - это возможность легко создавать диаграммы.
Он предлагает широкий выбор диаграмм с параметрами очистки данных, которые можно персонализировать для каждого типа диаграмм.
Еще одна отличительная особенность D-Tale заключается в том, что она позволяет создавать диаграммы из панели управления и напрямую импортировать для них код.
Тепловые карты также можно использовать как для всех данных, так и для отдельных столбцов.
Вы также можете проверить статистические значения для определенного столбца и выполнить анализ столбца.
Выполните анализ отклонений для каждого столбца.
Пользователь также может изменить данные любой конкретной записи.
Вышеупомянутый код можно найти по адресу: dakshtrehan / D-Tale-Exploration (github.com)
Если вам понравилась эта статья, подпишитесь на мою рассылку: Еженедельный бюллетень Дакша Трехана.
Заключение
Статья помогла нам пролить свет на чрезвычайно мощный инструмент отчетности EDA: D-Tale. Мы увидели, как D-Tale упрощает создание привлекательных визуальных эффектов и изучение данных.
Использованная литература:
Исследование данных в Python с помощью библиотеки dtale (analyticsvidhya.com)
Оживите свои фреймы данных Pandas с помощью D-Tale - KDnuggets
Учебник по Dtale - Руководство по визуализации структуры данных Pandas (analyticsindiamag.com)
Социальная сеть для программистов и разработчиков (morioh.com)
«Введение в библиотеку D-Tale. D-Tale - библиотека Python для визуализации… | Шрути Саксена | Аналитика Видхья | Середина"
Не стесняйтесь подключаться:
Портфолио ~ https://www.dakshtrehan.com
LinkedIn ~ https://www.linkedin.com/in/dakshtrehan
Следите за дальнейшими блогами по машинному обучению / глубокому обучению.
Средний ~ https://medium.com/@dakshtrehan
Хотите узнать больше?
Готовы ли вы поклоняться богам искусственного интеллекта?
Обнаружение COVID-19 с помощью глубокого обучения
Неизбежный алгоритм искусственного интеллекта: TikTok
GPT-3, объясненный пятилетнему ребенку. .
Tinder + AI: идеальное сватовство?
Инсайдерское руководство по карикатуре с использованием машинного обучения
Укрепление науки в основе обучения с подкреплением
Расшифровка науки, лежащей в основе Генеративные состязательные сети
Понимание LSTM и GRU
Рекуррентная нейронная сеть для чайников
Сверточная нейронная сеть для чайников
Приветствую