Машинное обучение, исследовательский анализ данных

Однострочный магический код для выполнения EDA!

Одна строчка решает все ваши проблемы!

«Данные - это новое масло» ~ Клайв Хамби.

Данные - неотъемлемая часть нашей жизни, и в отличие от других ресурсов они неисчерпаемы, но здесь есть одна загвоздка: они полезны для вашей организации только в том случае, если вы знаете, как их исправить и понять суть.

Наука о данных - это процесс, который включает: Сбор, хранение, обработку, описание и моделирование.

Обработка, описание / EDA (исследовательский анализ данных) можно назвать жизненным циклом для ознакомления с данными путем поиска взаимосвязей между каждой переменной и их визуализации для поиска скрытых тенденций.

EDA требует много времени и усилий для очистки и изучения наших данных. Хотя в области обработки данных мы все еще ожидаем некоторых достижений в области исследования данных, произошли поразительные улучшения. Несколько библиотек с открытым исходным кодом предложили метод без кода или low-code, чтобы облегчить изучение.

D-Tale - одна из таких библиотек, это комбинация серверной части Flask и интерфейса React Front-end, которая обеспечивает интерактивный способ визуализации и изучения фрейма данных pandas.

D-Tale позаботится о том, чтобы вам не надоело рекурсивно выполнять df.head ()!

Внедрение D-Tale

  1. Установка D-Tale: Как и любую другую библиотеку Python, вы можете легко установить D-Tale, используя команду «pip install dtale» в командной строке.

2. Импорт соответствующих библиотек: используйте Seaborn для загрузки набора данных и D-сказки для визуализации и изучения.

3. Выберите набор данных: из предварительно определенного набора данных в Seaborn выберите любой.

4. Получите базовое представление о данных: используйте для этого метод describe ().

5. Используйте D-Tale: загружайте данные с помощью библиотеки D-Tale и получайте интерактивные сведения.

Нажмите на кнопку воспроизведения и выберите «Открыть в новой вкладке»:

Особенности D-Tale

Все ваши данные в чистом и элегантном виде!

Найдите статистические свойства набора данных с помощью кнопки «Описать».

Обобщите данные соответствующих строк и столбцов.

Удалить повторяющиеся значения

Проверьте корреляцию в своих данных, чтобы упростить создание диаграмм.

Библиотека поможет вам с независимой оценкой, которая помогает определять линейные и нелинейные отношения.

Самая ожидаемая особенность D-Tale - это возможность легко создавать диаграммы.

Он предлагает широкий выбор диаграмм с параметрами очистки данных, которые можно персонализировать для каждого типа диаграмм.

Еще одна отличительная особенность D-Tale заключается в том, что она позволяет создавать диаграммы из панели управления и напрямую импортировать для них код.

Тепловые карты также можно использовать как для всех данных, так и для отдельных столбцов.

Вы также можете проверить статистические значения для определенного столбца и выполнить анализ столбца.

Выполните анализ отклонений для каждого столбца.

Пользователь также может изменить данные любой конкретной записи.

Вышеупомянутый код можно найти по адресу: dakshtrehan / D-Tale-Exploration (github.com)

Если вам понравилась эта статья, подпишитесь на мою рассылку: Еженедельный бюллетень Дакша Трехана.

Заключение

Статья помогла нам пролить свет на чрезвычайно мощный инструмент отчетности EDA: D-Tale. Мы увидели, как D-Tale упрощает создание привлекательных визуальных эффектов и изучение данных.

Использованная литература:

Dtale · PyPI

Исследование данных в Python с помощью библиотеки dtale (analyticsvidhya.com)

Введение в D-Tale. Введение в D-Tale для интерактивного… | Альберта Санчеса Лафуэнте | К науке о данных

Оживите свои фреймы данных Pandas с помощью D-Tale - KDnuggets

Учебник по Dtale - Руководство по визуализации структуры данных Pandas (analyticsindiamag.com)

Социальная сеть для программистов и разработчиков (morioh.com)

«Введение в библиотеку D-Tale. D-Tale - библиотека Python для визуализации… | Шрути Саксена | Аналитика Видхья | Середина"

Не стесняйтесь подключаться:

Портфолио ~ https://www.dakshtrehan.com

LinkedIn ~ https://www.linkedin.com/in/dakshtrehan

Следите за дальнейшими блогами по машинному обучению / глубокому обучению.

Средний ~ https://medium.com/@dakshtrehan

Хотите узнать больше?

Готовы ли вы поклоняться богам искусственного интеллекта?
Обнаружение COVID-19 с помощью глубокого обучения
Неизбежный алгоритм искусственного интеллекта: TikTok
GPT-3, объясненный пятилетнему ребенку. .
Tinder + AI: идеальное сватовство?
Инсайдерское руководство по карикатуре с использованием машинного обучения
Укрепление науки в основе обучения с подкреплением
Расшифровка науки, лежащей в основе Генеративные состязательные сети
Понимание LSTM и GRU
Рекуррентная нейронная сеть для чайников
Сверточная нейронная сеть для чайников

Приветствую