RUVIDEO
Поделитесь видео 🙏

Data Cleaning with ECDF Statistics in Python (Explanation and Example)

This time I decided to demonstrate how I use ECDF (Empirical Cummulative Distirbution Function) for Data Cleaning with Real Data (real estate data scrapped by my own scrapper: https://www.youtube.com/watch?v=pqAdxZWFkTM

For this I use Numpy, Pandas and Matplotlib Python modules.
The main idea is ECDF helps us to detect data outliers, in other words - data noise that must be removed from original (raw) dataset. This called as an iteration.
After each iteration data get more and more clear. This is one of most technique for Data Preproccessing (Data Cleaning) based on Statistics mostly.

For making code more structured I divided the whole algorithm to separate sections. Important procedures (ECDF, calculate percentiles, plot the data) are defined as Python definition with input arguments.

I think that ECDF graph is the best way to plot the data distribution for data exploration purposes.

Example showed in the end of video: https://www.linkedin.com/feed/update/urn:li:activity:6390315794722537472

Whole code is written in Python programming language on framework of Jupyter Notebook.

Our task in here is get as a real data that less or more correspond the normal distribution. This type of observation distribution will works with further analyses.

After Data Cleaning by using ECDF Statistics method you can easily apply Machine Learning (ML), Deep Learning (DL), Exploratory Data Analysis (EDA, Data Exploration) and other algorithms for your data analysis. Hope this will be useful for Data Analyst, Data Scientist and for all who are in passion about data world.

Also, I explain why almost all the time better use statistical Median tha Average. It is based on my calculations.

Vytautas
https://www.linkedin.com/in/bielinskas/

Что делает видео по-настоящему запоминающимся? Наверное, та самая атмосфера, которая заставляет забыть о времени. Когда вы заходите на RUVIDEO, чтобы посмотреть онлайн «Data Cleaning with ECDF Statistics in Python (Explanation and Example)», вы рассчитываете на нечто большее, чем просто загрузку плеера. И мы это понимаем. Контент такого уровня заслуживает того, чтобы его смотрели в HD 1080, без дрожания картинки и бесконечного буферизации.

Честно говоря, Rutube сегодня — это кладезь уникальных находок, которые часто теряются в общем шуме. Мы же вытаскиваем на поверхность самое интересное. Будь то динамичный экшн, глубокий разбор темы от любимого автора или просто уютное видео для настроения — всё это доступно здесь бесплатно и без лишних формальностей. Никаких «заполните анкету, чтобы продолжить». Только вы, ваш экран и качественный поток.

Если вас зацепило это видео, не забудьте взглянуть на похожие материалы в блоке справа. Мы откалибровали наши алгоритмы так, чтобы они подбирали контент не просто «по тегам», а по настроению и смыслу. Ведь в конечном итоге, онлайн-кинотеатр — это не склад файлов, а место, где каждый вечер можно найти свою историю. Приятного вам отдыха на RUVIDEO!

Видео взято из открытых источников Rutube. Если вы правообладатель, обратитесь к первоисточнику.