RUVIDEO
Поделитесь видео 🙏

Data Cleaning and Preprocessing using Python | Machine Learning and Data Science |

In this video we are using python library "samoy" for data cleaning.It is built on pandas but better in terms of efficiency and user level customization.
I have used data set from kaggle.
Lets understand samoy in brief:

* Auto Data cleaner - "samoy"
samoy is a Python package for machine learning and data science, built on top of Pandas inbuilt libraries. This package will be useful for data pre-processing before starting off any machine learning or data science project as it will ease your entire process of data cleaning without much input from the user.

*User installation

If you already have a working installation of numpy and pandas, the easiest way to install samoy is using pip:

pip install samoy
---------------------------------

*Package Utilities
In current version of this package it only handles missing,null values and duplicates along with case conversion

* Utilities supported:

1. Null values handling : Dropping and imputing(with mean,median as well as custom values)
2. Imputing null values with the threshold as mentioned by the user in terms of percentage
3. Missing values handling : Dropping and imputing(with mean,median and LRU)
4. Duplicates removal
5. Case conversion like if use wants to convert specific columns or entire column values into either lower or upper case

Samoy in Pypi : https://pypi.org/project/samoy/

Data Science Concepts:
https://www.youtube.com/playlist?list=PLD31WaZcNHga2Qobh8wS_VJEnt_00bwb9

Statistics Part 1 : https://youtu.be/iPwztyzAIjs
Statistics Part 2 : https://youtu.be/nxhXogMK0Go
Statistics Part 3 : https://youtu.be/NokGUZuBln0
Statistics Part 4 : https://youtu.be/8uqhRCbK2Xw


Please subscribe to the channel for amazing technological videos and comment on your doubts and requirement below.

Credit : Priyanka Singh (Gold Medalist in Computer Engineering SPPU Pune, M-Tech College of Engineering Pune, Ex Data Scientist From Reliance Industries Limited Mumbai.)


Priyanka Singh Linkedin :

https://www.linkedin.com/in/priyanka-singh-350082116

Research Work in IEEE:
https://ieeexplore.ieee.org/document/9121036

Follow us on

Twitter : https://twitter.com/Forerun27232724?s=09
Facebook : https://www.facebook.com/Forerunners-110750477376350/
Instagram : https://www.instagram.com/invites/contact/?i=1hnj8yt77p1sg&utm_content=i31eoee

#DataScience #MachineLearning #Python

Что делает видео по-настоящему запоминающимся? Наверное, та самая атмосфера, которая заставляет забыть о времени. Когда вы заходите на RUVIDEO, чтобы посмотреть онлайн «Data Cleaning and Preprocessing using Python | Machine Learning and Data Science |», вы рассчитываете на нечто большее, чем просто загрузку плеера. И мы это понимаем. Контент такого уровня заслуживает того, чтобы его смотрели в HD 1080, без дрожания картинки и бесконечного буферизации.

Честно говоря, Rutube сегодня — это кладезь уникальных находок, которые часто теряются в общем шуме. Мы же вытаскиваем на поверхность самое интересное. Будь то динамичный экшн, глубокий разбор темы от любимого автора или просто уютное видео для настроения — всё это доступно здесь бесплатно и без лишних формальностей. Никаких «заполните анкету, чтобы продолжить». Только вы, ваш экран и качественный поток.

Если вас зацепило это видео, не забудьте взглянуть на похожие материалы в блоке справа. Мы откалибровали наши алгоритмы так, чтобы они подбирали контент не просто «по тегам», а по настроению и смыслу. Ведь в конечном итоге, онлайн-кинотеатр — это не склад файлов, а место, где каждый вечер можно найти свою историю. Приятного вам отдыха на RUVIDEO!

Видео взято из открытых источников Rutube. Если вы правообладатель, обратитесь к первоисточнику.