RUVIDEO
Поделитесь видео 🙏

Data cleaning in python | how to clean data | 2024

code is here!!!!!!!
hii guys... i'm share you how to clean and customize the data....
it's vary important part for data analysis....and upcoming video will provide more techniques for the data cleaning....please connect from me...subscribe the channel....if any query ask in the comment box....

#load dataset
import pandas as pd
df = pd.read_excel("data.xlsx")

#let's find the duplicate rows and delete them...
df[df.duplicated()] #but which row is duplicate???

#let's drop it...
df.drop_duplicates(inplace=True,ignore_index=True)

# the nick_name column is not important for use let's go delete it
df.drop("Nick_name",axis = 1 ,inplace=True)

# see in name and state column contain multiple informatin in a single column...
#let's solve them....and divided into seperate columns...
df["Name"].str.split(",",expand=True) #return 2 vclomns...

#letsplay 's save in main dataframe...
df[["First_name","last_name"]]= df["Name"].str.split(",",expand=True)

# let's solve state column same as name column...
df[["State","Zip_code"]] = df["State"].str.split(",",expand=True)

# let's delete name column...
df.drop("Name",axis = 1,inplace=True)

#now you can se the Adhar_no. column....we need all number in this format:-- 1234-5678-1234 --:this
#let's solve that...
df["Adhar_no."].str.replace("-","") #replace - into nothing

#save into main dataframe...
df["Adhar_no."] = df["Adhar_no."].str.replace("-","")

#but there is more values seperated by spaces and comma...let's solve them...
df["Adhar_no."] = df["Adhar_no."].str.replace(" ","")
df["Adhar_no."] = df["Adhar_no."].str.replace(",","")
df
#but we need this format:-- 1234-5678-3456
#let's solve...
#we are using lambda function...ok

df["Adhar_no."]= df["Adhar_no."].apply(lambda x: x[0:4] + "-" + x[4:8] + "-" + x[8:12]) #this is slicing....ok friends...

# ok then now we are going to dealing with nan and null values...
#we can fill the na value by the mean of the column...
# ok let's solve...
df["Salary"]=df["Salary"].fillna(df["Salary"].mean())

#our dataset is cleaned....
#let's arranging the columns...ok..
df = pd.DataFrame({"First_name":df["First_name"],
"Last_name":df["last_name"],
"Age":df["Age"],
"Slary":df["Salary"],
"Adhar_no.":df["Adhar_no."],
"State":df["State"],
"Zip_code":df["Zip_code"]
})
df

# thanks for watching...please like and subscribe the channel...

Что делает видео по-настоящему запоминающимся? Наверное, та самая атмосфера, которая заставляет забыть о времени. Когда вы заходите на RUVIDEO, чтобы посмотреть онлайн «Data cleaning in python | how to clean data | 2024», вы рассчитываете на нечто большее, чем просто загрузку плеера. И мы это понимаем. Контент такого уровня заслуживает того, чтобы его смотрели в HD 1080, без дрожания картинки и бесконечного буферизации.

Честно говоря, Rutube сегодня — это кладезь уникальных находок, которые часто теряются в общем шуме. Мы же вытаскиваем на поверхность самое интересное. Будь то динамичный экшн, глубокий разбор темы от любимого автора или просто уютное видео для настроения — всё это доступно здесь бесплатно и без лишних формальностей. Никаких «заполните анкету, чтобы продолжить». Только вы, ваш экран и качественный поток.

Если вас зацепило это видео, не забудьте взглянуть на похожие материалы в блоке справа. Мы откалибровали наши алгоритмы так, чтобы они подбирали контент не просто «по тегам», а по настроению и смыслу. Ведь в конечном итоге, онлайн-кинотеатр — это не склад файлов, а место, где каждый вечер можно найти свою историю. Приятного вам отдыха на RUVIDEO!

Видео взято из открытых источников Rutube. Если вы правообладатель, обратитесь к первоисточнику.