How to decode LabelEncoder implemented column in pandas dataframe?

Question

How to decode LabelEncoder implemented column in pandas dataframe?

1.9k views Asked by Samar Pratap Singh At 05 October 2020 at 07:41

I'm having a dataset. Where I was practicing feature engineering by converting categorical objects to numbers, with the following lines of code:

import pandas as pd 
import numpy as np
from sklearn import preprocessing
df = pd.read_csv(r'train.csv',index_col='Id')
print(df.shape)
df.head()
colsNum = df.select_dtypes(np.number).columns
colsObj = df.columns.difference(colsNum)

df[colsNum] = df[colsNum].fillna(df[colsNum].mean()//1)
df[colsObj] = df[colsObj].fillna(df[colsObj].mode().iloc[0])

label_encoder = preprocessing.LabelEncoder() 
for col in colsObj:
    df[col] = label_encoder.fit_transform(df[col])
df.head()
for col in colsObj:
    df[col] = label_encoder.inverse_transform(df[col])
df.head()

But here the inverse_tranform() wasn't returning the original dataset. Please help me!

Original Q&A

There are 1 answers

**David M.** · Accepted Answer · 2021-01-16T21:58:43+00:00

You need one encoder per column - you cannot encode all columns with the same encoder:

import pandas as pd
import numpy as np
from sklearn import preprocessing
df = pd.read_csv(r'train.csv', index_col='Id')
print(df.shape)

colsNum = df.select_dtypes(np.number).columns
colsObj = df.columns.difference(colsNum)

df[colsNum] = df[colsNum].fillna(df[colsNum].mean()//1)
df[colsObj] = df[colsObj].fillna(df[colsObj].mode().iloc[0])
print(df.head())

encoder = {}

for col in colsObj:
    encoder[col] = preprocessing.LabelEncoder()
    df[col] = encoder[col].fit_transform(df[col])
print(df.head())

for col in colsObj:
    df[col] = encoder[col].inverse_transform(df[col])
print(df.head())

You can also check out this answer for further details.

TechQA.

How to decode LabelEncoder implemented column in pandas dataframe?

There are 1 answers

Related Questions in PYTHON-3.X

Related Questions in DATAFRAME

Related Questions in PREPROCESSOR

Related Questions in SKLEARN-PANDAS

Related Questions in LABEL-ENCODING

Popular Questions

Popular Tags

Trending Questions