Missing Data Imputation for Categorical Variables

Jaroslav Horníček, Hana Řezanková

Statistika, 102(3): 249-260

Dealing with missing data is a crucial part of everyday data analysis. The IMIC algorithm is a missing data imputation method that can handle mixed numerical and categorical datasets. However, the categorical data are crucial for this work. This paper proposes the new improvement of the IMIC algorithm. The two proposed modifications consider the number of categories in each categorical variable. Based on this information, the factor, which modifies the original measure, is computed. The factor equation is inspired by the Eskin similarity measure that is known in the hierarchical clustering of categorical data. The results show that as the missing value ratio in the dataset grows, better results are achieved using the second modification. The paper also shortly analyzes the advantages and disadvantages of using the IMIC algorithm.    

IMIC algorithm, missing value imputation, categorical variables


  • Download full article in PDF

Zdroj datwww.czso.cz
Zobrazit sloupec 

Kalkulačka - Výpočet

Výpočet čisté mzdy

Důchodová kalkulačka

Přídavky na dítě

Příspěvek na bydlení

Rodičovský příspěvek

Životní minimum

Hypoteční kalkulačka

Povinné ručení

Banky a Bankomaty

Úrokové sazby

Hypotéky, Stavební spoření

Směnárny - Euro, Dolar

Práce - Volná místa

Úřad práce, Mzdy, Platy

Dávky a příspěvky

Nemocenská, Porodné

Podpora v nezaměstnanosti



Burza - ČEZ

Dluhopisy, Podílové fondy

Ekonomika - HDP, Mzdy

Kryptoměny - Bitcoin, Ethereum

Drahé kovy

Zlato, Investiční zlato, Stříbro

Ropa - PHM, Benzín, Nafta, Nafta v Evropě


Obchodní rejstřík

Města a obce, PSČ

Katastr nemovitostí

Ochranné známky

Finanční katalog

Občanský zákoník

Zákoník práce

Stavební zákon

Daně, formuláře

Další odkazy

Auto - Cena, Spolehlivost

Monitoring ekonomiky

Volby, Mapa webu

English version

Czech currency

Prague stock exchange

Ochrana dat

Používání cookies

Copyright © 2000 - 2024

Kurzy.cz, spol. s r.o., AliaWeb, spol. s r.o. V