Losowe generowanie danych o znanej strukturze klas w pakiecie clusterSim

Abstract
W artykule zaprezentowana zostanie funkcja cluster.Gen pakietu clusterSim służąca do losowego generowania zbiorów danych o znanej strukturze klas, pracująca w środowisku R, która ma następujące zalety: - pozwala na generowanie danych metrycznych (ilorazowych i przedziałowych), porządkowych oraz symbolicznych przedziałowych dla danej liczby wymiarów (zmiennych) - np. pięciu skupień w przestrzeni trójwymiarowej, - położenie i jednorodność skupień zadaje się za pomocą wektorów wartości przeciętnych (środki ciężkości skupień) i macierzy kowariancji (rozproszenie obiektów), - istnieje możliwość wygenerowania klas o różnej gęstości i kształcie, -istnieje możliwość uwzględnienia zmiennych zakłócających strukturę klas (noisy variabies) oraz obserwacji odstających (outliers).
Description
Keywords
Citation
Belongs to collection