Microsoft Excel бағдарламасында кластерлік талдауды қолдану

Pin
Send
Share
Send

Экономикалық мәселелерді шешудің құралдарының бірі - кластерлік талдау. Оның көмегімен кластерлер және мәліметтер массивінің басқа объектілері топтарға жіктеледі. Бұл техниканы Excel бағдарламасында қолдануға болады. Мұның іс жүзінде қалай жасалынғанын көрейік.

Кластерлік талдауды қолдану

Кластерлік талдаудың көмегімен зерттелетін атрибутқа сәйкес іріктеуді жүргізуге болады. Оның негізгі міндеті - көп өлшемді массивті біртекті топтарға бөлу. Топтау критерийі ретінде жұп корреляция коэффициенті немесе берілген параметр бойынша объектілер арасындағы Евклид қашықтық қолданылады. Бір-біріне жақын шамалар топтастырылған.

Талдаудың бұл түрі көбінесе экономикада қолданылады, бірақ оны биологияда (жануарларды жіктеу үшін), психологияда, медицинада және адам қызметінің көптеген басқа салаларында да қолдануға болады. Осы мақсат үшін кластерлік талдауды стандартты Excel құралдар жинағын қолдана отырып қолдануға болады.

Пайдалану мысалы

Бізде екі зерттелген параметрлермен сипатталатын бес объект бар - х және у.

  1. Шаблон бойынша есептелетін осы шамаларға Евклид қашықтық формуласын қолданамыз:

    = РОТ ((x2-x1) ^ 2 + (y2-y1) ^ 2)

  2. Бұл мән бес объектінің әрқайсысы арасында есептеледі. Есептеу нәтижелері қашықтық матрицасына орналастырылады.
  3. Қашықтардың қайсысы ең аз екенін қарастырамыз. Біздің мысалда бұл объектілер 1 және 2. Олардың арасындағы қашықтық 4.123106, бұл популяцияның басқа элементтерінен аз.
  4. Осы деректерді топқа біріктіріп, жаңа матрицаны құрыңыз, онда мәндері болады 1,2 бөлек элемент ретінде әрекет етіңіз. Матрицаны құрастыру кезінде біріктірілген элемент үшін алдыңғы кестеден ең кіші мәндерді қалдырамыз. Тағы да қарастырамыз, қай элементтердің арасындағы қашықтық минималды. Бұл уақыт 4 және 5сондай-ақ нысан 5 және объектілер тобы 1,2. Қашықтық - 6 708204.
  5. Көрсетілген элементтерді жалпы кластерге қосамыз. Біз алдыңғы матрицаға сәйкес жаңа матрицаны қалыптастырамыз. Яғни, біз ең кіші мәндерді іздейміз. Осылайша, біз деректер жиынтығын екі кластерге бөлуге болатындығын көреміз. Бірінші кластерде бір-біріне жақын элементтер бар - 1,2,4,5. Екінші кластерде біздің жағдайда тек бір ғана элемент ұсынылған - 3. Ол басқа объектілерден салыстырмалы түрде алыс. Кластерлер арасындағы қашықтық - 9,84.

Бұл популяцияны топтарға бөлу процедурасын аяқтайды.

Көріп отырғаныңыздай, жалпы кластерлік талдау күрделі рәсім сияқты көрінуі мүмкін, бірақ іс жүзінде бұл әдістің нюанстарын түсіну соншалықты қиын емес. Ең бастысы - топтаудың негізгі заңдылығын түсіну.

Pin
Send
Share
Send