W poszukiwaniu różnorodnych i połączonych zespołów: podejście obliczeniowe do tworzenia różnorodnych zespołów na podstawie członków, część 5
Jan 25, 2024
Szybki, niezdominowany krok sortowania. Następnie algorytm musi wybrać najlepsze chromosomy r z tej sumy o rozmiarze 2r. Aby znaleźć ten zestaw, algorytm przeprowadza sortowanie niezdominowane wśród wszystkich istniejących chromosomów z P.
Sortowanie według dominacji to powszechna technika zapamiętywania, która pomaga nam lepiej zapamiętywać i rozumieć rzeczy. Ustanawia przede wszystkim logiczne powiązania pomiędzy wiedzą poprzez klasyfikację, sortowanie i podsumowywanie powiązanych informacji, ułatwiając nam zrozumienie i zapamiętanie tej wiedzy.
Etapy sortowania dominującego obejmują głównie klasyfikację, sortowanie, indukcję i podsumowanie. Na etapie klasyfikacji musimy sklasyfikować istotne informacje i podzielić je na różne kategorie; na etapie sortowania musimy określić poziom i wagę każdej kategorii, aby można było ją ułożyć w określonej kolejności; na etapie wprowadzenia należy zintegrować i wyodrębnić relacje między różnymi kategoriami, aby lepiej zrozumieć i zapamiętać tę wiedzę; na etapie podsumowania musimy przejrzeć i zastanowić się nad całym procesem sortowania dominacji, aby odkryć i skorygować nasze niedociągnięcia.
Sortowanie według dominacji jest ściśle powiązane z pamięcią. Może pomóc nam lepiej uporządkować i uporządkować wiedzę, poprawiając w ten sposób wydajność pamięci. Poprzez dominację i sortowanie możemy systematycznie integrować i porządkować różne informacje oraz ustalać hierarchie i powiązania wiedzy, tworząc w ten sposób sieć pamięci, dzięki której nasze wspomnienia stają się silniejsze i głębsze. Jednocześnie sortowanie według dominacji może również pomóc nam lepiej poznać wartość i zastosowanie wiedzy, poprawiając w ten sposób nasze umiejętności myślenia i rozwiązywania problemów.
Krótko mówiąc, sortowanie według dominacji jest bardzo praktyczną techniką zapamiętywania, która może pomóc nam lepiej zrozumieć i zapamiętać różną wiedzę. Dzięki ciągłej praktyce i stosowaniu możemy stać się bardziej biegli w opanowaniu tej umiejętności, kładąc w ten sposób solidny fundament pod naszą naukę i rozwój. Widać, że musimy poprawić pamięć, a Cistanche desericola może znacznie poprawić pamięć, ponieważ Cistanche desericola to tradycyjny chiński materiał leczniczy, który ma wiele unikalnych efektów, z których jednym jest poprawa pamięci. Skuteczność mięsa mielonego wynika z różnych zawartych w nim składników aktywnych, w tym kwasów, polisacharydów, flawonoidów itp. Składniki te mogą na różne sposoby promować zdrowie mózgu.

Kliknij Poznaj pamięć krótkotrwałą, jak ją ulepszyć
Celem jest identyfikacja rozwiązań, które działają lepiej od innych i sklasyfikowanie ich według ich działania na różnych frontach Pareto F. Algorytm najpierw sprawdza relacje dominacji pomiędzy wszystkimi chromosomami. Biorąc pod uwagę dwa chromosomy, T i T{{0}}, T dominuje nad T0 wtedy i tylko wtedy, gdy Cc(T)�Cc(T0) i V(T)�V( T0) z co najmniej jedną ścisłą nierównością.
Innymi słowy, T jest co najmniej tak samo dobre jak T{{0}} w przypadku wszystkich celów i znacznie lepsze w przypadku co najmniej jednego. Ta relacja dominacji jest oznaczona jako T � T0. Jeśli jeden z celów T nie jest lepszy od T0 i nie można go poprawić pod względem wartości bez pogorszenia niektórych innych wartości celów, wówczas T nie jest zdominowane przez T0
Jednym z przykładów rozwiązania niedominowanego jest T mający wyższe wyniki różnorodności, ale wyższe koszty komunikacji niż T0. W tym przypadku braku dominacji albo T, albo T0 są możliwymi rozwiązaniami dla następnej generacji.
Gdy algorytm odwzoruje relacje dominacji wszystkich chromosomów, tworzy pierwszy front Pareto rozwiązań składający się ze wszystkich rozwiązań niezdominowanych (F1). Zbiór ten jest również nazywany optymalnym Pareto.
Następnie algorytm tworzy drugi front rozwiązań optymalnych Pareto (F2), które zostały pominięte w pierwszym froncie, i tak dalej. W rezultacie algorytm sortuje chromosomy populacji w hierarchię subpopulacji. Sortowanie znajduje kolejne fronty Pareto, dopóki wszystkie chromosomy nie zostaną przypisane do frontu Pareto.
Nowa populacja. Następnie algorytm wybiera najlepsze chromosomy r dla następnej generacji. W danym momencie chromosomy 2r są posortowane w hierarchicznym froncie Pareto F. Algorytm tworzy nową populację P0dodając chromosomy przechowywane na frontach Pareto.
Jeśli całkowity rozmiar pierwszego frontu Pareto jest mniejszy niż r, algorytm dodaje wszystkie chromosomy tego frontu do P{{0}}. Następnie algorytm dodaje pozostałe rozwiązania dla nowej populacji z kolejnych frontów niedominowanych. Algorytm kontynuuje tę procedurę, dopóki nie będzie mógł dodać więcej frontów do P0.
Odległość tłoczenia. Algorytm musi dodawać chromosomy do nowej populacji, aż będzie dokładnie r chromosomów. Jeśli ostatni wybrany niezdominowany front Pareto Fk ma więcej chromosomów niż można dodać do P0, algorytm musi wybrać mniejszy zestaw z Fk, aby uzupełnić r chromosomów.
Niech d ¼ r RozmiarðPÞ, liczba brakujących chromosomów do uzupełnienia r. Algorytm identyfikuje najlepsze chromosomy δ z ostatniego frontu Fk, obliczając odległość stłoczenia między chromosomami.

Ta metryka określa, jak podobne są chromosomy pod względem wydajności w problemie wielocelowym. Po obliczeniu tej odległości algorytm szereguje chromosomy według ich odległości i eliminuje chromosomy, które zachowują się podobnie do innych chromosomów. Ta procedura utrzymuje obcokrajowców na czele rozwiązań i usuwa zbędne chromosomy.
Następnie do P{{0}} dodaje się najlepsze δ chromosomy z Fk. W rezultacie P0 liczy się z r najlepszymi chromosomami i staje się rodzicem następnego pokolenia, rozpoczynając nową iterację.

Dane
W tej sekcji oceniamy proponowany algorytm dla naszego problemu tworzenia zespołu, korzystając z trzech zbiorów danych ze świata rzeczywistego. Źródłami danych są MyDreamTeam (platforma tworzenia zespołów), Bibsonomy (strona z zakładkami społecznościowymi) i GHTorrent (baza danych repozytorium GitHub).
Użycie tych zbiorów danych do symulacji zespołów w przypadku tego problemu tworzenia zespołu ilustruje skuteczność naszego frameworka w rzeczywistych scenariuszach. Statystyki podsumowujące z tych zbiorów danych pokazujemy w Tabeli 2. Uzyskane dane i skrypty do wstępnego przetwarzania surowych danych są dostępne pod adresemhttp://nusoniclab.github.io/.

Zbiór danych MyDreamTeam. Oceniamy proponowany przez nas algorytm, korzystając z danych z rzeczywistych przypadków tworzenia zespołów. Wyodrębniliśmy ten zbiór danych z My Dream Team Builder [33], systemu rekomendującego, który pomaga indywidualnym osobom w samodzielnym tworzeniu zespołów.
Ten zbiór danych zawiera przypadki uczestników, którzy samodzielnie tworzyli swoje zespoły. Sprawy pochodzą z lat 2014–2020. W tym systemie rekomendacji uczestnicy tworzą profile, wyszukują członków zespołu i wysyłają zaproszenia do tworzenia zespołów.
Sprawy dotyczą zajęć z uniwersytetów w Stanach Zjednoczonych. Zbiór danych obejmuje cechy uczestników, dane demograficzne i sieci społecznościowe, które zgłosili we wstępnej ankiecie. Do przetestowania naszego algorytmu wybraliśmy trzy przypadki: studia licencjackie, studia magisterskie i kursy MBA. Uczestnicy wykorzystali system do tworzenia zespołów do dyskusji w małych grupach.
Pozwolenie na gromadzenie danych od uczestników zostało zatwierdzone przez Komisję Rewizyjną Instytutu Northwestern University (#STU00078513). Podczas badań przestrzegano wszystkich obowiązujących przepisów instytucjonalnych i rządowych dotyczących etycznego wykorzystania obiektów ludzkich.
Zgodę w formie elektronicznej uzyskano od uczestników badania za pośrednictwem narzędzia ankiety internetowej. Uczestnicy zostali poproszeni o wyrażenie zgody na wykorzystanie danych zebranych za pośrednictwem My Dream Team Builder do celów badawczych. Zaszyfrowaliśmy identyfikatory użytkowników, aby utworzyć zbiór danych pozbawiony identyfikacji.
BibSonomy. Drugi zbiór danych pochodzi z BibSonomy [34], systemu społecznościowego umożliwiającego tworzenie zakładek i udostępnianie publikacji. Wybraliśmy bibsonomię, ponieważ wcześniejsze prace dotyczące tworzenia zespołów testowały ich algorytmy przy użyciu tej bazy danych [58].

Administratorem tego zbioru danych jest grupa Knowledgeand Data Engineering Group na Uniwersytecie w Kassel. Zbiór danych bibsonomy jest dostępny w ramach umowy licencyjnej i można go zamówić pod adresem https://www.kde.cs.uni-kassel.de/wp-content/uploads/bibsonomy/. Zbiór ten zawiera dużą liczbę publikacji z zakresu informatyki. Każda publikacja pisana jest przez grupę autorów.
Wielu użytkowników odwiedza witrynę Bibsonomy, używając tagów do opisywania publikacji. Postępując zgodnie z procedurą opisaną przez Anagnostopoulosa i in. [58] wykorzystaliśmy znaczniki powiązane z artykułami każdego autora, aby przedstawić jego umiejętności. Umiejętności każdego autora reprezentują liczbę opublikowanych artykułów opatrzonych odpowiednim tagiem. Do przetestowania naszego algorytmu wybraliśmy trzy czasopisma związane z analizą sieci społecznościowych: „Nature”, „Science” i „Physica A: Statistical Mechanics and his Applications”.
Policzyliśmy częstotliwość tagów w każdym z tych czasopism i wybraliśmy kilka popularnych tagów związanych z naszym badaniem. W przypadku pierwszych dwóch czasopism wybraliśmy artykuły oznaczone tagami „sieć”, „sieć społecznościowa” i „mały świat”.
Następnie zidentyfikowaliśmy autorów tych artykułów, utworzyliśmy sieć współautorstwa i wybraliśmy autorów z największego komponentu. Podobnie zrobiliśmy tę procedurę dla trzeciego czasopisma, używając tagów „sieć”, „wykres”, „model” i „system”. Zahaszowaliśmy nazwiska autorów, aby utworzyć zbiór danych pozbawiony identyfikacji.
GHTorrent. Wykorzystaliśmy dane GitHub dostarczone przez projekt GHTorrent [35], kopię offline danych oferowanych przez API GitHub. Ten zbiór danych można pobrać pod adresem https://ghtorrent.org/downloads.html. Zbiór danych GHTorrent obejmuje szeroki zakres działań programistycznych na Githubie, w tym repozytoria, żądania ściągnięcia i użytkowników. Pobraliśmy zrzut zestawu danych „01.06.2019”, aby zbudować nasz testowy zestaw danych.
Przefiltrowaliśmy użytkowników, którzy współtworzyli od 40 do 80 projektów, aby uwzględnić w naszej analizie medianę użytkowników. Kierując się podejściem podobnym do zbioru danych BibSonomy, użyliśmy języków programowania powiązanych z repozytoriami wniesionymi przez każdego użytkownika, aby reprezentować umiejętności użytkowników.
Umiejętności każdego użytkownika reprezentują liczbę wniesionych projektów napisanych w określonym języku. Ponieważ repozytoria mogą zawierać pliki w wielu językach, jako język repozytorium wybraliśmy najczęściej używany język repozytorium.
W tym zbiorze danych wybraliśmy trzy najpopularniejsze języki: Java, Python i Ruby. Następnie zidentyfikowaliśmy użytkowników tych repozytoriów i stworzyliśmy sieć współpracy. W tym przykładzie użytkownicy mają atie, jeśli co najmniej dwa razy współtworzyli to samo repozytorium. Na koniec wybraliśmy użytkowników z największego komponentu. Zaszyfrowaliśmy nazwiska autorów, aby utworzyć zbiór danych pozbawiony identyfikacji.
Ocena
Porównujemy zaproponowany algorytm problemu tworzenia zespołu (oznaczany jako NSGA-II) z trzema dobrze znanymi metodami optymalizacji wielocelowej stosowanymi w celach porównawczych [62, 72]:
Metoda wyszukiwania lokalnego Pareto (PLS). Ten iteracyjny algorytm rozpoczyna się od zbioru losowych rozwiązań jako populacji początkowej i bada sąsiadów każdego rozwiązania [73, 74]. Algorytm aktualizuje populację w oparciu o dominację Pareto: doda do populacji niedominowanych sąsiadów i usunie istniejące rozwiązania, które są zdominowane przez nowo dodane rozwiązania.
Po całkowitym zbadaniu sąsiedztwa rozwiązania, rozwiązanie zostaje oznaczone jako zbadane. Algorytm iteracyjnie bada nowe rozwiązania w miarę ich dodawania do populacji, aż do momentu, gdy nie zostaną znalezione żadne lepsze rozwiązania. Po zbadaniu wszystkich rozwiązań i nieodkryciu więcej rozwiązań niedominowanych, algorytm zatrzymuje się. Zaimplementowaliśmy wersję zaproponowaną przez Zihayata i in. [72] dla problemów kombinacyjnych.
W tej implementacji sąsiadami rozwiązania są wszystkie możliwe kombinacje zespołów z rozwiązania, w którym dwóch członków zamienia się zespołami. Ponieważ PLS nie zależy od ustalonej liczby pokoleń, przeprowadzamy tylko jedną iterację tego algorytmu, aby porównać jego wyniki z innymi metodami.

Biorąc pod uwagę n osobników i że algorytm będzie badał n2 sąsiadów każdego rozwiązania, złożoność obliczeniowa tej implementacji w najlepszym przypadku wynosi O(n3).
For more information:1950477648nn@gmail.com






