Zasobowo-racjonalny model ludzkiego przetwarzania rekursywnej struktury językowej. Część 3

Jan 23, 2024

Eksperyment 2: Wpływ wskazówek semantycznych

Następnie powtórzyliśmy eksperyment 1 na drugim zestawie elementów i jednocześnie przetestowaliśmy przewidywany efekt zgodności semantycznej.

Zgodność semantyczna odnosi się do zrozumienia i opanowania przez ludzi zgodności i wzajemnych powiązań między różnymi jednostkami języka, słów lub symboli. Pamięć odnosi się do zdolności człowieka do zapamiętywania i przechowywania informacji.

Istnieje ścisły związek między zgodnością semantyczną a pamięcią. Dobra zgodność semantyczna może poprawić jakość pamięci ludzi, podczas gdy słaba zgodność semantyczna będzie utrudniać ludziom zrozumienie informacji i efekty zapamiętywania.

Po pierwsze, zgodność semantyczna może poprawić istotność informacji, pomagając w ten sposób ludziom lepiej zrozumieć i zapamiętać informacje. Jeśli istnieje oczywista korelacja między różnymi jednostkami, ludzie mogą wykorzystać tę korelację do budowania połączeń między informacjami i tworzenia struktury sieciowej między informacjami. Ta struktura sieci może poprawić efekt pamięciowy informacji i zwiększyć zdolność ludzi do przechowywania informacji.

Po drugie, dobra kompatybilność semantyczna może poprawić zrozumiałość informacji, ułatwiając ludziom jej zapamiętanie. Jeśli istnieje oczywista relacja zgodności między informacjami, ludzie mogą łatwo zrozumieć powiązanie między informacjami, kształtując w ten sposób zrozumienie i pamięć informacji. Wręcz przeciwnie, jeśli pomiędzy informacjami będzie oczywista niezgodność, ludzie będą czuć się zagubieni i zagubieni oraz będą mieli trudności ze zrozumieniem i zapamiętaniem informacji.

Wreszcie słaba kompatybilność semantyczna może niekorzystnie wpływać na wydajność pamięci ludzi. Jeśli różnica między różnymi jednostkami jest zbyt duża, ludziom będzie trudno zrozumieć i zapamiętać informacje, co spowoduje utratę wartości pamięci. Dlatego w procesie pisania i rozpowszechniania informacji należy w jak największym stopniu zachować zgodność semantyczną, aby poprawić ludzkie zrozumienie i pamięć.

Podsumowując, istnieje silny związek pomiędzy zgodnością semantyczną a pamięcią. Dobra kompatybilność semantyczna może poprawić trafność i zrozumiałość informacji, poprawiając w ten sposób zdolność ludzi do przechowywania informacji i efekt pamięci. Dlatego w życiu codziennym i pracy należy w jak największym stopniu zachować zgodność semantyczną, aby poprawić zrozumienie i zapamiętywanie informacji. Widać, że musimy poprawić pamięć, a Cistanche desericola może znacznie poprawić pamięć, ponieważ Cistanche desericola to tradycyjny chiński materiał leczniczy, który ma wiele unikalnych efektów, z których jednym jest poprawa pamięci. Skuteczność mięsa mielonego wynika z różnych zawartych w nim składników aktywnych, w tym kwasów, polisacharydów, flawonoidów itp. Składniki te mogą na różne sposoby promować zdrowie mózgu.

help with memory

Kliknij Poznaj suplementy poprawiające pamięć

Oprócz dwóch manipulacji z eksperymentu 1, w DWÓCH i TRZECH warunkach, dodatkowo zmieniliśmy przedostatnią frazę czasownikową: W warunku ZGODNY, pierwszy rzeczownik był prawdopodobnym podmiotem (np. „denerwował pacjenta”); w warunku NIEZGODNY nie było (np. „wyleczył pacjenta”). W stanie ZGODNYM wersje nieprawdziwe, takie jak „raport…” powinny mieć większe prawdopodobieństwo aprioryczne, przewidując ostatni czasownik mniej dokładnie. Skonstruowaliśmy 42 elementy stymulujące.

Ryc. 3B przedstawia przewidywania z modelu racjonalnego zasobu i poprzednich teorii dla tych elementów. Oprócz efektów z eksperymentu 1, model przewiduje większą trudność w warunku KOMPATYBILNYM, szczególnie w obrębie TRZECH. Ani teoria zaskoczenia, ani DLT nie przewidują żadnego efektu kompatybilności.

Zebraliśmy dane dotyczące czasu czytania od 200 uczestników, w tym zarówno warianty KOMPATYBILNE, jak i NIEKOMPATYBILNE w DWÓCH i TRZECH warunkach. Pod wszystkimi innymi względami eksperyment i analiza danych były identyczne jak w eksperymencie 1. Czasy odczytu pokazano na ryc. 3B.

Wyniki eksperymentu 1 powtórzono: Po pierwsze, czasy odczytu były dłuższe w TRZECH niż w DWÓCH (= 0.29, 95% CrI [0.24, 0.35], P( < 0) ​​< 0.0001; czas odczytu efektu: 337 ms, 95% CrI [267, 411] ms).

Po drugie, istniała interakcja pomiędzy błędem osadzania a obecnością klauzuli „to” (= −0.06, 95% CrI [−0.1{ {9}}, −0,024],P( > 0)=0.0007). Podobnie jak w eksperymencie 1, efekt osadzania był dodatni w JEDNYM warunku (różnica między „faktem” a „raportem”: 193 ms, 95% CrI [37, 357] ms), a negatywny w DWÓCH i TRZECH warunkach (różnica między „ fakt” i „raport”: −105 ms, 95% CrI [−194, −18]ms).

Po trzecie, zgodnie z przewidywaniami modelu, czasy odczytu były wyższe w stanie KOMPATYBILNYM niż w stanie NIEKOMPATYBILNYM ({{0}}.083, 95% CrI [0.031, 0,136 ],P( < 0)=0.0014; efekt w surowych czasach odczytu: 96 ms, 95% CrI[36, 156] ms). Dalsze analizy można znaleźć w dodatku SI, sekcja S3.

Należy zauważyć, że skutki błędu osadzania i kompatybilności są liczbowo większe w TRZECH warunkach niż w DWÓCH warunkach; metaanaliza pokazuje, że różnice te są statystycznie istotne zarówno pod względem czasu odczytu, jak i części przestrzeni parametrów modelu (Załącznik SI, sekcje S2.1 i S6.6).

Liczbowe różnice w nachyleniu błędu osadzania pomiędzy ZGODNYM i NIEKOMPATYBILNYM nie były istotne statystycznie (Załącznik SI, rys. S23), ani też nie były różnice liczbowe w punkcie przecięcia przewidywań modelu pomiędzy dwoma eksperymentami (Załącznik SI, rys. S6).

Zobacz dodatek SI, sekcja S6, aby zapoznać się ze zbieżnymi dowodami z poprzednich badań czasu czytania (łącznie n=501). Następnie powtórzyliśmy wpływ osadzania stronniczości na zrozumienie w dwóch badaniach ratingowych (łącznie n=335; Załącznik SI, sekcja S5).

Eksperyment 3: Badanie produkcji

Jak dotąd potwierdziliśmy przewidywania modelu dotyczące czasów czytania. Trudność mierzona w czasach czytania wskazuje, że oczekiwania człowieka zostały naruszone, ale nie wskazuje bezpośrednio, jakie są ludzkie oczekiwania.

Aby zapewnić drugi test ludzkich oczekiwań, sięgnęliśmy do paradygmatu produkcji – zakończenia Cloze’a (40, 41) – który został wykorzystany w badaniach językowych do oceny, jakich słów oczekuje się bezpośrednio po preambule. Używamy tej metody do oceny złożoności struktur wielozagnieżdżonych i pomiaru liczby czasowników, jakich ludzie oczekują po złożonej preambule.*

Poprosiliśmy uczestników o uzupełnienie kontekstu w formie „Raport, że lekarz, który jest dyplomatą...” pełnym zdaniem. Oczekiwaliśmy, że uczestnicy albo uzupełnią gramatycznie trzema czasownikami, np. „...nie ufano, że wyleczono pacjenta, zaskakujące” lub niegramatyczne wersje z mniejszą liczbą czasowników, np. „…nieufność była zaskakująca”. Zasobowo-racjonalna niespodzianka w kontekście stratnym przewiduje, że wskaźnik takich niegramatycznych uzupełnień powinien być niższy w przypadku rzeczowników o dużym błędzie osadzania (np. „fakt”), ponieważ ułatwiają one odzyskanie prawdziwego kontekstu z reprezentacji w niedoskonałej pamięci (ryc. 4A). Istniejące modele oparte na oczekiwaniach i pamięci nie przewidują, że tempo uzupełniania gramatycznego zależy od błędu osadzania.

improve cognitive function

Zrekrutowaliśmy 80 uczestników. Ryc. 4 przedstawia odsetek niekompletnych uzupełnień (mniej niż trzy czasowniki) jako funkcję błędu osadzania. Zgodnie z przewidywaniami, błąd osadzania miał wpływ na odsetek odpowiedzi niegramatycznych (=−0.32, 95% CrI[−0.60, −0.05 ], P( > 0)=0.0123) w logistycznej analizie efektów mieszanych metodą prób po próbie.

Powtórzyliśmy to badanie w dwóch kolejnych językach (hiszpańskim i niemieckim), w tym w jednym (niemieckim), w którym trudność osadzania na środku jest znacznie mniejsza niż w języku angielskim (42).

ways to improve your memory

W języku hiszpańskim skupiliśmy się na zdaniach względnych podmiotu (el hechode que el dyrektor que, „fakt, że reżyser który”), aby uniknąć mniej naturalnych zdań względnych podmiot–początkowy dopełnienie, jednocześnie testując uogólnienie do innej konfiguracji składniowej. W języku niemieckim skupialiśmy się na strukturach osadzonych (np. Klaus hat erzahlt, ¨dass die Behauptung, dass der Student, den der Professor, „Klaus powiedział, że twierdzenie, że student jest profesorem”), ponieważ wiadomo, że zwiększają one trudność do poziomów bliższych Angielski (35).

Zrekrutowaliśmy 60 uczestników w każdym języku. W obu językach wpływ współczynnika osadzania oszacowano jako ujemny, a szacowana wielkość efektu jest porównywalna z wynikiem w języku angielskim (hiszpański:=−0.23, 95% CrI [−{{7 }}.34, −0.12], P( > 0)< 0.0003; German: β = −0.28, 95% CrI [−0.56, −0.03], P(β > 0) = 0.01738). These results suggest that the-previously undocumented-effect of embedding bias on human expectations holds across different languages, even when they vary in the overall difficulty of center embeddings.

Dyskusja

Wprowadziliśmy model przetwarzania języka ludzkiego jako przewidywanie racjonalne pod względem zasobów, skalowane do dowolnych danych wejściowych przy użyciu współczesnych metod uczenia maszynowego. Mając na celu pogodzenie perspektyw przetwarzania składniowego człowieka opartych na pamięci i oczekiwaniach, model nie tylko odtwarza przewidywania tych wcześniejszych teorii, jeśli są one prawidłowe, ale także przewiduje wcześniej nieudokumentowane interakcje między ograniczeniami pamięci a oczekiwaniami probabilistycznymi, co potwierdziliśmy w trzech eksperymentach behawioralnych badających przetwarzanie rekursywne przez człowieka Struktury.

Nasze wyniki pokazują, że dobrze udokumentowana trudność w integracji długich zależności językowych, która leży u podstaw istniejących modeli opartych na pamięci (5, 7, 36), jest w znacznym stopniu modulowana przez oczekiwania probabilistyczne: Porównanie warunków JEDNEGO i TRZECH pokazuje, że takie efekty lokalności mogą zostać osłabione lub nawet odwrócone, gdy nielokalna struktura syntaktyczna ma wysokie prawdopodobieństwo aprioryczne, co jest przewidywaniem, które w sposób naturalny wynika z proponowanego przez nas ujednolicenia perspektyw opartych na pamięci i oczekiwaniach.

Nasza praca dokumentuje ponadto trzy znaczące rodziny efektów z literatury psycholingwistycznej w jednym eksperymencie i jednym modelu: efekty lokalności (zwiększony poziom trudności TRZY), efekty przewidywalności (efekt osadzania w JEDNYM warunku) i efekty interferencji semantycznej (efekt zgodności semantycznej ).

Istnieje duże zainteresowanie ujednoliconym teoretycznym podejściem do skutków tych rodzin; nasza praca pokazuje, jak pojedynczy model może szczegółowo opisać wzajemne interakcje. Jedną z grup zjawisk, które nie były przedmiotem naszych eksperymentów, jest interferencja oparta na podobieństwie (43, 44). Ciekawym problemem dla przyszłych badań jest zbadanie, czy można to również uwzględnić w tych ramach modelowania.

Nasz model zasobowo-racjonalny jest formalnie powiązany z modelami różnych dziedzin. Klasyczne prace wykazały, że racjonalna analiza prawdopodobieństwa zatrzymania może wyjaśnić podstawowe właściwości ludzkiej pamięci (28, 29). Niedawna praca (45–48) sformalizowała racjonalne modele ludzkiej pamięci roboczej w niektórych dziedzinach, takich jak wizualna pamięć robocza, wykorzystująca teorię zniekształceń szybkości, ramy teoretyczno-informacyjne wyprowadzające kodowanie o wysokiej wierności przy ograniczeniach zasobów.

Kluczowa różnica między teorią zniekształceń szybkości a naszym modelem polega na tym, że miarą oszczędności jest tutaj ułamek dostępnych słów, podczas gdy w teorii zniekształceń szybkości jest to liczba zakodowanych bitów. Zastosowana do rozumienia zdań teoria zniekształceń szybkości doprowadziłaby do w pełni skompresowanych „istot” reprezentacji przeszłego kontekstu. Takie w pełni skompresowane reprezentacje nie prowadzą do wzorców trudności obserwowanych w naszych eksperymentach (więcej szczegółów można znaleźć w Dodatku SI, sekcja S8).

Z drugiej strony nasz model jest również uproszczeniem, ponieważ modeluje niedawny kontekst jako sekwencję słów, co może niedoceniać rolę reprezentacji pamięciowych dłuższego kontekstu, w którym mogły zostać zapomniane poszczególne słowa, ale pamięć o znaczeniu pozostaje. Dalszy postęp w maszynach uczenie się może pozwolić na wyciągnięcie bardziej wyrafinowanego formatu reprezentacji pamięci z optymalizacji racjonalnej pod względem zasobów.

W informatyce struktura rekurencyjna jest zwykle przetwarzana przy użyciu struktur danych opartych na stosie. Odpowiednio, wczesne modele ludzkiego przetwarzania składniowego zakładały ograniczenia rozmiaru stosu, czyli liczby węzłów, które mogą być jednocześnie przechowywane w pamięci (2, 24).

Takie modele przewidują, że głębsze osadzanie jest trudniejsze, ale nie przewidują, że trudność jest modulowana przez wskazówki statystyczne lub semantyczne. W przeciwieństwie do architektur opartych na stosach, nasza teoria przypisuje główną rolę probabilistycznym wskazówkom w ustalaniu struktury rekurencyjnej. Pod tym względem jest zgodny z nowszymi teoriami opartymi na pamięci, zakładającymi, że ludzie nie utrzymują struktur danych, takich jak stosy, a zamiast tego ustanawiają struktury syntaktyczne za pomocą wyszukiwania opartego na asocjacyjnych wskazówkach (5, 7, 49, 50). Modele wyszukiwania asocjacyjnego w obecnie wdrażanym (7) nie uwzględniają charakterystycznych wzorców trudności przewidywanych przez nasz model i obserwowanych w naszych eksperymentach. Niemniej jednak uważamy naszą teorię za zgodną z ideami z tej literatury.

Nasza teoria zapewnia model na poziomie obliczeniowym, który sprawia, że ​​przewidywania są zgodne z istniejącymi modelami opartymi na pamięci, ale – w przeciwieństwie do tych modeli – jest racjonalnie dostosowany do bogatej statystycznej struktury języka, umożliwiając mu przewidywanie, w jaki sposób ograniczenia pamięci oddziałują na oczekiwania probabilistyczne. Nasze wyniki sugerują, że identyfikacja probabilistycznych wersji modeli wyszukiwania asocjacyjnego, jako implementacji opisanego tutaj modelu racjonalno-zasobowego na poziomie algorytmicznym, jest interesującym problemem dla badań psycholingwistycznych. Zobacz Dodatek SI, sekcja S7.2, aby uzyskać więcej informacji na temat implikacji naszych wyników dla modeli pamięci opartych na wyszukiwaniu.

Zaproponowane przez nas ujednolicenie modeli opartych na oczekiwaniach i modeli opartych na pamięci opiera się na idei, że niedoskonałe reprezentacje pamięci roboczej są rekonstruowane racjonalnie – chociaż czasami niepoprawnie – przy użyciu znajomości statystyk języka. Pomysł ten ma ważny precedens w pracach nad redintegracją werbalnej pamięci roboczej ( np. ref. 51–55), proces, w wyniku którego zdegradowana pamięć krótkotrwała jest przywracana przy użyciu wiedzy z pamięci długotrwałej. Zastosowano to do pamięci list słów (np. ref. 52–55), a ostatnio do pamięci wzorców syntaktycznych (56). Nasz model zapewnia opis takich procesów w oparciu o wnioskowanie bayesowskie ograniczone racjonalnością zasobów. Istnieją również modele, w których pamięć robocza jest traktowana nie jako samodzielny składnik pamięci, ale jako wynik interakcji przetwarzania i pamięci długotrwałej (57, 58). W przypadku takich modeli nasze wyniki dostarczają danych na temat tego, w jaki sposób wiedza długoterminowa wpływa na przetwarzanie .

Nasze eksperymenty wykorzystują statystyczne korelaty struktur syntaktycznych, aby zbadać, w jaki sposób oczekiwania probabilistyczne oddziałują z ograniczeniami pamięci. Ma to pewne podobieństwa do wcześniejszych modeli opartych na oczekiwaniach, które pokazywały, jak korelacje, takie jak między animacją a względnym typem klauzuli, wpływają na przetwarzanie w sposób nieuwzględniony w istniejących kontach opartych na pamięci (np. ref. 59–61). Nasza praca rozszerza ten kierunek prac, przedstawiając wdrożoną teorię interakcji między ograniczeniami pamięci a oczekiwaniami probabilistycznymi.

Nasz model posiada dowolny parametr δ, czyli średnią liczbę zachowanych słów. Przy ustalaniu przewidywań i porównywaniu ich z czasami czytania przez człowieka przyjęliśmy jedną wartość. Dopasowanie go do indywidualnych podmiotów i zrozumienie jego związku z ustalonymi miarami różnic indywidualnych jest interesującym problemem dla przyszłych badań.

Koneksjonistyczne modele przetwarzania składniowego człowieka (8, 62–64) mają na celu opisanie przetwarzania ludzkiego przy użyciu oczekiwań wyprowadzonych z reprezentacji sieci neuronowych i zostały zaproponowane w celu modelowania efektów związanych zarówno z ograniczeniami pamięci, jak i oczekiwaniami probabilistycznymi. Jednakże różnice między zwykłą niespodzianką obliczoną za pomocą GPT-2 a niespodzianką racjonalną pod względem zasobów w kontekście stratnym pokazują, że ograniczenia pamięci podobne do ludzkich nie muszą pojawiać się automatycznie w modelach koneksjonistycznych.

Pokazaliśmy, jak model zasobowo-racjonalnego przetwarzania języka można skalować do bogatej struktury statystycznej języka naturalnego. Nasza metoda oparta na uczeniu maszynowym może otworzyć drzwi do dopasowania wyrafinowanych racjonalnych modeli do naturalnych statystyk wejściowych, a także do innych dziedzin ludzkiego poznania.

Ogólność naszego modelu sugeruje również, że podobne zjawiska mogą istnieć poza językiem: ilekroć ludzie przetwarzają dane wejściowe, które są zbyt złożone, aby wszystkie ich części mogły być obsługiwane jednocześnie, na przetwarzanie powinna mieć wpływ statystyczna struktura podobnych danych wejściowych.

improve brain

Materiały i metody

Rzeczowniki. Zebraliśmy rzeczowniki, które mogą stanowić uzupełnienie zdania, korzystając z banku drzew Penn (65), banku drzew w języku angielskim (66), banku drzew AnCoRA (67) w języku hiszpańskim i banku drzew HDT (68) w języku niemieckim. Oszacowaliśmy błąd osadzania jako logarytm prawdopodobieństwa, że ​​po RZECZOWNIKU nastąpi „to”, korzystając z angielskiej Wikipedii (2,3 miliarda słów), niemieckiej Wikipedii (800 milionów słów) i hiszpańskiej Wikipedii (500 milionów słów). Szczegółowe informacje można znaleźć w Załączniku SI, sekcja S11. Zatwierdziliśmy szacunki w języku angielskim, korzystając z dwóch innych dużych korpusów języka angielskiego amerykańskiego i brytyjskiego (Załącznik SI, sekcja S10.1).

Model. Racjonalna niespodzianka w kontekście stratnym w kontekście zasobów jest zdefiniowana przez rodzinę prawdopodobieństw zatrzymania θ={qw, i: i, w}, gdzie w obejmuje słowa andi=1, ..., N, gdzie N=20 to maksymalna brana pod uwagę długość kontekstu, wystarczająco długa, aby pomieścić wszystkie konteksty pojawiające się w eksperymentach. Parametryzujemy qw, I, używając sieci neuronowej, która łączy tożsamość poprzedniego słowa i liczbę słów pośrednich, aby uzyskać retencję prawdopodobieństwo (Załącznik SI, sekcja S1.1). Model θ daje początek prawdopodobieństwu p(c|c), a co za tym idzie późniejszemu p(c|c). Wybiera się go tak, aby zminimalizować średnie zaskoczenie następnego słowa dla wynikowego późniejszego p(w|c):

improve working memory

Konfiguracja eksperymentalna do badań czasu czytania. W przypadku wszystkich badań protokół eksperymentalny został zatwierdzony przez Instytucjonalną Komisję Rewizyjną na Uniwersytecie Stanforda. Uzyskano świadomą zgodę od wszystkich uczestników.

Każdemu uczestnikowi przedstawiono 10 krytycznych prób. W obu eksperymentach dwie próby odbyły się w JEDNYM, a cztery próby w DWÓCH i TRZECH. W eksperymencie 2 połowa z DWÓCH i TRZECH prób miała stan ZGODNY (NIEZGODNY). Wybraliśmy niewielką liczbę prób krytycznych, aby zminimalizować jakikolwiek efekt adaptacji statystycznej do osadzania wyśrodkowanego podczas zadania.

Aby zmaksymalizować precyzję statystyczną, wybraliśmy 15 rzeczowników z bardzo wysokim błędem osadzania i 15 rzeczowników z bardzo niskim błędem osadzania (Załącznik SI, ryc. S36). Dla każdego uczestnika pobraliśmy pięć rzeczowników o wysokim nastawieniu na osadzanie i pięć rzeczowników o niskiej wartości i dopasowaliśmy je do 10 krytycznych prób. Dla każdego uczestnika pobraliśmy również próbkę 30 wypełniaczy z puli 56 wypełniaczy z wcześniejszego badania czasu osadzania się w środku (42).

Aby usunąć anomalie semantyczne wynikające z naruszenia założeń (np. „fakt był błędny”), podzieliliśmy rzeczowniki na pociągające (np. „fakt”), niezawierające neutralności (np. „twierdzenie”) i niezawierające przeczenia (np. „ oskarżenie”) rzeczowniki i pozycje sklasyfikowane pod kątem zgodności z każdą z tych trzech klas (Załącznik SI, sekcja S11). Dla każdego uczestnika dopasowaliśmy 10 rzeczowników do elementów zgodnych semantycznie.

W przypadku zadania labirynt wygenerowaliśmy automatycznie dystraktory (39) przy użyciu modelu języka Gulordava (69): te dystraktory mają niezwykle niskie prawdopodobieństwo kontekstu, podczas gdy są dopasowywane do słowa docelowego pod względem częstotliwości i długości. Dystraktory dopasowywano według różnych warunków, z wyjątkiem drugiego do drugiego -ostatnie zdanie czasownikowe w warunkach (NIE)KOMPATYBILNYCH w eksperymencie 2. W szczególności, dystraktory zostały dopasowane do słowa krytycznego we wszystkich warunkach.

Kiedy uczestnicy popełnili błąd (tj. wybrali dystraktor), zostali poproszeni o ponowne wypróbowanie bieżącego słowa (70). Czasy reakcji w takich próbach zostały wykluczone; wybór ten nie miał wpływu na wnioski (Załącznik SI, sekcja S3.6).

Dla każdego pacjenta badania przedstawiono w losowej kolejności, tak aby żadne dwa krytyczne badania nie sąsiadowały ze sobą. Uczestnicy rekrutowani na platformie akademickiej Prolific spędzili średnio 13 minut i otrzymali 2,20 GBP (≈3 USD).

Analiza danych pod kątem czasu czytania. Wykluczyliśmy próby 1) z nieprawidłową odpowiedzią, 2) obejmujące uczestników, którzy popełnili błędy w ponad 20% słów oraz 3) poniżej lub powyżej 99% wszystkich czasów czytania. Zobacz Dodatek SI, sekcja S3.6, aby poznać odporność na warunek 1 i zobacz Dodatek SI, sekcja S3.7, aby zapoznać się z odpornością na warunek 3. Następnie przeanalizowaliśmy czasy odczytu po przekształceniu logarytmicznym w ostatecznych werbalizujących modelach efektów mieszanych Bayesa zaimplementowanych w Stan (71) użycie broni (72). Zobacz dodatek SI, sekcja S3.3, aby zapoznać się z wcześniejszymi wyborami i solidnością wcześniejszych wyborów. Zastosowaliśmy kodowanie kontrastowe z obecnością klauzuli „to” (JEDEN kontra DWA/TRZY), głębią (DWA kontra TRZY) i manipulacją zgodnością (ZGODNY vs. NIEKOMPATYBILNY) jako kontrasty. Błąd osadzania został wyśrodkowany, a wszystkie niepróżniowe interakcje binarne zostały dodane jako efekty stałe (Załącznik SI, sekcja S3.2).

Uwzględniliśmy strukturę maksymalnych efektów losowych uzasadnioną projektem eksperymentu, wprowadzając elementy, rzeczowniki i uczestników jako efekty losowe. Aby oszacować efekty w surowych czasach odczytu (milisekundy), najpierw obliczyliśmy przewidywany czas odczytu przekształcony w log w obu warunkach (np. ZGODNY i NIEKOMPATYBILNY), następnie przekształciliśmy oba w milisekundy poprzez potęgowanie i obliczyliśmy różnicę (patrz Dodatek SI, sekcja S3.4 dla dalszych szczegółów). Na ryc. 3 wykreślamy późniejszą średnią przewidywanego czasu czytania we wszystkich warunkach dla rzeczowników z osadzonym błędem dopasowywania „faktu” lub „raportu”. Słupki błędów reprezentują późniejsze SD.

Szczegóły dotyczące badania produkcji. Skonstruowaliśmy 28 elementów w formie „XXXten dyplomata, który jest senatorem” i wybraliśmy 12 rzeczowników, po 6 każdy z bardzo wysokim lub bardzo niskim błędem osadzania. Dla każdego uczestnika losowo połączyliśmy elementy i rzeczowniki. 12 krytycznych badań przedstawiono w losowej kolejności z 27 wypełniaczami. Alingwista odręcznie zanotował przy każdym uzupełnieniu, czy została utworzona prawidłowa liczba wyrażeń czasownikowych (trzy). Adnotator był ślepy na tożsamość rzeczownika.

W języku hiszpańskim i niemieckim wybraliśmy 20 rzeczowników z bardzo wysokim lub bardzo niskim stopniem osadzania w każdym języku, pobierając dla każdego uczestnika po 6 rzeczowników z wysokim i 6 niskim stopniem osadzania. Podobnie jak w wersji angielskiej, dla każdego uczestnika losowo dopasowaliśmy 12 pozycji do 12 wybranych rzeczowników. Wypełniacze zostały przetłumaczone z angielskiego eksperymentu.

W języku niemieckim skonstruowaliśmy dalej 12 zdań macierzowych (np. „Klaus powiedział to”) i losowo dopasowaliśmy je do elementów i rzeczowników dla każdego uczestnika. Przeprowadziliśmy Bayesowską logistyczną analizę mieszanych efektów „próba po próbie” z osadzeniem błędu systematycznego jako stałego efektu oraz losowe efekty rzeczowników, przedmiotów, uczestników i (w języku niemieckim) zdań macierzowych. Aby uzyskać szczegółowe informacje, zobacz dodatek SI, sekcja S4.

Dostępność danych, materiałów i oprogramowania. Dopasowane prawdopodobieństwa retencji i przewidywania modelu zostały zdeponowane w Zenodo (https://zenodo.org/record/6602698) (73), (https://zenodo.org/record/6988696) (74). Zanonimizowane czasy czytania, dane dotyczące produkcji języka i kod źródłowy zostały zdeponowane w GitLab (https://gitlab.com/m-hahn/resource-rational-surprisal) (75).

PODZIĘKOWANIE. Dziękujemy redaktorowi i recenzentom za konstruktywne uwagi, które pomogły ulepszyć manuskrypt. Jesteśmy także wdzięczni Judith Degen, Tiwalayo Eisape, Hailin Hao, Jennifer Hu, Danowi Jurafsky, PengQianowi, Cory’emu Shainowi, Shravanowi Vasishthowi, Tomowi Wasowowi, Ethanowi Wilcoxowi i publiczności na konferencji CUNY 2020 na temat przetwarzania zdań za pomocną dyskusję i opinie.

improve memory


Odniesienie

1. N. Chomsky, Struktury syntaktyczne (Mouton, Haga, 1957).

2. GA Miller, N. Chomsky, „Finitarne modele użytkowników języka” w Handbook of MathematicalPsychology, RD Luce, RR Bush, G. Galanter, wyd. (John Wiley, 1963), s. 269–321.

3. L. Frazier, „Złożoność składniowa” w analizie języka naturalnego: perspektywa psychologiczna, obliczeniowa i teoretyczna, DR Dowty, L. Karttunen, AM Zwicky, wyd. (Cambridge University Press, Nowy Jork, 1985), s. 129–189.
4. E. Gibson, Złożoność językowa: Lokalność zależności syntaktycznych. Poznanie 68, 1–76 (1998).

5. B. McElree, S. Foraker, L. Dyer, Struktury pamięciowe wspierające rozumienie zdań.J. Język pamięci. 48, 67–91 (2003).

6. W. Tabor, B. Galantucci, DC Richardson, Wpływ jedynie lokalnej spójności syntaktycznej na przetwarzanie zdań.J. Pam. Lang. 50, 355–370 (2004).

7. RL Lewis, S. Vasishth, Model przetwarzania zdań oparty na aktywacji jako umiejętne odzyskiwanie pamięci.Cogn. Nauka. 29, 375–419 (2005).

8. MH Christiansen, MC MacDonald, Podejście do rekurencji w przetwarzaniu zdań oparte na użyciu.Lang. Uczyć się. 59, 126–161 (2009).

9. J. Hale, (2001) „A probabilistic Early Parser as a psycholinguistic model” w: Proceedings of the SecondMeeting of the North American Chapter of Association for Computational Linguistics, NAACL 2001, L. Levin, K. Knight, wyd. (Association for Computational Linguistics, Stroudsburg, Pensylwania), s. 1–8.

10. R. Levy, Rozumienie składniowe oparte na oczekiwaniach. Poznanie 106, 1126–1177 (2008).

11. K. Rayner, AD Cóż, Wpływ ograniczeń kontekstowych na ruchy oczu podczas czytania: dalsze badanie. Psychon. Byk. Obj. 3, 504–509 (1996).

12. A. Staub, Wpływ przewidywalności leksykalnej na ruchy oczu podczas czytania: przegląd krytyczny i interpretacja teoretyczna.Lang. Językoznawca. Kompas 9, 311–327 (2015).


For more information:1950477648nn@gmail.com



Może ci się spodobać również