Przełomowe badania nad tym, co powiedziała

Zaskakująca skuteczność i długowieczność legendarnego już teraz tak powiedziała żart, ostatnio ponownie spopularyzowany przy pomocy Biuro , zrobił więcej niż tylko zapewnił milionom odruchową odpowiedź na swobodną rozmowę. Osiągnął teraz nowy poziom znaczenia społecznego, inspirując poważne badania językowe. Występuje w formie artykułu badawczego zatytułowanego Tak powiedziała: Podwójna identyfikacja entender , autorstwa dwóch studentów informatyki, Chloe Kiddon i Jurij Brun .

W swoim artykule para opisuje swoje stworzenie Double Entender przez przeniesienie rzeczownika lub DEviaNTvia podejście, które automatycznie identyfikuje to, co powiedziała (TWSS) żarty. Nazywają swoje podejście analizą metaforyczną, która niesie ze sobą podwójne znaczenie i opiera się na uznaniu pewnych słów za bardziej seksowne niż inne. Zespół zważył kilka seksownych rzeczowników i czasowników, a następnie uruchomił swój algorytm.

W swoich badaniach para odkryła również kilka interesujących zasad żartów TWSS. Na przykład ryzyko nieprawidłowego wywołania żartu TWSS. Z ich badania:

Na przykład w otoczeniu towarzyskim koszt powiedzenia tego niewłaściwie jest wysoki, podczas gdy koszt nie powiedzenia tego, gdy mogłoby to być właściwe, jest znikomy.

Aby rozwiązać ten problem i uzyskać lepsze wyniki, zespół zastosował algorytm uczenia się. Między innymi spowodowało to 100 razy większą liczbę wyników fałszywie dodatnich niż fałszywie ujemnych.

Po uruchomieniu DEviaNT przez serię wstępnie zidentyfikowanych materiałów dowcipów TWSS i losowych cytatów. W swoim teście użyli 1,5 zdania erotycznego i 57 000 zdań nieerotycznych. Zespół twierdzi, że osiągnęli wskaźnik sukcesu przekraczający 71,4%. Chociaż może to nie wydawać się dużo, zespół twierdzi, że przy większym zbiorze danych spodziewaliby się wyników bliższych 99,5%. Dodatkowo DEviaNT zwrócił kilka interesujących wyników. Ponownie z badania:

DEviaNT zwrócił 28 takich zdań (wszystkie związane z najprawdopodobniej TWSS), z których 20 to prawdziwe pozytywne. Jednak 2 z 8 fałszywie pozytywnych wyników to w rzeczywistości TWSS (pomimo negatywnych danych z testów): Tak, daj mi całą śmietankę i już go nie ma. i tak, ale jego dziura naprawdę czasami śmierdzi.

Niektórzy mogą umniejszać te badania, nazywając je po prostu skowronkiem i mało wartościowym. Byłby to atak typu low-blow, ponieważ nawet naukowcy opisują swoją pracę jako trudny problem ze zrozumieniem języka naturalnego. (Tak powiedziała.)

( Nowy naukowiec przez Uciekinier )