Dzisiejszy wpis będzie kontynuacją rozważań na temat dlaczego w informatyce jest tak mało kobiet? W pierwszym wpisie argumentowałem, że przyczyną dysproporcji nie może być seksizm, ponieważ, po pierwsze, seksizm w informatyce nie jest znacząco częstszy niż w innych dziedzinach (chociaż w polach STEM wziętych ogółem jest częstszy), oraz po drugie i znacznie ważniejsze, są dziedziny, gdzie seksizmu jest więcej, a procent kobiet jest większy niż w informatyce. Jest to bardzo silną poszlaką, że nawet jeżeli seksizm ma jakiś wpływ na procent kobiet, nie może to być wpływ decydujący (ani nawet szczególnie znaczący).
Obecnie podejdę z drugiej strony i rozważę częsty argument rzucany z drugiej strony barykady: że kobiety są po prostu mniej zdolne i mniej się nadają do kierunków ścisłych. Dla tych, co nie lubią czytać zbyt dużo, krótkie streszczenie: nie, ten argument nie wyjaśnia dysproporcji. Dla osób doszukujących się wszędzie seksizmu i mizoginii na dole tzw. disclaimer.
Na początek kilka faktów. Kobiety w Polsce (zresztą jak chyba wszędzie w Europie) stanowią większość studentów w ogóle, chociaż w roku 2005 w grupie wiekowej 20-24 lata (czyli potencjalnych studentów) kobiet było raptem 49% (czyli przypada 97 kobiet na 100 mężczyzn). Nie chce mi się szukać dokładnych aktualnych danych, ale wikipedia oraz szybki gugiel dają mi dane, ze np w roku studenckim 2016/2017 kobiety stanowiły 57% studentów ogółem, i nieco ponad 58% na studiach stacjonarnych. Tak więc kobiety ogółem są nadreprezentowane na studiach, na dodatek częściej kończą studia niż mężczyźni; co ciekawe, jako wyjaśnienie tego faktu nie podaje się tego, że mężczyźni są ofiarami seksizmu albo dyskryminacji, ale raczej że “częściej uważają, że nauka w szkole to strata czasu”. Co ciekawe: w grupie osób z wyższym wykształceniem na każdego faceta przypada 1.4 kobiety (czyli na każdych stu mężczyzn jest sto czterdzieści kobiet z wyższym wykształceniem i nikomu w Polsce to nie przeszkadza).
Na kierunkach informatycznych w Polsce mamy 14,3% kobiet i liczba ta rośnie. Średnia dla Unii Europejskiej dla kierunków “ICT” (information and communication technology) wynosi 16.7%. Mamy więc rażącą dysproporcję.
Niektórzy podają, że po prostu, panie, chłopcy lepsi są w matmę, mądrzejsi są i w ogóle, o czym tu panie gadać. Problem polega na tym, że gdyby jako wyznacznik “mądrości” wyznaczyć g, to większość artykułów podaje, że nie ma różnic między inteligencją kobiet a mężczyzn (nic dziwnego, testy są standaryzowane tak, by różnic nie było), jest kilka podających, że inteligentniejsze są kobiety, a najbardziej korzystne dla mężczyzn podają przewagę rzędu 4-5 punktów (inteligentniejsze w sensie wyższych wartości g wyekstrahowanych z wyników testów IQ).
Teraz, na potrzeby tylko tych rozważań, przyjmijmy na chwilę, że to jest prawda. Dla tych mniej kumatych: to nie znaczy, że uważam, że to prawda (albo, że nieprawda) – przyjmuję to tylko po to, by sprawdzić, jakie by były konsekwencje takiego założenia (tj. co by było, gdyby…). Średnia dla studentów IT to niby 124. Sprawdźmy teraz, jaki procent mężczyzn i kobiet byłby powyżej tej granicznej wartości 124 punktów, dla przyjętej różnicy w g. Dla uproszczenia przyjmijmy taki sam procent kobiet i mężczyzn w grupie wiekowej (przyjęcie, że kobiet jest 49% minimalnie wpływa na wyniki). Oczywiście, średnia to średnia, czyli w rzeczywistości są i tacy, co mają mniej punktów, a studia ukończą. Przyjmijmy jednak, że to 124 to wartość graniczna, tj. taki wynik testu IQ muszą mieć kandydaci/kandydatki, by móc się dostać na studia.
Pewien bardzo kontrowersyjny duński samouk przygotował rewelacyjne narzędzie do wizualizacji statystyk. Znajduje się ono tutaj. Wpisujemy w to narzędzie różnicę 4 punktów i wychodzi nam, że gdyby g faktycznie miało decydować, to kobiet powinno być blisko 38% – to znaczy, że 10% mężczyzn i 5.5% kobiet miało inteligencję powyżej 124 punktów. Dla pięciu punktów mamy 35% kobiet – czyli nawet w tym scenariuszu, powinno być ich dwa razy więcej niż faktycznie jest.
To nie wszystko: mężczyźni wydaje się, że mają nieco większe standardowe odchylenie. Wszystkie artykuły są zgodne, że nawet jeżeli to prawda, to różnice nie są duże. Pogrzebałem trochę i wynika,że maksymalnie dla g oraz dla IQ te różnice to jakiś jeden punkt. Po wpisaniu odpowiednich wartości do narzędzia naszego duńskiego samouka (w blue group daję 104, odchylenie standardowe 15, a dla red group daję 100, odchylenie 14) otrzymuję, że w grupie powyżej 124 kobiet wciąż powinno być trzydzieści procent. Przypominam – przyjąłem tutaj maksymalne wartości różnic odnalezione w rozsądnej literaturze, oraz dość wysoki próg dla studentów informatyki (średnią wziąłem jako minimum!). Wystarczy przyjąć, że próg ten to 115 i dla podanych wyżej maksymalnych wartości, kobiet powinno być trzydzieści sześć procent.
A jest średnio w unii europejskiej, przypominam, siedemnaście procent.
Tak więc nawet przyjmując wersję skrajną – z którą nie zgadza się bardzo wielu, jeżeli nie większość osób zajmujących się psychometrią – i tak znane z literatury wartości nie wyjaśniałaby tak rażących dysproporcji.
Przy czym inteligencja, oczywiście, nie musi i zdecydowanie nie jest jedynym czynnikiem decydującym o tym, czy ktoś się na informatykę nadaje, czy też nie. Powiedzmy jednak, że istnieje jakiś zestaw zdolności ścisłych, które są idealnie skorelowane z tym, czy ktoś nadaje się na studia informatyczne, czy nie. Tych czynników zapewne jest sporo, a więc dystrybuanta dla indeksu mierzącego je zbiorczo powinien kształtem przypominać gaussowską krzywą dzwonową. Dla ułatwienia przyjmijmy, że rozkład tego indeksu ma odchylenie standardowe równe piętnaście (dla mężczyzn), a żeby dostać się na informatykę, należy mieć co najmniej 124 punkty zmierzonych tym hipotetycznym indeksem (tj. 1.6SD powyżej średniej całej populacji). Jak duża musiałaby być różnica w indeksie między kobietami a mężczyznami, by kobiet było 14%? Odpowiedź: pełne dwanaście punktów przy SD=15 dla mężczyzn i SD=14 dla kobiet, oraz dla liczności grupy mężczyzn 51%. Dla równych SD, różnica dla takiego hipotetycznego indeksu musiałaby wynosić 15 punktów. To znaczy, odpowiednio, 0.8 SD w przypadku drugim i 1 SD w przypadku drugim. Przy nieco bardziej realistycznym progu (powiedzmy 120) już różnica musiałaby wynosić dwadzieścia jeden punktów (1.33SD). Przy progu 115: pełne trzydzieści pięć punktów tj ponad 2SD. Czy znamy chociaż jeden przypadek, w których różnice męsko-damskie w psychologii byłyby aż tak duże?
Praktycznie rzecz biorąc, nie. To znaczy, dla wizualizacji przestrzennej różnice są bardzo duże i sięgają od 0.13 do mniej więcej 0.6SD, z zaledwie jednym studium postulującym różnice w granicy 1SD. Tylko dla tych testów odnaleziono aż tak duże różnice między kobietami a mężczyznami. Tyle, że nie rozumiem, dlaczego umiejętność wizualizacji trójwymiarowych obiektów albo umiejętność ich obracania w wyobraźni miałaby się aż tak bardzo przydawać w informatyce.
Dodatkowo, trudno by było sobie wyobrazić zdolności pomocne w informatyce, a które zarazem by nie pomagały w innych wymagających naukach, takich jak na przykład ekonomia (62% kobiet). Czyli musielibyśmy jakąś zdolność, dla której różnice są ekstremalnie duże (rzędu największych odkrywanych w literaturze), które zarazem pomagają w informatyce, a nie pomagają w dziedzinie też opartej o matematykę, którą jest ekonomia.
Spróbujmy pójść inną stroną: niech różnica wynosi tylko 4 punkty, różnica w SD wynosi 1 punkt. Jak wysoki musiałby być próg naszego hipotetycznego indeksu, by przy takich wartościach wśród kandydatów powyżej progu było tylko, powiedzmy 15%? Odpowiedź: 148 punkty: ponad pełne TRZY odchylenia standardowe, czyli zaledwie trzech chłopców na tysiąc nadawałoby się na informatykę. Kompletnie nierealne. Naprawdę ktoś wierzy, że na tysiąc mężczyzn zaledwie trzech byłoby wystarczająco zdolnych, by mieć szansę dostać się na informatykę?
Wydaje mi się, że pewne niewielkie (średnie!) różnice w zdolnościach matematycznych/ścisłych między kobietami a mężczyznami istnieją (na korzyść mężczyzn). Wydaje mi się także, że mężczyźni istotnie są bardziej zmienni (w sensie większego standardowego odchylenia dla populacji) niż kobiety. Różnice te jednak są na tyle małe, że nie mogą tłumaczyć dysproporcji widzianych w liczbie studentów informatyki. To znaczy, wydaje mi się, że jeżeli faktycznie stworzylibyśmy ten nasz hipotetyczny indeks mierzący zdolności pomocne w informatyce, to faktycznie chłopcy byliby minimalnie lepsi (w sensie, że np. 10% chłopców by się nadawało na studia informatyczne, a dziewczynek powiedzmy 9%). Takie minimalne różnice miałyby wciąż gigantyczne znaczenia na poziomie wyższego poziomu zdolności: tzn, dla progu o wartości 145 punktów naszego hipotetycznego indeksu, przyjmując różnice w średniej wartości indeksu równą jednemu punktowi (na korzyść chłopców) i dalszy jeden punkt różnicy w standardowym odchyleniu, mielibyśmy 70% chłopców, czyli w grupie tych najlepszych: profesorów, genialnych programistów itd mielibyśmy trzydzieści genialnych programistek na siedemdziesięciu genialnych programistów. Ba! Przyjmując brak różnic w średnich zdolnościach, a jedynie większe odchylenie standardowe dla grupy chłopców, wciąż w grupie “geniuszy” (powyżej 145 naszego hipotetycznego indeksu) mielibyśmy 67% przedstawicieli brzydszej płci.
Podsumowując: aby różnice w zdolnościach mogły wyjaśniać dysproporcję w ilości studentek/studentów informatyki, musielibyśmy przyjąć nierealnie wielkie wartości tych różnic. Wartości realistyczne, które można, z pewnymi zastrzeżeniami i wahaniami, przyjąć na podstawie kwerendy literaturowej mogłyby wyjaśniać, dlaczego wśród elity elit (no wiecie, takich typu jeden z tysiąca) byłoby zauważalnie więcej mężczyzn, ale nie mogą wyjaśnić tak wielkich różnic w liczbie studentów/studentek informatyki.
No dobrze, skoro ani seksizm, ani zdolności nie wyjaśniają dlaczego jest tak mało kobiet-informatyków, to co wyjaśnia? Spróbuję to rozważyć w następnych wpisach z tej serii: rozważę w nich dwa konkurencyjne wyjaśnienia: najpierw, zagrożenie stereotypem i brak ról do naśladowania; a potem, różnice w zainteresowaniach.
Na koniec, wyjaśnienie dla opornych: statystyk opisujących grupy nie można stosować do opisu jednostek. To znaczy, że jeżeli napisałbym, że średnio chłopcy są nieco lepsi w składaniu klocków lego, to oczywiście nie oznacza, że każdy chłopiec jest lepszy od każdej dziewczynki. W szczególności, gdybyśmy urządzili mistrzostwa w składaniu klocków lego, i powiedziałbym jw (że chłopcy średnio są nieco lepsi), to tylko ktoś o wyjątkowo złej woli (typu tych, co oskarżyli Jamesa Damore o seksizm) mógłby napisać, że obrażam dziewczynki w grupie finalistów mistrzostw.
Przechodząc zaś do konkretów, to oczywiście zarówno mężczyźni, jak i kobiety-informatycy są nietypowi. Owszem, uważam, że średnio mężczyźni mogą mieć nieco wyższy poziom zdolności kwalifikujących do bycia informatykiem. Oznacza to tyle, że w grupie mężczyzn znajdzie się więcej osobników nietypowych nadających się na informatyka, niż w grupie kobiet. Każda kobieta-informatyk już niejako z samej definicji znajduje się w grupie “tych nietypowych”, więc stwierdzenie to jej nie dotyczy; tak samo, jak z twierdzenia, że mężczyźni są średnio wyżsi (i to sporo!) od kobiet nie wynika, że każda kobieta jest niższa. Co więcej, nie oznacza to, że mówiąc “średnio faceci są wyżsi” obrażam super-wysokie modelki albo koszykarki (te, co grają w koszykówkę, a nie te, co wyplatają koszyki).
Ja wiem, że dla większości powyższe tłumaczenia wydają się oczywiste i być może niektórzy myślą, że są one zbędne. Tyle, że naprawdę są osoby, które tego nie rozumieją, w tym osoby z wyższym wykształceniem. W aferze z Jamesem Damorem wielu przecież oskarżało Damore’a, że ten obraża koleżanki informatyczki, że nie nadają się do informatyki. W innym przykładzie pewna bardzo inteligentna feministka (z doktoratem) na twitterze wrzuciła zdjęcia ultrawysokiej modelki jako przykład mający ilustrować, ze stereotypy o tym, że kobiety są średnio niższe, są fałszywe. Sam zresztą wielokrotnie takie osoby spotykam wielokrotnie w czasie dyskusji na sieci.