Poszukiwanie wiedzy naukowej w internecie: subiektywny poradnik

Poradnik dla osób studiujących (i nie tylko!)

Kamil Kopacewicz https://revan-tech.github.io/kontakt.html
10-15-2022

Cześć! Jesteście na Sortowni Wiedzy i jakkolwiek tu trafiliście, mogę założyć, że jesteście zainteresowani znalezieniem jakiegoś przydatnego kawałka wiedzy, informacji, naukowej treści. Zaczynacie przygodę z badaniami, ale nie jesteście pewni gdzie zacząć? Wyszukiwanie informacji może być przytłaczające, dlatego postanowiliśmy stworzyć krótki poradnik, który zaproponuje pewne podejście do przeszukiwania zbiorów. Pojawią się też powiązane kwestie, czyli budowanie metody, katalogowanie artykułów i ich czytanie. Nie ma jednego sposobu na szukanie wiedzy, więc nie traktujcie tego tekstu autorytatywnie. Pokażę tu jedynie sposób, który dość dobrze się sprawdza.

“student looking for scientific data” - DALL-E

Przed wyruszeniem na poszukiwanie wiedzy, zbuduj sobie metodę

Może to zabrzmi zniechęcająco, ale to naprawdę ważne. I zasadniczo sprowadza się do zadania sobie pytania: “Czego szukam i po co tego szukam?”. Zanim wpiszemy hasło w Google Scholar, zbudujmy sobie w głowie szkielet metody - nawet jeśli interesuje nas tylko pobieżne sprawdzenie losowego pomysłu, który oświecił nas o trzeciej w nocy. Wytyczenie kluczowych elementów i granic tematu pozwoli trafić na lepsze wyniki. Innymi słowy:

Nie ma żadnej konieczności trzymania się tych zasad! Nie przyjedzie do Was policja naukowa na sygnale, gdy po prostu wpiszemy w wyszukiwarkę pierwsze hasło, które przyjdzie nam do głowy. Te zasady mogą się jednak przydać w momencie, gdy poczujemy zagubienie lub przytłoczenie nadmiarem treści. Inna sprawa, że czasem faktycznie lepiej jest po prostu płynąć i dać się zaskoczyć znalezionymi materiałami.

“Using google scholar” - DALL-E

Najprostsze wyszukiwanie

W większości przypadków, całkowicie wystarczające będzie otworzenie Google Scholar i wpisanie tam kilku haseł. Można ustawić wyszukiwanie na wyłącznie język polski (lub dowolny inny). Poradniki dotyczące zaawansowanego wyszukiwania w Scholarze znajdują się w Bazie Wiedzy - m.in. wykluczanie haseł, szukanie po synonimach. Wiele artykułów uda się ściągnąć już z poziomu Google Scholar - jeśli są w otwartym dostępie. W zależności od dziedziny, Twoje pole naukowe może mieć inne domyślne repozytorium danych - w przypadku medycyny będzie to np. PubMed. Jeśli temat jest dla nas zupełnie nowy - czasem warto najpierw rozeznać się, poprzez czytanie wpisów na Wikipedii lub artykułów popularnonaukowych. Z tą wiedzą można ruszać dalej, na dokładniejsze poszukiwania. Często podkasty i kanały na Youtubie są świetnym wprowadzeniem w temat. Można też zacząć od naszej Bazy Wiedzy w Sortowni Wiedzy, gdzie na szczycie listy zebraliśmy najważniejsze repozytoria artykułów naukowych. Cennym źródłem jest WordCat, strona zawierająca dane bibliograficzne książek, a także pobliskie biblioteki, w których daną książkę można znaleźć. A jeśli szukamy wyłącznie książek - to trzeba zajrzeć na Google Books. Serwis ten wyświetla fragmenty książek, czasami to wystarczy, by zorientować się, czy książka jest nam potrzebna.

“Using Scihub” - DALL-E

Dostęp do artykułów i szara strefa, którą każdy zna - ale o której nie wypada mówić

Wiemy już, że istnieje jakiś artykuł w interesującym nas temacie, ale nie jest w otwartym dostępie i nie możemy go tak po prostu otworzyć. Może wystarczy nam abstrakt i nie musimy zdobywać całego pliku? Jeśli jednak przeczytanie artykułu jest konieczne, możemy zrobić kilka rzeczy.

  1. Zaskakująco często wystarczy przekopiować nazwę artykułu do zwykłej wyszukiwarki Google - autorzy często wrzucają swoje artykuły na ResearchGate lub Academię.
  2. Może mamy dostęp instytucjonalny? Jeśli przynależymy do uniwersytetu, możemy mieć dostęp do wielu płatnych baz, na które nasz uniwersytet wykupił subskrypcję.
  3. Czasami można poprosić autora o podesłanie artykułu. Niektórzy autorzy chętnie wysyłają swoje prace, wystarczy wysłać wiadomość.
  4. Wchodzimy na Libgena lub SciHuba. To wymaga krótkiego omówienia:

Ekosystem publikowania prac naukowych jest, delikatnie mówiąc, nieidealny. Autorzy nie dostają wynagrodzenia za swoją pracę, tak samo recenzenci. Wydawnictwa pobierają jednak absurdalnie wysokie kwoty za pojedyncze artykuły (€20, €40 za jeden artykuł po jakimś czasie przestaje dziwić). Autorzy często muszą dopłacać za publikację od kilkuset, do kilku tysięcy Euro - jeśli chcą, by ich praca była w otwartym dostępie. Taki gatekeeping rzekomo gwarantuje wysoki poziom artykułów w prestiżowych pismach, faktycznie tworzy jednak barierę wolnego przepływu wiedzy i odcina od niej większość ludzi, w szczególności z mniej zamożnych krajów (co zresztą dalej pogłębia różnice pomiędzy Zachodem i resztą świata).

Stąd powstanie pirackich serwisów, które - w zależności od wybranego spojrzenia - uwalniają wiedzę lub ją zawłaszczają.

Niezależnie od wybranego moralnego punktu widzenia, serwisy takie jak Libgen i SciHub udostępniają nieprzebrane ilości książek i artykułów za darmo. Przed skorzystaniem z Libgena warto zainstalować Adblocka w swojej przeglądarce, by nie zostać zbombardowanym(ą) reklamami. Libgen ma wiele adresów, które z czasem mogą się zmieniać - adres można łatwo znaleźć przez Google.

Poniżej zamieszczam niezwykle przydatny poradnik korzystania ze wspomnianych stron (w języku angielskim):

https://docs.google.com/document/d/1ZwWs8JOrlkrrqiHwkQSwc4_NM85Zbzc9t9ifQ1rHZgM/edit Poradnik wspomina szereg innych stron i wyjaśnia jak z nich korzystać.

W samym Libgenie można zaznaczyć wyszukiwanie książek naukowych, beletrystyki, artykułów naukowych (SciHub), a nawet komiksów. Wyszukiwać można po autorach, tytule, roku, języku etc. Jeśli wybierzemy jakąś książkę - klikamy tytuł, najlepiej wybrać this mirror, następnie GET lub któryś z czterech mirrorów. Mirrory zapasowe czasem działają szybciej niż główny mirror.

Ewentualna wada Libgena? Mało jest tam materiałów w języku polskim. Na szczęście polskie artykuły naukowe zazwyczaj są w otwartym dostępie. Gorzej z polskimi książkami naukowymi - te jednak zazwyczaj wcale nie są bardzo drogie - wydanie ok. 30/40zł na książkę jest zawsze warte rozważenia. Nie zaszkodzi zajrzeć też na Docer i Chomikuj - ale tu uwaga - materiały na tych stronach zdecydowanie będą łamać prawa majątkowe danych dzieł. Jest to tym bardziej wątpliwe moralnie, że takie publikacje znajdziemy w bibliotekach publicznych. Dodatkowo, na Chomikuj łatwo przez przypadek ściągnąć potencjalnie niebezpieczny plik (szczególnie jeśli ma dziwną wielkość i końcówkę .exe). Co więcej, wersje chomikowe są zwykle kiepskiej jakości skanami. Lepiej odwiedzić lokalną bibliotekę lub Ibuk Libra - jeśli mamy dostęp.

Żeby było jasne - nie popieramy łamania praw autorskich i majątkowych. Kupujcie artykuły i książki, jeśli Was na to stać, niezależnie od tego czy cyfrowe, czy papierowe. Jednocześnie, wierzymy w otwarty i egalitarny dostęp do nauki i sprawiedliwe wynagrodzenia dla autorów dzieł. Obecny system obiegu wiedzy zawiera w sobie strukturalne patologie, które podważają zasadność podejścia moralnego i niejako wymuszają pragmatyczne “radzenie sobie” z zastaną sytuacją.

Jedną z nowych stron, która ułatwia szukanie, jest Anna’s Archive. Jest to wyszukiwarka wyszukiwarek, przeszukująca wszystkie wersje Libgena i Z-library, czyli tzw. shadow libraries, “biblioteki cieni”.

Przykład ograniczonego dostępu do wiedzy. Od czasu, gdy ten obrazek stał się memem, artykuł trafił jednak do otwartego dostępu.

Dalej nie mogę znaleźć tego, czego chcę: dwie klątwy

Ogólnie, przy wyszukiwaniu wiedzy mogą dotknąć nas dwie klątwy: nadmiar wyników i niedobór wyników.

W przypadku nadmiaru, najlepiej będzie wrócić do punktu startowego, czyli precyzyjniej określić sobie metodę wyszukiwania. Przy zbyt dużej ilości artykułów i książek spróbujmy określić, które są najbardziej znaczące dla naszego tematu.

W przypadku niedoboru można eksperymentować z doprecyzowanymi hasłami wyszukiwania, szukać po konkretnych autorach, wydawnictwach, lub po czasopismach. Jeśli udało nam się znaleźć jeden pasujący artykuł - to zaglądamy do bibliografii i kłączowo szukamy kolejnych prac tam wymienionych. Trzeba wykazać się kreatywnością w sprawdzaniu źródeł. Poniekąd dlatego zbieramy różne linki, bazy, agregatory w naszej Bazie Wiedzy. Warto tam zajrzeć! Zgromadziliśmy sporo mało znanych i niszowych stron. Każda dziedzina będzie miała inne źródła, inne kluczowe strony. Jeśli znacie przydatne linki, których nie ma w Bazie - zgłaszajcie nam w formularzu! Będziemy dodawać i powiększać zbiór.

Ostatnio pojawiają się też strony takie jak ResearchRabbit, które w bardzo wizualny sposób przedstawiają połączone tematycznie artykuły. Większość takich projektów korzysta w coraz większym stopniu z uczenia maszynowego i podpowiada pokrewne treści w dość sprytny sposób. Nie zapominajmy jednak, że wciąż najlepszym sposobem na znalezienie przydatnych treści jest zapytanie o poradę żywej osoby! Znajomi, wykładowcy i promotorzy zawsze chętnie podpowiedzą czego szukać. Pomóc może też zadanie pytania w odpowiednich grupkach akademickich na Facebooku lub Reddicie.

“In Search of Lost Time” - DALL-E

Weryfikacja treści

Zdobyliśmy artykuły! Nie cieszmy się jednak za wcześnie, zawsze trzeba zachowywać zdrowy rozsądek przy czytaniu. Artykuł opublikowany w Nature nie jest równy studenckiej notce udostępnionej na Academii. Trzeba uważać na Predatory Journals, które publikują praktycznie wszystko, o ile autor zapłaci. Trzeba uważać na jakość metod w badaniach, wielkość prób itd. Nie znaczy to, że wiedza z “prowincjonalnego” czasopisma jest bezwartościowa - ja osobiście uważam, że ze wszystkiego da się wyciągnąć jakieś przydatne informacje. Trzeba jednak krytycznie patrzeć na wszystko co czytamy. Nawet najbardziej prestiżowym pismom zdarzają się wpadki.

Kluczowe może być rozeznanie się, którzy autorzy są szczególnie istotni i wiarygodni w danej dziedzinie. Niektóre pisma są ważniejsze od innych - np. jedne służą jako platformy żywej dyskusji akademickiej i mają charakter opiniotwórczy, inne - służą publikacjom dla samego faktu publikacji. Wszystko zależy od dziedziny. Niezwykle istotna jest też data publikacji - stare badania mogą być już nieaktualne. Z drugiej strony, nauka ulega modom, więc w starszych pracach można często trafić na cenne inspiracje, zapomniane przez obecnie panujący mainstream dziedziny.

Nasze spojrzenie na wyniki badań i znaczenie publikacji może też zależeć od odpowiedzi, których od nich oczekujemy! Przykładowo:

“The pile of shame” - DALL-E

Kupka wstydu

Na koniec być może największy problem. Naściągaliśmy mnóstwo plików i leży to wszystko latami, nigdy nie otworzone i nieprzeczytane. Wiedza musi żyć, musi być w umyśle, żeby funkcjonować. Zamknięta na dysku będzie mało przydatna. Sam nie wiem do końca jak rozwiązać ten problem, wciąż testuję różne systemy dla siebie. Do głowy przychodzą mi dwa podejścia:

A. Mieć dobrą strukturę folderów i plików, tak by można było szybko i łatwo odnaleźć dany plik. Najgorsze, co można zrobić, to wrzucać pliki do jednego folderu - i to jeszcze ponazywane np. article.pdf, article(1).pdf, 1213598.pdf… Dodatkowo używam programu Everything, który błyskawicznie znajduje pliki na dysku. Czasami wystarczy, że pamiętam fragment nazwy pliku - mogę szybko odnaleźć to, czego potrzebowałem. Najważniejsze artykuły i książki warto katalogować w menedżerze bibliografii (np. Zotero), by można było szybko cytować istotne prace.

B. Mieć dobry system czytania. Czytanie artykułów naukowych jest ciężkie. Czasami “przedzieranie się” jest bardziej odpowiednim słowem. Są różne sposoby czytania artykułów naukowych. Wcale nie trzeba ich czytać od początku do końca! Dobrym sposobem jest:

  1. przeczytanie abstraktu i wstępu,
  2. przeczytanie zakończenia,
  3. przeczytanie środkowej części artykułu,
  4. powtórzenie zakończenia, dla lepszego utrwalenia informacji.

Sposób czytania w dużej mierze zależy od tego, co chcemy wyciągnąć z artykułów i do czego dalej użyjemy tej wiedzy. Czasem wystarczy pobieżne przejrzenie, czasem konieczne jest całkowite zanurzenie się w danej strukturze wiedzy.

Zawsze warto jest robić notatki i zaznaczenia - wewnątrz pliku, w zewnętrznym pliku, czy na papierze. Jeśli coś jest gwarantowane, to to, że za kilka miesięcy nie będziemy pamiętać z czytania prawie nic. Notatki wtedy będą ratującymi skórę bodźcami, które przypomną nam o czym czytaliśmy. Trzeba się też rozeznać, kiedy ma się komfortowy czas na czytanie trudnych treści. Dla niektórych jest to poranek, dla innych późny wieczór (to ja). Nie ma co się zmuszać do czytania, jeśli nie mamy koncentracji i ewidentnie czytanie nie idzie. Często jednak warto lekko przymusić się i spróbować - po pierwszych 5 minutach może okazać się, że dalej już “jakoś poszło”. Bardzo rzadko będziemy mieli taki cudowny stan, w którym czytanie jest lekkie i sprawia radość. Przed czytaniem warto zrobić lekki wysiłek fizyczny - czasami pomaga na koncentrację.

“student looking for scientific data” - DALL-E

To tyle, kilka pomysłów na poszukiwania. Podkreślam - jest to subiektywna lista. Każdy wypracuje sobie własny najlepszy sposób. Poszukiwanie wiedzy to żywy proces, który za każdym razem się zmienia i ewoluuje. Pojawiają się nowe źródła, algorytmy zmieniają swoje działanie, my zmieniamy zainteresowania i uczymy się lepiej organizować wiedzę. Sam powód poszukiwań ma znaczenie dla ich wyglądu - raz lepiej jest robić to systematycznie, innym razem lepiej jest dać się porwać króliczej norze i popłynąć, razem z wyszukiwarkami i bazami danych.

Na pewno warto eksperymentować, testować różne sposoby. Któryś w końcu zadziała.