Wydobywanie danych z bibliografii
Niekiedy zmuszeni jesteśmy do "wyciągnięcia" danych bibliograficznych z tekstów. W przypadku pojedynczych pozycji najłatwiej przepisać dane ręcznie.
W przypadku dużych bibliografii (np. z naszej dawnej pracy dyplomowej) ręczne przepisywanie jest nieefektywne. Wówczas warto zastosować narzędzia automatyczne zwane parserami bibliografii.
Techniki informatyczne, wykorzystujące niekiedy narzędzia sztucznej inteligencji, pozwalają na zaawansowaną analizę składni (parsing). Wyspecjalizowany program - (z ang.) parser - potrafi przeanalizować składnię wpisów bibiograficznych. Dzięki temu możliwe jest wydobycie metadanych z klasycznych bibliografii załącznikowych.
Anytstyle — bardzo dobre darmowe narzędzie
Polecany parser bibliograficzny: https://anystyle.io/
Powyższa aplikacja potrafi sprawnie odtworzyć metadane z bibliografii z wykorzystaniem technik uczenia maszynowego. Daje też możliwość przejrzenia wyników i poprawy ich. Po zakończeniu weryfikacji metadane można zapisać w jednym z popularnych formatów (np. BIB). Następnie plik taki można zaimportować do menadżera bibliografii (Zotero, Mendeley, itp.).
Uwaga: wyniki procesu analizy należy zawsze zweryfikować!
Parser używa typowych nazw pól metadanych, poniżej lista najczęściej używanych:
author | nazwiska i imiona/inicjały autora lub autorów |
booktitle | tytuł książki, której rozdział jest cytowany |
chapter | tytuł rozdziału |
edition | numer wydania książki (np, "Second") |
editor | nazwiska i imiona/inicjały redaktora lub redaktorów |
journal | Tytuł czasopisma (z reguły wszystkie człony oprócz spójników piszemy z wielkiej litery, niekiedy używa się typowych skrótów) |
volume/issue | tom lub numer czasopisma, z którego pochodzi cytowany artykuł |
pages | strona/zakres stron (np. 7, 49-52, 57nn) |
publisher | nazwa wydawcy |
series | nazwa serii, w której wydawana jest książka (opcjonalnie) |
title | tytuł cytowanej pracy |
year | rok publikacji |
Więcej o metadanych i nazwach pól w stylu BiBTeX w języku angielskim.