Semantic Scholar

Semantic Scholar je vyhledávač akademických publikací na bázi umělé inteligence vyvinutý v Allen Institute for AI, který byl uvolněn k veřejnému použití v listopadu 2015.[1] Používá pokroky ve zpracování přirozeného jazyka k poskytování shrnutí obsahu (summaries) výukových odborných článků.[2] Tým provozující Semantic Scholar aktivně zkoumá použití umělé inteligence pro zpracování přirozeného jazyka, strojové učení, interakci mezi člověkem a počítačem a získávání informací.[3]

Semantic Scholar začal jako databáze obsahující témata z matematické informatiky, geověd a neurovědy.[4] V roce 2017 byla do systému zahrnuta biomedicínská literatura.[4] Od listopadu 2021 jsou zahrnuty publikace ze všech oblastí vědy.

TechnologieEditovat

Semantic Scholar poskytuje jednovětné shrnutí obsahu vědeckých publikací. Jedním z cílů bylo vyřešit problémy se čtením početných titulů a zdlouhavých abstraktů na mobilních zařízeních.[5] Také se snaží zajistit, aby se tři milióny vědeckých odborných článků publikovaných ročně dostaly ke svým čtenářům, protože se odhaduje, že jen polovina publikovaných článků je někým přečtena.[6]

K postižení podstaty článku se používá umělá inteligence, která využívá „abstraktivní“ techniku.[2] Projekt využívá kombinace strojového učení, zpracování přirozeného jazyka a strojového vidění k přidání vrstvy sémantické analýzy k tradičním metodám citační analýzy a k získání relevantních obrázků, tabulek, entit a informací o místech z odborných článků.[7][8]

Na rozdíl od Google Scholar a PubMed je Semantic Scholar navržen tak, aby zdůraznil nejdůležitější a nejvlivnější prvky článku.[9] Technologie umělé inteligence je navržena tak, aby identifikovala skrytá spojení a vazby mezi výzkumnými tématy.[10] Stejně jako dříve citované vyhledávače využívá Semantic Scholar také grafové struktury, mimo jiné Microsoft Academic Knowledge Graph, Springer Nature's SciGraph a Semantic Scholar Corpus.[11]

Každému článku je v Semantic Scholar přiřazen jednoznačný identifikátor nazývaný Semantic Scholar Corpus ID (zkráceně S2CID), jak ukazuje následující příklad:

LIU, Ying; GAYLE, Albert A; WILDER-SMITH, Annelies; ROCKLÖV, Joacim, 2020. The reproductive number of COVID-19 is higher compared to SARS coronavirus. Journal of Travel Medicine. Březen 2020, roč. 27, čís. 2. DOI 10.1093/jtm/taaa021. PMID 32052846. S2CID 211099356. 

Semantic Scholar je volně použitelný a na rozdíl od podobných vyhledávacích strojů (tj. Google Scholar) nevyhledává materiály, které jsou za paywally.[4][12]

Jedna studie porovnávala vyhledávací schopnosti Semantic Scholar s použitím systematického přístupu, a zjistila, že vyhledávač je při odhalování dat přesný z 98.88%.[12] Stejná studie zkoumala další funkce, které Semantic Scholar poskytuje, včetně nástroje na průzkum metadat a několika citačních nástrojů.[12]

Počet uživatelů a publikacíEditovat

Od ledna 2018, po projektu z roku 2017, který přidal biomedicínské odborné články a shrnutí tématu, Semantic Scholar Corpus obsahoval více než 40 miliónů odborných článků z Matematická informatika a Biomedicína.[13] V Březen 2018, Doug Raymond, kdo vyvinut Strojové učení initiatives pro Amazon Alexa platforma, byl hired které mají vést Semantic Scholar promítat se.[14] K srpnu 2019, počet zahrnutých odborných článků měl grown na více než 173 miliónů[15] po sčítání of Microsoft Academic záznamů.[16] V roce 2020 partnerství mezi Semantic Scholar a University of Chicago Press zpřístupnilo v Semantic Scholar Corpus všechny články publikované vydavatelstvím University of Chicago Press.[17] Na konci roku 2020 bylo v Semantic Scholar indexováno 190 miliónů odborných článků.[18]

Počet uživatelů vyhledávače Semantic Scholar dosáhl v roce 2020 sedmi miliónů měsíčně.[5]

OdkazyEditovat

ReferenceEditovat

V tomto článku byl použit překlad textu z článku Semantic Scholar na anglické Wikipedii.

  1. EUNJUNG CHA, Ariana. Paul Allen's AI research group unveils program that aims to shake up how we search scientific knowledge. Give it a try.. The Washington Post. 2015-11-03. Dostupné v archivu pořízeném z originálu dne 2019-11-06. 
  2. a b HAO, Karen. An AI helps you summarize the latest in AI [online]. MIT Technology Review, 2020-11-18 [cit. 2021-02-16]. Dostupné online. (anglicky) 
  3. Semantic Scholar Research [online]. research.semanticscholar.org [cit. 2021-11-22]. Dostupné online. 
  4. a b c FRICKE, Suzanne. Semantic Scholar. Journal of the Medical Library Association. 2018-01-12, roč. 106, čís. 1, s. 145–147. Dostupné online. ISSN 1558-9439. DOI 10.5195/jmla.2018.280. S2CID 45802944. (anglicky) 
  5. a b GRAD, Peter. AI tool summarizes lengthy papers in a sentence. techxplore.com. 2020-11-24. Dostupné online [cit. 2021-02-16]. (anglicky) 
  6. Allen Institute's Semantic Scholar now searches across 175 million academic papers [online]. VentureBeat, 2019-10-23 [cit. 2021-02-16]. Dostupné online. (anglicky) 
  7. BOHANNON, John. A computer program just ranked the most influential brain scientists of the modern era. Science. 2016-11-11. Dostupné v archivu pořízeném z originálu dne 2020-04-29. DOI 10.1126/science.aal0371. 
  8. CLARK, Christopher; DIVVALA, Santosh, 2016. PDFFigures 2.0: Mining figures from research papers. In: Proceedings of the 16th ACM/IEEE-CS Joint Conference on Digital Libraries. [s.l.]: [s.n.]. ISBN 978-1-4503-4229-2.
  9. Semantic Scholar [online]. International Journal of Language and Literary Studies [cit. 2021-11-09]. Dostupné online. 
  10. BAYKOUCHEVA, Svetla, 2021. Driving Science Information Discovery in the Digital Age. [s.l.]: Chandos Publishing. ISBN 978-0-12-823724-3. S. 91. (anglicky) 
  11. JOSE, Joemon M.; YILMAZ, Emine; MAGALHÃES, João; CASTELLS, Pablo; FERRO, Nicola; SILVA, Mário J.; MARTINS, Flávio, 2020. Advances in Information Retrieval: 42nd European Conference on IR Research, ECIR 2020, Lisbon, Portugal, April 14–17, 2020, Proceedings, Part I. Cham, Switzerland: Springer Nature. ISBN 978-3-030-45438-8. S. 254. (anglicky) 
  12. a b c HANNOUSSE, Abdelhakim. Searching relevant papers for software engineering secondary studies: Semantic Scholar coverage and identification role. IET Software. 2021, roč. 15, čís. 1, s. 126–146. Dostupné online. ISSN 1751-8814. DOI 10.1049/sfw2.12011. S2CID 234053002. (anglicky) 
  13. AI2 scales up Semantic Scholar search engine to encompass biomedical research. www.geekwire.com. 2017-10-17. Dostupné v archivu pořízeném z originálu dne 2018-01-19. (anglicky) 
  14. Tech Moves: Allen Instititue Hires Amazon Alexa Machine Learning Leader; Microsoft Chairman Takes on New Investor Role; and More [online]. GeekWire, 2018-05-02 [cit. 2018-05-09]. Dostupné v archivu pořízeném z originálu dne 2018-05-10. 
  15. Semantic Scholat [online]. Semantic Scholar [cit. 2019-08-11]. Dostupné v archivu pořízeném z originálu dne 2019-08-11. 
  16. AI2 joins forces with Microsoft Research to upgrade search tools for scientific studies [online]. GeekWire, 2018-12-05 [cit. 2019-08-25]. Dostupné v archivu pořízeném z originálu dne 2019-08-25. 
  17. The University of Chicago Press joins more than 500 publishers working with Semantic Scholar to improve search and discoverability [online]. RCNi Company Limited [cit. 2021-11-22]. Dostupné online. (anglicky) 
  18. DUNN, Adriana. Semantic Scholar Adds 25 Million Scientific Papers in 2020 Through New Publisher Partnerships. allenai.org. 2020-12-14. Dostupné online [cit. 2021-11-22]. 

Související článkyEditovat

Externí odkazyEditovat