logo color3

Naszym polem doświadczalnym i największą (0,8 mld dokumentów!) instancją naszej wyszukiwarki semantycznej jest system NEKST, który rozwijamy od 2009 roku.

NEKST to pierwsza w Polsce i największa dotychczas semantyczna wyszukiwarka internetowa, która powstała w ramach Programu Operacyjnego Innowacyjna Gospodarka POIG.01.01.02-14-013/09 pt. „Adaptacyjny system wspomagający rozwiązywanie problemów w oparciu o analizę treści dostępnych źródeł elektronicznych”.


NEKST to skrót od: Narzędzia EKsploracji Semantycznej Tekstów.


Wyszukiwarka Nekst oferuje klasyczną metodę zapytań o dokumenty w postaci ciągu słów, fraz (ujętych w cudzysłowy), słów połączonych operatorami AND, OR, z możliwością budowy złożonych wyrażeń nawiasowych.
Poza zapytaniami o dokumenty istotną funkcjonalnością wyszukiwarki jest zdolność odpowiedzi na zapytania o fakty. Zapytanie takie dotyczy nie tyle dokumentu co frazy o zidentyfikowanej strukturze gramatycznej. Ta struktura gramatyczna to: podmiot - orzeczenie - dopełnienie.  Przy tym podmiot może oznaczać całą klasę (grupę) obiektów (jak mówimy, instancji tej klasy). Na przykład zamiast zadać pytanie „Kto napisał Potop?” możemy zapytać o fakt: [CLASS{pisarz}] [napisał] [potop], w którym podmiotem jest właśnie klasa „pisarz”.


Użytkownik może także zadać pytanie w języku naturalnym. Przykładem dobrze ilustrującym zasadę działania tego modułu może być pytanie „W jakim państwie znajduje się Statua Wolności?”. Jeżeli chcielibyśmy udzielić odpowiedzi jednym zdaniem, ale bez wykorzystania elementów analizy semantycznej, to okaże się, że trudno jest znaleźć takie zdanie, które zwierałoby  słowa  „państwo”, „znajduje się statua wolności” oraz „USA”. Jedyne co można zrobić to znaleźć najlepiej dopasowany dokument i zmusić użytkownika do samodzielnego poszukania  w nim odpowiedzi. Nasze algorytmy będą w stanie rozpoznać, że słowo „USA” odwołuje się do pojęcia „państwo”, dzięki czemu będzie możliwe zaprezentowanie gotowej odpowiedzi w postaci zdania np. „Statua Wolności znajduje się w Nowym Jorku w USA.”.
Podsumowując: Jedną z podstawowych cech wyszukiwarki semantycznej jest zdolność poprawnej ekstrakcji relacji klasa-instancja (obiekt z klasy), relacji zachodzących pomiędzy instancjami oraz wnioskowanie na podstawie takiej wiedzy.


Na oprogramowanie wyszukiwarki składa się: system pająków internetowych pozyskujących dokumenty z sieci; system semantycznego indeksowania dokumentów; system odpowiedzi na zapytania. Każdy z tych systemów to wiele, a w sumie kilkadziesiąt, modułów (np. moduł indeksera, który m.in. zamienia dokumenty na ich specjalną reprezentację; moduł analizatora, który dokonuje wielopoziomowego grupowania dokumentów oraz opisuje pierwotne dokumenty i wygenerowane skupienia dokumentów dodatkowymi atrybutami).