|
С развитието на информационните
технологии и Интернет, обработката на големи обеми текстова
информация стана нещо обичайно. Все повече фирми и организации
съхраняват документите си и в електронен вид, което налага
обработката на големи обеми текстови данни. При нея възникват
доста проблеми, като на първо място обикновено е сложността
на търсене по такива данни.
Производителите на софтуер за съхранение и обработка на текстова
информация предлагат различни решения и едно от тях са системите
за пълнотекстово търсене. С тяхна помощ, ефективността на
търсене в текст се подобрява многократно и потребителят получава
по добри възможности за използване на наличната информация.
Наличието на системи за пълнотекстово търсене обаче не разрешава
всички проблеми - поддръжката на търсене на думи на български
език обикновено се свежда до търсене по пълно съвпадение или
търсене по префикс от дадена дума.
Словник Сървър
е високотехнологичен софтуерен продукт предоставящ възможност
за търсене по граматически форми на думите в българския език
(т.нар. морфологично търсене). Това означава, че при търсене
на дума в даден набор от текстови документи, в резултата попадат
не само тези, които съдържат търсената дума, но и тези съдържащи
коя да е от нейните граматически форми.
Словник Сървър
се интегрира със сървърните продукти на Microsoft® Corporation:
Microsoft® SQL Server 2000, Indexing Service, Microsoft® SharePoint
Portal Server, Microsoft® Exchange 2000 Server, Microsoft
Small Business Server 2000 и разширява техните възможности
за пълнотекстово търсене, добавяйки възможност за морфологично
търсене на български език.
Словник Сървър
е изграден на базата на най-новите софтуерни технологии и
притежава интелигентна система за морфологично търсене, даваща
възможност търсенето в големи обеми текст да става максимално
ефективно. Със своя речник от над 110 000 български думи и
повече от 2 000 000 техни форми, покриващи над 99% от употребяваните
думи в българския език, Словник Сървър предоставя уникални
възможности за изграждане на сложни софтуерни решения и за
подобряване на възможностите на вече изградени такива.
Пояснение:
При морфологичното търсене се извършва търсене по всички форми
на думата. Ако стартираме морфологично търсене на думата "бял",
това означава, че ще се извърши и търсене за срещанията на
всичките й форми, т.е. думите "бял", "бяла", "бялата", "бяло",
"бялото", "белия", "белият", "бели", "белите".
Очевидно е, че в този случай
префиксното търсене не е подходящо, защото коренът на думата
се променя в някои от формите й, т.е. ако стартираме търсене
от вида бял*, бихме пропуснали някои от срещанията на нейните
форми.
Префиксното търсене има и
недостатъка, че може да върне като резултат срещания на други
думи, които имат същия префикс. Например, ако искаме да търсим
срещанията на думата "кон" в дадени текстове, заявка от типа
"кон*" би върнала като резултат и срещания на думи, като "конюнктура",
"конспирация", "конституция" и т.н.
Защита на личните данни
|