Методы и алгоритмы кластеризации текстов: start

Ну чтож, начнем вести блог по теме проекта.
Первые источники:
The Text Mining Handbook - библия) text mining, дает базовое представление о задаче text clustering и методах решения.
Первичной задачей является задача выбора модели для копуса текста или же для отдельных текстов корпуса.
Модели корпуса используются алгоритмами:
FTC и HFTC
STC
Разработанная методика будет использовать векторную модель текста, предложенную в
Text Clustering using Semantics
В качестве синтаксического анализатора может использоваться:
Cognitive Dwarf

Методы и алгоритмы кластеризации текстов

среда, 23 декабря 2009 г.

start

Комментариев нет:

Отправить комментарий

Обо мне

Архив блога

Постоянные читатели