среда, 23 декабря 2009 г.

start

Ну чтож, начнем вести блог по теме проекта.
Первые источники:
The Text Mining Handbook - библия) text mining, дает базовое представление о задаче text clustering и методах решения.
Первичной задачей является задача выбора модели для копуса текста или же для отдельных текстов корпуса.
Модели корпуса используются алгоритмами:
FTC и HFTC
STC
Разработанная методика будет использовать векторную модель текста, предложенную в
Text Clustering using Semantics
В качестве синтаксического анализатора может использоваться:
Cognitive Dwarf

Комментариев нет:

Отправить комментарий