Приложение для векторизации и интеллектуального анализа документов «fSimilarity»

Название проекта: Приложение для векторизации и интеллектуального анализа документов «fSimilarity»

Краткая аннотация:

В приложении «fSimilarity» реализуется технология создания векторных представлений документов. Используются модели глубокого обучения «word2vec» и «doc2vec».

Основные функции приложения:

  • Загрузка новых документов для анализа.
  • Препроцессинг документов, сохранение результатов в базу данных.
  • Векторизация документов выбранного корпуса с использованием обученной модели Doc2Vec.
  • Вычисление показателей сходства векторов документов из различных корпусов и сохранение их в базу данных.
  • Полный цикл обработки: загрузка документов, их препроцессинг, векторизация и вычисление показателей сходства, сохранение результатов в базу данных.
  • Удаление объектов: документов, моделей, векторов, показателей сходства.
  • Конвертация форматов документов, просмотр параметров моделей и документов.

Ответить

Ваш адрес email не будет опубликован.